Re: Версия 9.1 для полнотекстовых БД
Пользователь:
ochagova (IP-адрес скрыт)
Дата: 20, January, 2010 11:23
Предполагаемый релиз для 9.1 следующий:
1. В АРМ Администратор и в АРМ Читатель добавлена возможность работы с файлами PDF, а именно: использование в качестве программы пакетной обработки для разбиения файла на страницы – PDFTK.EXE. Т.е. предлагается выбор: использовать программу PDF2PDF.EXE либо PDFTK.EXE. Задается параметрами INI-файла как Администратора, так и Читателя:
PDFSplitter – задает имя программы разбиения на страницы (по умолчанию в АРМе Администратор PDFTK)
PDFTK - задает относительный путь к файлу pdftk.exe (.\Converters\PDFTK\)
2. При установке БД на WEB сервер реализована технология «перенаправления» текстов. Сетевые адреса текстов заменяются на их URL (если возможно определить URL существующих текстов или если тексты были перенесены по некому URL адресу). Для этого в файле irbis_server.ini, который был указан при инсталляции в «Директории WEB-сервера для шлюза», в секции MAIN задать параметры (приведен пример значений параметров):
FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\
FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\
В первом параметре следует указать сетевой путь на тексты, который хранится в поле 952^B, т.е. был сформирован при добавлении текстов в БД. В примере это - \\Alio1\irbiswrk\lusia\PDF_text\.
Во втором параметре следует указать URL текстов (до их названия) их расположения. В примере это - ftp:\\ftp.gpntb.ru\pub\irbis\.
В формате BRIEFHTML_ft.pft имеется вставка, которая замещает в адресе текста (в подполе 952^B) сетевой путь на URL адрес. Используется форматный выход:
&uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)),
3. В АРМе Администратор добавлена возможность использовать таблицу isisacw.tab при извлечении ключевых слов из текста (ранее использовалось умалчиваемое состояние этой таблицы). В таблице задается перечень алфавитных символов при определении ключевого слова. Например, можно добавить к алфавитным символ тире, чтобы не разбивалась конструкция типа GH-456, а включалась как единое ключевое слово в словарь. Для этого десятичный код символа тире, 045, добавляется в перечень:
038 045 064 065 066 067……………