ИРБИС :: Полнотекстовые базы данных в Ирбис :: Не индексирует файлы, защищенные паролем

Ассоциация ЭБНИТ ИРБИС-корпорация Вики-Ирбис Online/CHM справка Ирбис

Полнотекстовые базы данных в Ирбис : ИРБИС Irbis

Irbis

Темы: <<•>>

Навигация: Список тем•Новая тема•Искать•Войти

Не индексирует файлы, защищенные паролем

Пользователь: Muratt (IP-адрес скрыт)

Дата: 23, October, 2013 06:11

Здравствуйте. Проблема такая. Ставим защиту паролем файлы PDF. В ini-файле АРМ Администратора ПТБД выставляем в строках isNeedDecryptPDF=1 PDFPassword=1234. После добавления в базу поля Каталогизатора 20:Число текстов в слове=0, 21:Индекс естественно-тематического классификатора=0. В чем проблема?

Ирбис64 2012.1 D2,3,4,5

Редактировано 1 раз. Последний раз 23.10.2013 06:39 пользователем Muratt.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 25, October, 2013 08:06

Проверяю ситуацию.
Какая у вас версия АРМ Администратор? Было несколько обновлений. Номер версии и дата выпуска написаны на заставке при запуске АРМ Администратор.

Редактировано 3 раз. Последний раз 25.10.2013 12:38 пользователем SokV.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 25, October, 2013 12:49

Было выпущено несколько обновлений, и я проверил, не была ли внесена ошибка во время обновлений.

У меня данная ошибка не воспроизводится. Файл с паролем добавляется, словарь создаётся.

Я обратил внимание на возможное недоразумение. Нужно указывать именно "пароль владельца", не "пароль пользователя".

А в связи с чем связана необходимость добавлять защищённые файлы? Как разработчику интересна логика. Вы их защищаете паролем, чтобы защитить от копирования текста? Или вы получаете уже защищённые файлы?

Почему спрашиваю, дело в том, что есть возможность добавлять PDF-файлы с разбиением на страницы, при этом показываться пользователю эти страницы будут как изображения.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Muratt (IP-адрес скрыт)

Дата: 25, October, 2013 14:09

Здравствуйте. Версия АРМ Администратор 2012.1 от 06.02.2013.

Хотят защитить паролем на открытие документа. Т.е. пользователь видит биб.описание книги и то, что есть электронная версия, но доступна для просмотра только локально.

Я предлагал не выставлять такие книги в веб, но библиографы хотят чтобы и локально и в вебе были записи. Только в вебе без ссылки, локально с ссылкой.

И еще несколько вопросов. 1) В полнотекстовом вебе предусмотрен постраничный просмотр электронных книг? 2) Возможно ли как в обычных БД в поле 951 сделать подполе Просмотр только в ЛВС?

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Muratt (IP-адрес скрыт)

Дата: 26, October, 2013 08:26

Возможно у нас версия старая, хотя с сервера скачивал последнюю версию. В ini-файле АРМ Администратора не было строк: isNeedDecryptPDF=0 PDFPassword=. При добавлении вручную этих строк в секцию MAIN, никакого результата по индексированию защищенных файлов нам не дал.

Не могли бы выслать актуальную рабочую версию на мой электронный адрес.

Заранее спасибо.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 28, October, 2013 12:38

В полнотекстовом вебе предусмотрен постраничный просмотр PDF. Для этого при включении PDF-документов в полнотекстовую базу нужно поставить флажок "Каждая страница PDF-файла как отдельный документ" (для версий до 2012.1 включительно). Начиная с версии 2013.1 PDF-документы всегда добавляются в полнотекстовую базу только с разбиением на страницы. В этом случае объектом полнотекстового поиска является каждая страница, а не документ целиком.

При этом PDF защищённые паролем добавлять в БД с разбиением на страницы нельзя.

Редактировано 1 раз. Последний раз 28.10.2013 12:45 пользователем SokV.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 28, October, 2013 12:53

Насчёт возможности настроить просмотр только в локальной сети лучше ответит Constantin. Я его попросил, он обещал ответить.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 28, October, 2013 12:56

Насчёт использования запароленных PDF-файлов. Вы хотели защитить PDF-файлы паролем, и локальным пользователям сообщить этот пароль? При этом пользователи в интернете не будут знать пароль, и не смогут файл открыть, правильно я понимаю?

Редактировано 1 раз. Последний раз 28.10.2013 13:13 пользователем SokV.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 28, October, 2013 13:12

Обращаться ко мне за обновлением - неправильно, я не занимаюсь распространением обновлений или новых версий.

В любом случае, вам нужно узнать, какая у вас версия.

Если у вас версия 2012.1, то вы можете получить последнее обновление на FTP.

Обратите внимание, что если у вас более ранняя версия (например, 2011.1), то замена .exe файла на версию 2012.1 вам не поможет.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 28, October, 2013 13:30

Важное замечание по поводу работы с PDF-файлами защищёнными паролем. В последней версии - версии 2013.1 сейчас практически отсутствует возможность работы с PDF защищёнными паролем. Это связано со следующими обстоятельствами: 1) защиту от копирования всего документа целиком обеспечивает тот факт, что документ показывается постранично; 2) показ страниц обеспечивается при помощи изображений в формате .jpg, что защищает от копирования текста со страницы; 3) в версии 2013.1 PDF-файлы добавляются в полнотекстовую БД ТОЛЬКО с разбиением на страницы, а в версии 2012.1 была возможность добавления PDF-файлов целиком; возможность работы с защищёнными паролем PDF-файлами была нацелена на защиту PDF-файлов, включаемых в полнотекстовую БД целиком, что не актуально в версии 2013.1.

Если есть какие то дополнительные соображения насчёт использования защищённых PDF, хотелось бы услышать.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Muratt (IP-адрес скрыт)

Дата: 29, October, 2013 05:26

Здравствуйте. Да правильно, на счет доступа к файлам локально и через интернет.

Не могу войти на FTP для получения обновления. До сегодняшнего дня заходил, брал обновления. В чем проблема, подскажите пожалуйста?

Редактировано 1 раз. Последний раз 29.10.2013 05:34 пользователем Muratt.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Gena (IP-адрес скрыт)

Дата: 29, October, 2013 09:51

SokV написал(а):
-------------------------------------------------------
Начиная с версии 2013.1
> PDF-документы всегда добавляются в полнотекстовую
> базу только с разбиением на страницы. В этом
> случае объектом полнотекстового поиска является
> каждая страница, а не документ целиком.

Владимир Владимирович, я так понимаю, что подсистему лингвистического анализа вы решили похоронить? Если я не ошибаюсь, то в этой подсистеме было ограничение на анализ не более 1000 документов. А при условии разбиение файла на страницы, каждая страница формирует отдельный документ, итогом этого можно превысить этот лимит уже 4-5 крупными книгами.

Скажите, нет ли планов продолжить работу над этим модулем? Он, конечно, интересен крайне ограниченному кругу пользователей, но это была бы ну очень серьезная фишка по сравнению со всеми аналогами системы.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 29, October, 2013 16:35

Насчёт доступа к FTP обратитесь, пожалуйста, к Бродовскому А.И. Это его сфера.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: SokV (IP-адрес скрыт)

Дата: 29, October, 2013 17:01

Действительно, направление лингвистического анализа у нас в подвешенном состоянии.

Из-за того, что не было ресурсов его поддерживать, в последних версиях соответствующая функциональность по умолчанию была отключена.

Теперь вернулся Constantin, реализовавший эту функциональность, и соответствующие вопросы справедливо обратить к нему. В версии 2013.1 по умолчанию возвращено формирование тематических словарей.

От себя могу сказать следующее. Ваши рассуждения подразумевают, что если бы не был введён запрет на добавление PDF целиком (без разбиения), то существующее решение осталось бы работоспособным с большими книгами. Но это неверно. Дело в том, что из одного документа в обработку берётся не весь текст, а часть, ограниченная каким то порогом. И этот порог не очень то велик, так что из большого текста отрезается маленький кусочек, его начало. Детали, опять же, лучше знает Константин.

Я так понимаю, что это связано с гипотезой о том, что большой текст нельзя считать целостной единицей, адекватно соответствующей поисковому запросу, в отличие от короткой статьи или страницы текста.

Так что как раз добавление текстов без разбиения изначально рассматривалось как вариант для ограниченного применения, а в целом запутывающее пользователей, тупиковое.

А порог в 1000 документов, возможно, достаточно условный, зависящий от тех предполагаемых результатов, которые хотелось бы получить, и от вычислительных мощностей. Это моё предположение, интересно, что сказал бы Константин.

Редактировано 1 раз. Последний раз 29.10.2013 19:41 пользователем SokV.

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Gena (IP-адрес скрыт)

Дата: 29, October, 2013 20:33

Большое спасибо за комментарий. Уверен, что в этом направлении огромное поле для работ. Правда... врядли мы, пользователи, в полной мере понимаем значение и пользу этого механизма. Но нам он точно понадобится в будущем, когда в библиотеках станет гораздо больше полных текстов

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: vguseva (IP-адрес скрыт)

Дата: 13, November, 2013 08:54

SokV написал(а):
-------------------------------------------------------
> В полнотекстовом вебе предусмотрен постраничный
> просмотр PDF. Для этого при включении
> PDF-документов в полнотекстовую базу нужно
> поставить флажок "Каждая страница PDF-файла как
> отдельный документ" (для версий до 2012.1
> включительно). Начиная с версии 2013.1
> PDF-документы всегда добавляются в полнотекстовую
> базу только с разбиением на страницы. В этом
> случае объектом полнотекстового поиска является
> каждая страница, а не документ целиком.
>
> При этом PDF защищённые паролем добавлять в БД с
> разбиением на страницы нельзя.

Версия Ирбиса 2013.1
Доступен как постраничный просмотр, так и есть возможность скачать файл целиком (вложение)
Как убрать ссылку на полный текст, оставив только постраничный просмотр?

ЦГБ г.Усть-Илимск

Вложения: Ирбис.JPG (177.5KB)

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: bibl (IP-адрес скрыт)

Дата: 13, November, 2013 10:38

Доступен как постраничный просмотр, так и есть возможность скачать файл целиком (вложение)
Как убрать ссылку на полный текст, оставив только постраничный просмотр?
Если это про вывод ссылки в веб-ирбисе,
то одну из сылок можно убрать,
закомментировав ее в файле ed_reference.pft

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: vguseva (IP-адрес скрыт)

Дата: 14, November, 2013 01:53

bibl написал(а):
-------------------------------------------------------
> Если это про вывод ссылки в веб-ирбисе,
> то одну из сылок можно убрать,
> закомментировав ее в файле ed_reference.pft

Данная рекомендация действует в случае, если ссылки указаны в 951 поле.
А что делать если речь идет о порлнотекстовом Ирбисе с новым интерфейсом (картинка была во вложении выше)? Ссылки прописаны в 952 поле, и изменения в файле ed_reference.pft результата не дают, так-же ни к чему не приводит установка значения show_ed=2.

ЦГБ г.Усть-Илимск

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Constantin (IP-адрес скрыт)

Дата: 14, November, 2013 09:16

Закоментируйте показ ссылки в формате
BriefHTML_ft в папке Deposit_ft_13

Это в конце формата кусок

'<a title="Скачать" style="border:0px;font-size:12px;" target=_blank href="/Scripts/irbis64r/cgiirbis_64.dll?C21COM=2&I21DBN=',v2221,
'&P21DBN=',&uf('G0_',v2221),
/* '&S21COLORTERMS=1',
'&Z21ID=',&uf('+3E',&unifor('Av2225#1')),
'&Image_file_name=',&uf('+3E',if v952^a <> '' then v952^a else if v952^c <> '' then v952^c else v952^b fi fi),
'&Image_file_mfn=',f(val(MFN),0,0),
'&IMAGE_FILE_DOWNLOAD=1',

/*if (&uf('+1R1'): 'HTM') or (&uf('+1R1'): 'TXT')
/* then '&IMAGE_FILE_DOWNLOAD=0',
/* else '&IMAGE_FILE_DOWNLOAD=1',
/* fi,
/* '&FT_REQUEST=',&unifor('+3E',&unifor('Av3335#1')),' ',&unifor('+3E',&unifor('Av3339#1')),
fi,
,'">Полный текст',
' (',
if v25<>'' then &uf('+9E',v25) else &uf('+9E',&uf('+9A',if v952^a <> '' then v952^a else v952^b fi)),fi
')</a>'

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: vguseva (IP-адрес скрыт)

Дата: 15, November, 2013 03:20

Спасибо, все получилось

ЦГБ г.Усть-Илимск

Опции: Ответить•Цитировать

Re: Не индексирует файлы, защищенные паролем

Пользователь: Muratt (IP-адрес скрыт)

Дата: 30, November, 2013 09:15

Здравствуйте. Получилось закомментировать запись, чтобы не было видно строку "Полный текст". Скажите пожалуйста, возможно ли сделать так, чтобы ссылка на "Постраничный просмотр" была доступна не для всех текстов? Как и что нужно прописать в формате BriefHTML_ft.pft?

Опции: Ответить•Цитировать

Навигация:•Список тем•Искать•Войти

Извините, только зарегистрированные пользователи могут писать в этом форуме.

This forum powered by Phorum.