Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
J-ИРБИС :  ИРБИС Irbis
 
Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Игорь (IP-адрес скрыт)
Дата: 05, December, 2019 16:04

В крайнем обновлении некорректно отображаются некоторые PDF в окне браузера.
Слева - документ в окне сайта, справа - в акробате.



Редактировано 1 раз. Последний раз 13.12.2019 02:24 пользователем Кирилл Соколинский (СЗТУ).

Вложения: bug.jpg (435KB)  
Re: некорректно отображаются PDF на сайте
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 05, December, 2019 18:36

Наиболее вероятно, что проблема в формате документа. Acrobat обрабатывает много ошибок. Попробуйте сохранить документ с оптимизацией для WEB или какими-либо изменениями в Adobe Acrobat (не Adobe Acrobat Reader!), обязательно указав в качестве формата PDF\A версии 6.0.



Редактировано 1 раз. Последний раз 09.12.2019 01:48 пользователем Кирилл Соколинский (СЗТУ).

Re: некорректно отображаются PDF на сайте
Пользователь: Игорь (IP-адрес скрыт)
Дата: 11, December, 2019 08:58

Пересохранил документ согласно Вашей рекомендации. Очистил кеш страниц PDF в панели управления JIRBIS. Не помогло.

На самом деле, тут вопрос ставится по-другому.
В предыдущей версии у старого плагина такой проблемы не было (хотя некоторые файлы он выводил с огромным количеством "грязи", которую он генерировал из серого фона документа). Выявлять все документы, которые неверно выводятся в новом плагине, для нас сейчас нереально, и играться с различными вариантами форматов при сохранении - нереально и непродуктивно. Документов слишком много.

В изначальной версии ограничения на формат документов не было. Следовательно, обновление ухудшило работу приобретенной нами программы.
Вывод один: переделать логику JIRBIS-а в части вывода документов на экран.

Re: некорректно отображаются PDF на сайте
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 13, December, 2019 01:49

Игорь написал(а):
-------------------------------------------------------
> Пересохранил документ согласно Вашей рекомендации.
> Очистил кеш страниц PDF в панели управления
> JIRBIS. Не помогло.

Пришлите на sokolinsky_k_e@mail.ru проблемный файл, пожалуйста. И обязательно укажите наименование Вашей организации. Необходимо проанализировать ситуацию.


> В изначальной версии ограничения на формат
> документов не было. Следовательно, обновление
> ухудшило работу приобретенной нами программы.
> Вывод один: переделать логику JIRBIS-а в части
> вывода документов на экран.

Да, Вы правы, технология Adobe Flash обеспечивала исключительно высокое качество представления документов, возможности масштабирования и при этом высокую компактность страниц. Но, увы, в 2020 году она прекращает поддерживаться самим производителем. Сегодня всё больше браузеров создают препятствия для использования Adobe Flash. И как бы нас на раздражало это решение, смерть технологии -- свершившийся факт.

Re: Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 14, December, 2019 16:07

Конвертировал присланный Вами файл: при сохранении в PDF/A в Adobe Acrobat всё отображается совершенно корректно! Скриншоты прилагаю.



Редактировано 1 раз. Последний раз 14.12.2019 16:07 пользователем Кирилл Соколинский (СЗТУ).

Вложения: PDF-A.jpg (260.9KB)   PDF-A-saving.jpg (265.9KB)  
Re: Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Игорь (IP-адрес скрыт)
Дата: 16, December, 2019 08:26

Пришлите, пожалуйста, сконвертированный Вами файл. Будем изучать и разбираться.

Но конвертировать сотни файлов, конечно - перспектива так себе...

Re: Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 17, December, 2019 14:43

Игорь написал(а):
-------------------------------------------------------
> Пришлите, пожалуйста, сконвертированный Вами файл.
> Будем изучать и разбираться.

Файл прислал.

> Но конвертировать сотни файлов, конечно -
> перспектива так себе...

Понимаю Вас... Но надо отметить, что требование к соответствию PDF/A является общим для всех известных мне библиотечных систем. Если Вам удастся сделать это с помощью консольных утилит и в пакетном режиме, поделитесь, пожалуйста, своим опытом с пользователями форума.

Отмечу, что J-ИРБИС 2.0 позволяет достаточно легко заменить утилиту, которая используется для извлечения PDF. Команда извлечения определяется в файле config.php и достаточно легко модифицируется.

$config["cmd.pdftojpg"]				=	JI_PATH_PDF_VIEW_LOCAL."/exe/pdftojpg$exe {path.pdf}{pdffile} {path.swf} {page} 250 $pdf_view_password";

Я прислал Вам альтернативную утилиту для конвертации, которая нормально справляется с формулами. Но её никак нельзя использовать в базовой поставке, поскольку качество JPG на выходе оставляет желать лучшего. Кроме того, она не позволяет явно задать имя выходного файла: самостоятельно нумерует файлы и кладёт их в папки.

До использования утилиты требуется обязательно запустить BAT файл с лицензионным ключом. Синтаксис:

pdftoimage.exe -i pdf-2130710471_1.pdf 1 -z 200



Редактировано 1 раз. Последний раз 17.12.2019 14:48 пользователем Кирилл Соколинский (СЗТУ).

Re: Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Игорь (IP-адрес скрыт)
Дата: 18, December, 2019 09:38

Я в недоумении - Вы писали, что для правильной работы программы нужно сохранять документ в формате PDF/A, а прислали документ в каком-то другом формате.
То, что это не PDF/A, мне подтвердил специалист.
Ладно.
Я создал тестовую запись, подключил ваш файл в базу, программой был (вроде) построен полнотекстовый индекс, по крайней мере "Каталогизатор" сообщил об индексации файла - но документ не ищется ни по по части полного текста, ни по отдельным словам из текста.
"Неправильный" pdf при этом находится, а этот - нет.
Поскольку АИ так и не предложил никаких инструментов для контроля полнотекстового индекса, я выгреб индексные записи подручными средствами и обнаружил существенные различия в индексированных текстах. Настолько существенные, что поиск по полному тексту из присланного Вами файла становится невозможным. Нас это не устраивает.
При поиске по заглавию тестовой записи и открытии файла в браузере становится понятно, что вместо текста выводится чистый графический слой полученного pdf файла, текст курсором не выделяется.
Если все требования к "правильности" файлов сводятся к наличию готового графического слоя, то нам этот вариант не очень удобен.

По поводу замены одного компонента системы на другой Вам надо будет объяснить нашему администратору, почему ему надо будет заменить штатный компонент системы на какой-то "левый", да еще и с непонятным правовым статусом.

На самом деле хочется что-то типа этого:
[elibrary.ru]
Я не знаю, честно говоря, что у них под капотом, но скоро наверно выясню.

По поводу "всех известных библиотечных систем" - было бы очень хорошо сделать обзор всех известных систем и их возможностей-требований-закидонов. Чтобы ползователям ИРБИСа-JIRBISа действительно было понятно, чем эта парочка лучше других.

Re: Некорректное отображение формул при постраничном просмотре PDF
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 22, December, 2019 14:27

Игорь написал(а):
-------------------------------------------------------
> Я в недоумении - Вы писали, что для правильной
> работы программы нужно сохранять документ в
> формате PDF/A, а прислали документ в каком-то
> другом формате.
> То, что это не PDF/A, мне подтвердил специалист.


Игорь, я прислал Вам скриншоты, где чётко демонстрируется, что в программе Adobe Acrobat была выбрана опция "Файл PDF с поддержкой архивирования (PDF/A).


> При поиске по заглавию тестовой записи и открытии
> файла в браузере становится понятно, что вместо
> текста выводится чистый графический слой
> полученного pdf файла, текст курсором не
> выделяется.

Нет, превращение текстовых копий в графические формат PDF/A не предполагает. Я описал лишь один из примеров решения задачи. Если у Вас нет лицензионной версии Adobe Acrobat, пожалуйста, скачайте триальную и поэкспериментируйте самостоятельно... Это лишь один из вариантов конвертирования (с опцией Convert All Pages Into Images).

Ваш файл формировался с помощью Acrobat Distiller. Не сомневаюсь, что при помощи изменения параметров задачи (пример: [www.sovsib.ru]) , Вы можете получить нужный формат и выполнить пакетную обработку всех файлов без ручных операций.


> По поводу замены одного компонента системы на
> другой Вам надо будет объяснить нашему
> администратору, почему ему надо будет заменить
> штатный компонент системы на какой-то "левый", да
> еще и с непонятным правовым статусом.

Если Вы хотите получать официальную техническую поддержку, прошу Вас взвешивать и аргументировать свои высказывания! Этот форум предназначен не для выражения эмоций, а для решения проблем!

Всё программное обесечение, используемое Ассоцаицией (в т.ч. и программа PDFTOIMAGE, котоую я Вам прислал), является лицензионным. И это ПО приобреталось за немалые деньги.


Я дал Вам достаточное количество информации для решения вопроса. И сейчас у Вас есть только 2 варианта:

1. Адаптировать документы к требованиям библиотеки QPDF, которая используется в САБ ИРБИС 2018+ и J-ИРБИС 2.0

2. Использовать альтернативные утилиты для преобразования PDF к JPG (пример такой утилиты я предоставил)


Если Вы считаете, что некорректное преобразование Ваших файлов является ошибкой J-ИРБИС 2.0, пожалуйста, прочитайте ограничения гарантии, которые оговорены в п. "Онлайновый просмотр электронных документов" документации.

Возможно, мне удастся включить альтернативное средство выделения страниц в базовую поставку. Но на данный момент ТЕМА ИСЧЕРПАНА.


> На самом деле хочется что-то типа этого:
> [elibrary.ru]
> 73129.pdf

Документ по приведённой Вами ссылке (https://elibrary.ru/download/elibrary_37651095_63573129.pdf) не доступен.


> По поводу "всех известных библиотечных систем" -

Прошу Вас не искажать мои слова. Я написал:

>> требование к соответствию PDF/A является общим для всех известных МНЕ
>> библиотечных систем

> было бы очень хорошо сделать обзор всех известных
> систем и их возможностей-требований-закидонов.
> Чтобы ползователям ИРБИСа-JIRBISа действительно
> было понятно, чем эта парочка лучше других.


Вот, например, ссылка на приказ Минкульта, где описываются требования к документам, включаемым в Национальную Электронную библиотеку -- [docs.cntd.ru] и четко оговорен формат



Редактировано 3 раз. Последний раз 23.12.2019 15:07 пользователем Кирилл Соколинский (СЗТУ).



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.