Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Опыт и разработки пользователей ИРБИС :  ИРБИС Irbis
 
Страницы: <<12
Страница: 2 из 2
Re: Распознавание библиографического описания в начале книги
Пользователь: Gena (IP-адрес скрыт)
Дата: 12, April, 2012 19:06

Модуль нужен сугубо для того что бы быстро сформировать поля 922, а что с ними потом будут делать - это уже не важно. По поводу ошибки - не могу сказать ничего, модуль сыроват, это точно. Скорее всего где-то не выдержана структура разделения текста. На всякий случай перед передачей обработанных данных в Ирбис происходит их резервное запись. Так что потом их можно вернуть.
На счет кодировки - там в рабочем листе прописывается имя утилиты и ключ для запуска для И64 UTF8, а для И32 ничего не прописывается. Он и определяет в каком виде передавать данные

Re: Распознавание библиографического описания в начале книги
Пользователь: S-presso (IP-адрес скрыт)
Дата: 12, April, 2012 19:35

Разобрался: перед передачей данных в Ирбис надо еще нажать на одну из кнопок, выбрав аннотацию или оглавление, иначе возникает сообщение об ошибке. А вот вопрос: чтобы переносить данные из программы не в поле 330 "Автоввод" вкладки "Технология", а так, чтобы программа сама определяла, по каким полям ей надо распределять данные, нужно обязательно переводить программу в формат DLL?

Re: Распознавание библиографического описания в начале книги
Пользователь: Gena (IP-адрес скрыт)
Дата: 12, April, 2012 19:55

форма программы (dll exe) совершенно не связана с тем, в каком виде данные будут передаваться.

Re: Распознавание библиографического описания в начале книги
Пользователь: S-presso (IP-адрес скрыт)
Дата: 12, April, 2012 20:10

Нет, я имел в виду: переводить программу в формат DLL и запускать ее в пользовательском режиме, как это описано в RELEASE_OVERALL.DOC. Иными словами, обычная внешняя программа может передавать данные только в то поле Ирбис, в котором она сама запускается по F3?

Re: Распознавание библиографического описания в начале книги
Пользователь: Gena (IP-адрес скрыт)
Дата: 12, April, 2012 20:16

Да, именно так.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 13, April, 2012 14:34

А в этой публикации
[irbis.gpntb.ru]
предлагается сканировать не титульные листы, а целые статьи (или использовать их электронные версии) и использовать, насколько я понял, отдельные слова из них в качестве ключевых, а также для ввода в некоторые другие поля. Хотя и не про ИРБИС, но IMHO заслуживает внимания и обсуждения

irbis_arbat@mail.ru

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 15, April, 2012 06:45

Панев Максим написал(а):
-------------------------------------------------------
> Автоподключение плагинов рассматривается на каждом
> шагу в интернете. Нужно только спросить у гугла.
> Но да ладно, я уверен на 100%, что до таких
> доработок ИРБИС еще ой как не скоро дойдет. Пока
> что плюшки имеют больший вес.

"Модуль для работы с оглавлением" устанавливается простым копированием, но работает именно как плагин и меняет (дополняет) РЛ.
Вот это я понимаю!

irbis_arbat@mail.ru

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 15, April, 2012 09:18

Gena написал(а):
-------------------------------------------------------
> Думаю, лучше это реализовывать не как часть АРматых за
> Каталогизатор, а как DLL, пришивающуюся к
> Интерфейсу. У меня сейчас есть пара модулей,
> которые загнаны в ДЛЛ, и вызываются прямо из
> интерфейса Ирбиса. Вполне удобно, а главное -
> обработанные данные бросаются прямиком в АРМ
> Каталогизатор.

Шикарно пришили! Устанавливается простым копитыком и сразу же работает безо всякой инсталляции и настройки! Просто каталогизатор видит и использует некоторые небольшие новые удобства.
Слегка офф. Подумал - а вот бы для решения таких непростых и комплексных задач привлекать НИИ нашей уникальной системы РАН, если они еще живы... тут мог бы быть и авторасчет индекса цитируемости, и автоклассификация (индексирование), и автореферирование... и вообще участвовали бы в исследованиях проблем автоматизации библиотек... тут ведь нужны психологи, эргономисты (если правильно выразился), социологи...
Совсем не офф: как защититься от сионов
[otvet.mail.ru]
Главное, запасти побольше картошки.



Редактировано 5 раз. Последний раз 11.07.2012 17:53 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, May, 2012 12:33

О другом возможном нестандартном способе ввода [irbis.gpntb.ru]
Есть некоторое сходство с обсуждаемым выше - извлекать ЭД даже не из карточек, а прямо из текстов научных статей, отсканированных и распознанных, либо электронных, в т.ч. интернет-публикаций. Способ может быть удобен для узкоспециализированных БД типа описанной тут ТЕРМАЛЬ по теплофизике, и именно при "потоковом" (массовом) вводе однотипных документов, возможно, именно для небиблиотекарей.
ЗЫ. Автореферирование (а также автоаннотирование) когда-нибудь безусловно будет интегрировано с АБИС (как обычно, думал, это моя идея, высказывал ее семь лет назад, когда воображал ИРБИС256 2010. Ошибся в сроках, но не в самой идее [irbis.gpntb.ru]
Когда-то экспериментировал с программкой "Либретто", результат был очень "не очень". Но это скорее игрушка, маленькая и бесплатная. Для серьезного же автореферирования, видимо, нужна как минимум предварительная настройка на тематику (предметную область), как для программ-переводчиков, или хотя бы указание тематики.

irbis_arbat@mail.ru



Редактировано 3 раз. Последний раз 11.07.2012 12:34 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 10, July, 2012 18:27

Gena написал(а):
-------------------------------------------------------
> Честно говоря, когда реализовывал свой модуль для
> работы с оглавлением, то особо не заморачивался с
> автораспознованием элементов оглавления - я
> оставли это на откуп операторам. Но свел работу к
ну вот, уже и до операторов дожили... в смысле что терминология ненашенская, небиблиотечная, а типично "ОНТИшная"... впрочем, согласно моему учителю Ю.Н.Столярову, еще с 70-х и читателей нет, а есть вместо них абоненты.

Gena написал(а):
-------------------------------------------------------
> Модуль нужен сугубо для того что бы быстро
> сформировать поля 922, а что с ними потом будут
> делать - это уже не важно. По поводу ошибки - не
Геннадий Сергеевич, как вы знаете, я вас очень и очень уважаю, ценю вашу разнообразную помощь, часто просто уникальную. Но если понимать буквально - не важно что потом будут делать, то... чтобы не "выражаться", no comment. Вспомнил вот только Льва Давидовича - цель ничто, движение все.

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 11.07.2012 17:54 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 10, July, 2012 18:57

Информация к размышлению:

Для проведения ретроконверсии каталога библиотеки сотрудники ВГБИЛ и специалисты «Гипер» совместно разработали комплекс «Маэстро». […] В
автоматическом режиме система удаляет переносы в словах; доставляет точки в сокращениях; заносит соавторов из добавочных библиографических записей в поля авторов, расшифровывает сокращения [! — А. Л.] и т. д. Затем идет проверка и корректировка содержимого полей карточки библиотеки — параллельно в двух режимах. В автоматическом режиме содержимое полей редактируется с помощью
программы «Коррект», на одну карточку при этом уходит 2 секунды. В ручном режиме оператор редактирует неформализуемые поля, например,
инвентарный номер. […] Контроль качества библиографических записей выполняется в программе «Универсальный редактор» комплекса «Маэстро»,
которая сокращает время редактирования каталожной карточки до 2 минут. И, наконец, на последнем этапе обработки массива КК производится конвертирование их в требуемый формат. Причем
непосредственно перед процессом конвертирования «Маэстро» проверяет электронные библиографические записи на дублетность названий и инвентарных номеров, производит поиск и удаление списанных
изданий по актам списания [? — А. Л.] и генерирует предметные рубрики по классификационному индексу [! - А.Л.] этот процесс предварительной обработки 1000 записей на ПК занимает несколько минут.

Глинников М. Мы и информация // Директор ИС. — 2001. — № 1[b][/b].

Если это правда, хотя бы отчасти, то «Гипер» и ВГБИЛ давно далеко впереди планеты всей. Например, технология ретроконверсии АО "ПроСофт-М" гораздо примитивнее, в основном "ручная", притом что ее услуги очень недешевы. А генерация ПР - подарок для Ивана Евгеньевича... Надо не забыть об этом...

irbis_arbat@mail.ru

Re: Распознавание библиографического описания в начале книги
Пользователь: Gena (IP-адрес скрыт)
Дата: 11, July, 2012 09:42

Lavrinovich написал(а):
-------------------------------------------------------
> ну вот, уже и до операторов дожили... в смысле что
> терминология ненашенская, небиблиотечная, а
> типично "ОНТИшная"... впрочем, согласно моему
> учителю Ю.Н.Столярову, еще с 70-х и читателей нет,
> а есть вместо них абоненты.

Алексей, тут я могу настоять на правильности использования термина, так как у нас эту работу выполняют чаще НЕ БИБЛИОТЕКАРИ, а студенты отработчики.

> Геннадий Сергеевич, как вы знаете, я вас очень и
> очень уважаю, ценю вашу разнообразную помощь,
> часто просто уникальную. Но если понимать
> буквально - не важно что потом будут делать, то...
> чтобы не "выражаться", no comment.


Ну уж простите. Имелось в виду, что библиографы сами решат, хотят они сразу же дополнить оглавление и размножить из него записи, или оставить документ с оглавлением и не создавать связанные записи

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 11, July, 2012 09:47

Насчет операторов согласен, в данном случае это именно операторы, как в специализированных фирмах типа ПроСофт-М. Воройский Ф.С. где-то рассказывал о привлечении в таком качестве даже безработных. А "отработчики" - это, видимо, практиканты?
Я "выступил" так некстати, резко и ошибочно под впечатлением статьи об ABCD, где есть только "администраторы" и "операторы" со сложным распределением функций. Хотя по замыслу это именно библиотечная система общего назначения, однако разработанная в BIREME - специализированном центре PAHO (Pan American Health Organization), видимо, причина именно в последнем обстоятельстве.
Для полной ясности процитирую:
- Системный администратор, в задачи которого входят определение и поддержание структурных БД, состав пользовательских БД, все технологические операции со всеми БД.
- Администратор конкретной БД, обычно пользовательской. Он решает глобальные задачи её пополнения, информационной и физической безопасности и другие.
- Оператор базы данных, осуществляющий ввод в БД новых документов.
- Оператор по связи с читателями (абонентами, пользователями), в функции которого входят выдача и учет выданной литературы, другие необходимые контакты с широким кругом лиц.

Далее упомянуты также:
- Администратор публичного входа
- Администратор по безопасности

А вот библиограф (каталогизатор), вступающий в работу на следующем этапе, должен быть специалистом и по свой части, и по данной предметной области, тематике (для научной литературы) и хоть немного разбираться в языках, знать правила практической транскрипции и другое разное. В частности, в научно-технической и другой современной литературе, просто в газетах, вообще в СМИ много аббревиатур, причем в одной публикации могут встретиться русские, английские и другие. Как они будут определены при сканировании и распознавании:
ВВС - это "вэ-вэ-эс" или "би-би-си"?
ТНК-ВР читается как "тэ-эн-ка-би-пи", а почему не "ти-эйч-кей-вэ-эр" или как-нибудь еще?
Все возможные способы ретроконверсии [www.gpntb.ru]
...да, модуль для работы с оглавлением - эталон инсталлябити и юзабельнити!
ЗЫ. Я тебе покажу "бабульки"! Вот Светлана Семеновна, оказывается, известная теннисистка... Людмила Васильевна тоже спортсменка... и все они доцентки и кандидатки, сиречь таперича магистерши... или вот еще бабулька - магистр Сунита Лин Уильямс, в прошлом командир отряда боевых вертолетов ВМФ США, а в близком будущем командир МКС... вот тебе накося...

irbis_arbat@mail.ru



Редактировано 13 раз. Последний раз 16.08.2012 15:35 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 13, July, 2012 07:20

Опять кипит мой разум возмущенный и никак не остынет... это снова про бабулек... где политкорректность, толерантность, мультьтикультуральность?
Например, Светлана Семеновна, 196... [censored] г. р., известная теннисистка... Людмила Васильевна, 195... [censored] г. р., тоже спортсменка... или же for example ваша несравненная Юлечка Владимировна 1960 г.р., ИМХО очаровашечка, и некоторые наши кулёчные доцентки-кандидатки, по-новому магистерши...
А вот еще бабулька-прабабулька-разбабулька и тоже магистр наук Сунита Лин Уильямс 1965 г.р., в прошлом командир отряда боевых вертолетов ВМФ США, а в ближайшем командир МКС...
Или вот еще интереснее: имеет отношение к космосу и одновременно к нашей же сфере культуры - директор музея-заповедника "Московский Кремль" Елена Юрьевна Гагарина 1959 г.р., тоже кандидат наук и тоже очень ничего себе.
Или дедулька лидер байкеров Александр Залдостанов aka Хирург, когда-то главный враг гаишников, а теперь лучший друг гебешника Путина. Не общался с ним, но видел нос к носу (точно как Алана Хопкинсона в кабинете Александра Иосифовича) во время концерта у Белого дома в 1992 г., с тех пор он не изменился... [www.russia.ru]
[www.skillper.com]



Редактировано 8 раз. Последний раз 11.08.2012 08:06 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 18, July, 2012 13:26

Кандидаты, бакалавры, помидоры, овощи.
Доктор едет на "Победе", проф на Скорой помощи.
Городской фольклор 1950-х в моей редакции

S-presso написал(а):
-------------------------------------------------------
> Видимо, желание все оптимизировать может прийти
> только в том случае, если оператор - ты
> самsmiling smiley. Но, очевидно, случай
> оператора-разработчика редкий, иначе было бы много
> пользовательских разработок для Ирбиса.

ИРБИС потому и лучший, что его разработку начинали библиотекари. А что надо все сначала испытывать на себе, давно известно, например, вакцины. С.П.Королев хотел лететь вместо Ю.А.Гагарина, впрочем, вскоре полетел К.П.Феоктистов, главный конструктор корабля (не ракеты) "Восток".



Редактировано 5 раз. Последний раз 27.11.2012 09:46 пользователем Lavrinovich.

Re: Распознавание библиографического описания в начале книги
Пользователь: S-presso (IP-адрес скрыт)
Дата: 09, February, 2013 14:59

Цитата:
Библиографическое описание, помещаемое на обороте титульного листа или в конце всех современных изданий, легко поддается разбиению на отдельные поля, которые сразу можно передавать в запись ИРБИС. Таким образом появляется новый простой и эффективный способ формирования записей электронного каталога: БО сканируется, автоматически проверяется на ошибки (с использованием словаря) и после незначительного редактирования (а иногда и без него) из текста БО формируется новая запись. Я уже реализовал это в своем самодельном АРМе с интерфейсом, похожим на Каталогизатор (его вторая функция - передача текста оглавления в соответствующие поля записи). Я сам работаю оператором в библиотеке Саратовской государственной консерватории, поэтому могу сказать, что метод вполне удобный и практичный.

Цитата:
Gena
Думаю, лучше это реализовывать не как часть АРма Каталогизатор, а как DLL, пришивающуюся к Интерфейсу. У меня сейчас есть пара модулей, которые загнаны в ДЛЛ, и вызываются прямо из интерфейса Ирбиса. Вполне удобно, а главное - обработанные данные бросаются прямиком в АРМ Каталогизатор.
А по поводу самого модуля - давно это надо было делать. Я как-то начинал, но потом наши "гуру" меня отвадили от этого, описав сложность алгоритма распознования <...>
Вообще проект интересный. У вас он уже полностью реализован?

Итак, как вы, возможно, уже успели заметить, данный проект выполнен мной где-то процентов на 60-70 (правда, оставшиеся проценты по идее должны даваться с намного большим трудом) и соответствующий модуль был выложен в теме про новый АРМ "АльтерВвод" - [irbis.gpntb.ru]. Единственное ограничение модуля по функциональности состоит в том, что он не позволяет сохранять запись в ЭК, но её можно просматривать по всем полям рабочего листа и копировать отдельные поля в буфер обмена. Кроме того, вы даже можете попробовать подключить эти две DLL из архива (все, кроме IRBIS64_CLIENT.DLL) непосредственно к АРМ Каталогизатор, поскольку приложение "АльтерВвод" следует спецификации ИРБИС64 в отношении пользовательских режимов, в целом выполняя их стабильнее и позволяя хранить настройки пользовательских режимов на стороне клиента, а не сервера (прописывая их в файле настроек CIRBISC.INI своего каталога). Приглашаю всех к дискуссии: делиться своими впечатлениями по поводу работы модуля в моём клиенте и в Каталогизаторе, обсуждать перспективы OCR в АБИС вообще. Если вы хотите высказаться по поводу подпрограмм для работы с оглавлением (они находятся в том же модуле плагина BART_NET.DLL), то лучше сделать это в теме про "АльтерВвод". Хорошо бы услышать мнение самих разработчиков Ирбиса - если они проявят интерес, я готов поделиться кодом своего клиента, ведь если в новых версиях Каталогизатора появятся такие же плюшки для работы с оглавлением, я был бы только рад этому. В любом случае советую попробовать сам АРМ и его плагин в обоих режимах в действии - возможно, тогда вам найдётся что сказать.

Re: Распознавание библиографического описания в начале книги
Пользователь: oyan (IP-адрес скрыт)
Дата: 07, December, 2023 10:24

Gena написал(а):
-------------------------------------------------------
> У меня модуль работы с оглавлением установлен в 4
> библиотеках и работают с ним именно библиотекари.

Прошу прощения за некропостинг. Gena, скажите, ваш модуль для работы с оглавлением всё ещё работает? (Написать в посвященной ему теме [irbis.gpntb.ru] почему-то не могу, разлогинивает.)

Страницы: <<12
Страница: 2 из 2


Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.