Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
ПТБД в графическом формате?
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 26, June, 2006 10:42

Изучил доклад:
Вербицкая Т. В., Фефелова Н. В. Опыт использования «ИРБИС 64 / Полнотекстовые БД» при формировании полнотекстовых баз данных краевых дореволюционных газет в Государственной универсальной научной библиотеке Красноярского края // КРЫМ-2006

И ничего не понял. Цитата:
«В 2005 году Библиотека приступила к осуществлению проекта по созданию полнотекстовой базы данных документальных материалов собственной генерации на основе дореволюционных краевых периодических изданий. Это стало возможным благодаря подсистеме ИРБИС64 для создания полнотекстовых баз данных, который позволяет выстроить такие параметры исполнения проекта по оцифровке газетного материала, дающие возможность легко и быстро ответить на любой запрос пользователя […]. Начали создание полнотекстовой БД с ранее переведенной в электронный вариант газеты «Енисейская мысль» (1912-1915гг.), в формате JPEG».
Ну дык ведь «ИРБИС 64 / Полнотекстовые БД» не ищет внутри графических форматов, и вообще вроде ведь никакая система этого не умеет!?? У них поиск ведется по ключевым словам, вводимым вручную, включая такие, каких нет в обрабатываемом документе (приводится пример: в газете «портомойня» — в описании «прачечная»). Неубедителен довод в пользу JPEG — что якобы доревюлюционная орфография не распознается:
1. FineReader можно настроить на дореволюционную орфографию (этот набор символов называется White Russian, то есть "белогвардейский"). И неужели одна-единственная буква («ять») такая большая помеха? Да ивообще, какая связь между поиском и проверкой орфографии7
2. ИРБИС64ПТБД ищет по украинским (например, в крымских докладах) и любым другим буквам

ЗЫ. Пример: БД авторефератов ГПНТБ – в TIFF, и причем это сделано специально чтобы не копировали. Естественно, это внешние объекты.

Re: ПТБД в графическом формате?
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 28, November, 2006 15:52

..более того: вообще необязательно, а часто даже ненужно или даже вредно распознавать и редактировать отсканированное, и не только из соображений копирайта. Важнее другое. В частности, в научных целях может быть даже НЕОБХОДИМО сохранять опечатки, орфографические и грамматические ошибки. А авторская орфография и пунктуация, особенно в художественной литературе!!?

Re: ПТБД в графическом формате?
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 28, November, 2006 19:23

В принципе тема интересна, но не понятна о чем конкретно вы, Алексей, хотите поговрить. Три раза прочитал оба поста, но так и не понял, что вы хотите обсудить :).
Если это просто монолог, то зачем? Все-таки на форуме все выссказывания должны содержать некий диалог. А у вас одни монологи получаются :).

Re: ПТБД в графическом формате?
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, November, 2006 15:10

Это несогласие с точкой зрения красноярцев, а стало быть, диалог с ними. Кроме того, тема пересекается с темой "ИРБИС Ретрокон", где Retrocon (если не ошибаюсь, он же Гончаров) как раз высказался в смысле того, что ретрокаталоги должны быть графические (в смысле нераспознанные) + биб. описание. Стало быть, это мое согласие с ним, а значит, опять-таки диалог.



Редактировано 1 раз. Последний раз 11.10.2011 19:01 пользователем Lavrinovich.

Re: ПТБД в графическом формате?
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 29, November, 2006 17:57

А почему бы не сделать так: каталоги распознаны, поиск по ним идет. Читатели находят нужный фрагмент, но видят графику без всякой возможности копировать. Библиография не нужна.

Re: ПТБД в графическом формате?
Пользователь: Tatiana (IP-адрес скрыт)
Дата: 04, December, 2006 07:58

Lavrinovich написал(а):
-------------------------------------------------------
> Это несогласие с точкой зрения красноярцев, а
> стало быть, заочный диалог (спор)с ними. Кроме
> того, тема пересекается с темой "ИРБИС Ретрокон",
> где "Retrocon" (если не ошибаюсь, он же г-н
> Гончаров) как раз высказался в смысле того, что
> ретрокаталоги должны быть графические (в смысле
> нераспознанные) + биб. описание. Стало быть, это
> мое согласие с ним, а значит, опять-таки диалог.

Для осуществления проекта по созданию полнотекстовой базы данных документальных материалов собственной генерации, мы использовали уже имеющиеся ресурсы: существующие отсканированные газеты, у нас имелись ключевые слова привязанные к конкретному номеру газеты, это мы и совместили в «ИРБИС 64 / Полнотекстовые БД»
Сегодня читатели ведут поиск по ключевым словам, но видят графику.
Да наше решение, пересекается с темой "ИРБИС Ретрокон", которая была озвучена также в Крыму.

Вербицкая Т.В.

Re: ПТБД в графическом формате?
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, May, 2011 05:07

...всего несколько лет назад приходилось применять всяческие ухищрения. чтобы обойти юридические и технические ограничения. С тех пор интернет сильно улучшился:
1.Технически - быстрый и надежный доступ по всей России
2.Содержательно - бесплатно доступны почти все известные человечеству тексты (из того, что нужно мне лично, платно предлагается только словарь "Информатика" Воройского)
Вывод. Собственные ПТБД вроде бы стали не нужны.

Re: ПТБД в графическом формате?
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 11, October, 2011 19:02

И библиография будет вообще не нужна?



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.