Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
АРМ Каталогизатор :  ИРБИС Irbis
 
Страницы: 1234>>
Страница: 1 из 4
Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 24, May, 2010 19:36

ТЕЗАУРУС В ИРБИС: ОТ ПРОБЛЕМЫ – К РЕШЕНИЮ (редакция заглавной статьи темы от 21.06.2011 с добавлением от 8 июня 2012 г.)

Информационно-поисковый тезаурус – инструмент эффективного тематического поиска с высокими комбинационными возможностями. Тезаурус отличается простотой использования: формулировка поискового образа документа при создании каталогизационных записей и составлении поисковых запросов при поиске близка к естественному языку и допускает произвольный порядок терминов.

Основу тезауруса составляют дескрипторы – нормативные термины. Каждый дескриптор представлен в нем с указанием связи с нижестоящими терминами (более узкими по содержанию понятия) и вышестоящими (более широкими), а также с ассоциативными (тематически близкими дескрипторами, например ДРЕВНЯЯ РУСЬ и МОНГОЛО-ТАТАРСКОЕ ИГО).

В состав лексики тезауруса входят также аскрипторы (синонимы и условные синонимы), значение которых передается либо одним принятым в качестве эквивалента дескриптором, либо комбинацией дескрипторов, или одним из предложенных альтернативных дескрипторов, который более соответствует содержанию конкретного документа.

Таким образом, наравне с дескрипторными статьями (авторитетными/нормативными записями) в тезаурусе существуют статьи на аскрипторы (ссылочные записи), термины из которых отражаются в соответствующих дескрипторных статьях (обратные ссылки).

Тезаурус в АБИС – совокупность взаимосвязанных словарных статей: авторитетных и ссылочных записей базы данных тезауруса (по функциональному назначению – авторитетный/нормативный файл).

Важным требованием к программному обеспечению для ведения тезауруса является возможность автоматической коррекции некоторого множества связанных словарных статей (записей БД тезауруса) в соответствии с теми данными, которые были внесены при редактировании или создании одной записи базы данных.

Одновременно с коррекцией БД тезауруса было бы заманчиво обеспечить возможность автоматической коррекции поисковых образов записей библиографической БД (БД электронного каталога).

Тезаурус более эффективное средство индексирования и поиска, чем неконтролируемые ключевые слова, с одной стороны, и сложные (многочленные) предметные рубрики, с другой стороны. При этом модуль "Тезаурус" - недостаточно доработанный элемент отечественных АБИС.

Библиографическая служба ЦГПБ им. В. В. Маяковского (Санкт-Петербург) имеет 17-летний опыт применения тезауруса для аналитической библиографической базы данных. Ведение тезауруса осуществляется по ГОСТ 7.25 "Тезаурус информационно-поисковый одноязычный". Среди требований ГОСТа – адекватное отображение тезауруса (со всеми связями) на экране (если речь идет о применении тезауруса в АБИС).

Используемая с 1994 г. для библиографической БД и БД тезауруса программа CDS/ISIS/M (версия 3.0) в среде MS DOS отвечала необходимым требованиям ГОСТа на ведение тезауруса, но не обладала дружественным пользователю интерфейсом.

Переход нашей библиотеки на ИРБИС в 2001 г. позволил создать многочисленные читательские АРМы – читатели впервые получили возможность самостоятельной работы с нашими электронными ресурсами. НО при этом остро встала проблема сохранения нашей методики индексирования и поиска: ИРБИС не давал инструмента работы с нормативными словарями. В качестве временного средства индексирования стала использоваться текстовая версия тезауруса, в которой нужный выделенный термин копировался и вставлялся затем в ИРБИС.

Для ведения дескрипторов-имен собственных (имена лиц, географические названия и т.п.) с 2006 г. успешно используется механизм авторитетных/нормативных файлов. Тогда же основной массив лексики тезауруса более 7000 терминов (без имен собственных) был введен в БД "Тезаурус" (TEZ) ИРБИС. Это существенно упростило доступ каталогизатору/библиографу к тезаурусу - непосредственно в АБИС через встроенный словарь поля 965 "Дескрипторы".

Возможности БД "Тезаурус" ИРБИС (мы работали в ИРБИС 64, версия 2009.1, теперь – 2010.1) позволяли использовать его как поисковый механизм (во многом, соответствовавший необходимым требованиям) и получать при "поиске для умников" возможность навигации по словарю. В прикрепленном файле (см. ИРБИС 64_поиск по тезаурусу.doc) прокомментирован поиск с использованием БД "Тезаурус". При просмотре дескрипторной статьи пользователь видит термин в его связях с другими, может отобрать для поиска более соответствующий запросу термин, провести поиск с необходимой полнотой и с минимальными информационными потерями.

НО недостатки модуля "Тезаурус" (TEZ) в ИРБИС не обеспечивали весь цикл работ по ведению тезауруса, что вынуждало продолжать ведение эталонной версии в CDS/ISIS/M (версия 3.0) с последующим вводом изменений в БД "Тезаурус" в ИРБИС.

В моем сообщении здесь на форуме 24 мая 2010 г. были высказаны предложения по доработке рабочего листа ввода БД "Тезаурус" в ИРБИС:

1) сделать поле для вышестоящих дескрипторов повторяющимся (достаточно часто к дескриптору требуется 2-3 вышестоящих термина);

2) создать повторяющееся поле для нижестоящих дескрипторов (нижестоящих терминов в дескрипторной статье может быть несколько десятков);

3) создать поле для синонимов-аскрипторов (функционально соответствуют 410 полю авторитетного файла);

4) создать поля для систематических и категориальных индексов (необходимы для выделения терминов по категориям, обеспечивают процесс ведения тезауруса);

5) обеспечить возможность автоматической корректировки всех связанных словарных статей тезауруса: a) при создании новой дескрипторной или аскрипторной статьи (сделать возможным автоматическое добавление нового термина или синонима с указанием статуса синонима [синоним, передаваемый комбинацией терминов или одним из альтернативных терминов]); b) при изменении статуса термина (например, аскриптор стал дескриптором) или при редактировании термина;

6) в будущем создать поле для фиксированного идентификационного номера дескриптора, независимого от MFN, это позволит обеспечить автоматическую коррекцию поисковых образов (в полях 965).

РЕШЕНИЕ ПРОБЛЕМЫ

Стараниями зав. отделом разработки и совершенствования АБИС и технологий ГПНТБ России А. И. Бродовского для представления тезауруса в ИРБИС в декабре 2010 г. была использована БД URUB ("универсальный рубрикатор"), в которой под задачи ведения тезауруса была изменена структура и наименования полей. Для адекватного отображения терминов в окне просмотра стал использоваться ИРБИС-навигатор на основе html (как в "поиске для умников").

Этот же ИРБИС-навигатор стал доступен при работе библиографа/каталогизатора с полем 965 "Дескрипторы".

При внесении изменений в служебные файлы БД URUB, были обеспечены:

- повторяемость поля для вышестоящего дескриптора;

- создание повторяющегося поля для нижестоящих дескрипторов (они отображаются в окне просмотра при создании/доработке нормативной записи, а при ее сохранении – заглавный дескриптор записи отображается в дескрипторных статьях этих терминов как вышестоящий, при этом поля нижестоящих терминов в сохраняемой записи опустошаются, поскольку данная связь таким образом уже зафиксирована и видна в окне просмотра);

- автоматическое включение заглавного дескриптора изменяемой/создаваемой нормативной записи в качестве ассоциативного во все дескрипторные статьи, заглавные термины которых внесены в поле ассоциативных дескрипторов данной нормативной записи (что равносильно созданию взаимной ссылки «см. также»);

- определение статуса записи (нормативная/ссылочная) путем заполнения поля "Отсылка "Смотри"".

См. ниже картинку листа ввода БД URUB в прикрепленном файле "ТЕЗАУРУС В БД URUB.doc"

При этом отпала необходимость вводить в состав нормативной записи синонимы-аскрипторы – они отображаются в окне просмотра дескрипторной статьи, благодаря существующим в составе тезауруса соответствующим ссылочным записям.

Необходимая коррекция (после редактирования записей тезауруса) поисковых образов каталогизационных записей проще осуществляется путем глобальной корректировки конкретных данных в поле 965 менеджером/администратором БД статей или ЭК: в этой ситуации привязка дескрипторов к фиксированному идентификационному номеру неактуальна (см. выше пункт 6).

В результате очередной встречи с А. И. Бродовским в январе 2011 г. была решена, в частности, проблема дифференцированного отражения разных категорий ссылок: “см.”, “см. альтернативу”, “см. комбинацию”, что исключило возможность неадекватного индексирования.

Также была решена проблема алфавитной сортировки терминов внутри словарной статьи в каждой категории: синонимы, вышестоящие, нижестоящие, ассоциативные термины. Это не просто “дань” ГОСТу, а практически необходимое требование: словарная статья может содержать до сотни терминов, требующих упорядочивания.

Среди перспективных задач ведения тезауруса в URUB, на момент июня 2011 г., оставались проблемы обеспечение вывода тезауруса в текстовый файл в форме алфавитного лексико-семантического словаря. НО, по-существу, задача тогда рассматривалась как принципиально решенная. (Фрагмент тезауруса см. в файле "ФРАГМЕНТ ТЕЗАУРУСА, РЕАЛИЗОВАННОГО В URUB.doc".)

Тезаурус в БД URUB на протяжении года обеспечивал процесс ведения и использования Корпоративной библиографической базы данных библиографов публичных библиотек Санкт-Петербурга, объединенных в единую Корпоративную сеть общедоступных библиотек (КСОБ СПб).

В ходе встреч с А. И. Бродовским в марте-апреле 2012 г.были разрешены проблемы администрирования словаря в АБИС (расширена структура рабочего листа URUB, произведен перевод словаря из эталонной БД тезауруса из ISIS в URUB, в ИРБИС, поскольку предыдущая версия была взята из БД TEZ, где тезаурус представлен в ограниченном виде). Помимо этого решена проблема корректного вывода тезауруса на экран и в текстовый файл (лексико-семантический словарь - основная форма текстового представления тезауруса): обеспечен алфавитный порядок словарных статей в рамках тезауруса и терминов в рамках каждой словарной статьи тезауруса (лексикографической записи).

Мы надеемся, что найденное решение будет реализовано в дистрибутиве ИРБИСа.

Более подробно материал был представлен в совместном докладе специалистов ЦГПБ им. В. В. Маяковского:
- на конференции "Крым-2011" (опубликовано: НТБ. 2011. № 11);

- на конференции "Крым-2012"
(опубликовано также: НТБ. 2012. № 11).



Редактировано 8 раз. Последний раз 20.01.2013 16:33 пользователем Иван Евгеньевич.

Вложения: ИРБИС 64_поиск по тезаурусу.doc (187.5KB)   ТЕЗАУРУС В БД URUB.doc (287KB)   ФРАГМЕНТ ТЕЗАУРУСА, РЕАЛИЗОВАННОГО В URUB.doc (144KB)  
Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 03, June, 2010 17:44

Дескрипторные ИПЯ - наиболее перспектвное направление развития документальных информационно-поисковых систем, предусматривающих участие человека в аналзе информации.
Простота индексирования документов и посковых запросов для каталогизатора и конечного пользователя обеспечивается серьезной работой редактора (-ов) тезауруса. Вместе с тем, для тезауруса характерен, сравнимый с другими поисковыми языками, невысокий темп роста словаря. Достигнув определенного уровня насыщения, темп роста словаря существенно снижается. Это облегчает процесс его обслуживания - поддержания в актуальном состоянии.



Редактировано 1 раз. Последний раз 03.06.2010 17:45 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: KP0H (IP-адрес скрыт)
Дата: 09, June, 2010 12:45

Где можно найти документацию по Поисковому языку ИРБИС.
Есть очень небольшой кусочек в документации по irbis64_client.dll, но это очень мало. В первую очередь интересует список префиксов, в остальном в принципе все более-менее ясно.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 09, June, 2010 14:21

Списка прафиксов нет. И нет инструмента, который бы показал все дсотупные в базе данных префиксы. Единственое, что можно сделать, это посмотреть словарь "ка есть", создав в базе данных вид поиска, для котрого префикс словаря не указан (пустой). Тогда вам будут доступны все термины, которые есть в соваре конкретной базы данных.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 09, June, 2010 22:16

Вопрос оптимизации модуля "Тезаурус" (поиск по дескрипторам) требует доработки структуры рабочего листа базы авторитетного файла "Тезаурус". Важно также оптимизировать и его (файла "Тезаурус") функциональные возможности.

Кроме прочего, необходимо предусмотреть возможность автоматической корректировки записей не только внутри БД "Тезаурус" при внесении изменений в одну из авторитетных записей, но и в поле 965 библиографической базы данных (базы электронного каталога).

Кроме того, необходимо обеспечить корректный формат вывода текста словарной статьи (т.е. авторитетной записи) в окне просмотра полного описания - и в самой базе "Тезаурус", и во вложенном рабочем листе поля 965. Например:

Основной термин-дескриптор:
БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ СИСТЕМЫ
Примечание: Пакеты прикладных программ, обеспечивающие функции библиотек или информационных служб.
Синонимы-недескрипторы:
АБИС
Автоматизированные библиотечно-информационные системы
Вышестоящие:
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
Ассоциативные:
БАЗЫ И БАНКИ ДАННЫХ
БИБЛИОТЕЧНОЕ ДЕЛО
ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
КОМПЬЮТЕРНЫЕ СЕТИ
ЭЛЕКТРОННЫЕ КАТАЛОГИ
Синонимы-Недескрипторы (выражаются комбинацией):
Обучение пользователей библиотечно-информационных систем
Синонимы-недескрипторы (основной термин - альтернативный):
Автоматизация библиотек

Соответственно, в базе "Тезаурус" должны быть ссылочные записи для:
- для терминов-недескрипторов, выражаемых комбинацией дескрипторов;
- для терминов-недескрипторов, выражаемых одним из ассоциативных дескрипторов (наиболее подходящих по смыслу конкретного текста).
Например:

Основной термин-недескриптор:
Обучение пользователей библиотечно-информационных систем
Комбинация замещающих дескрипторов:
БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ СИСТЕМЫ
РАБОТА С ЧИТАТЕЛЯМИ

Основной термин-недескриптор:
Автоматизация библиотек
Альтернативные замещяющие дескрипторы:
АВТОМАТИЗАЦИЯ
БАЗЫ И БАНКИ ДАННЫХ
БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ СИСТЕМЫ
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
КОМПЬЮТЕРНЫЕ СЕТИ
СЕТЕВОЕ ОБСЛУЖИВАНИЕ
ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ
ЭЛЕКТРОННЫЕ КАТАЛОГИ

ИРБИС - одна из лучших АБИС! Решение проблемы тезауруса лишь вопрос времени.



Редактировано 2 раз. Последний раз 10.06.2010 15:59 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 10, June, 2010 21:22

Примеры авторитетных записей, в которых к заглавному термину предлагается несколько вышестоящих дескрипторов, требующих повторяющегося поля в рабочем листе БД "Тезаурус" (текстовый формат). Из тезауруса ЦГПБ им. В. В. Маяковского (Санкт-Петербург):

Основной термин-дескриптор:
АБСТРАКЦИОНИЗМ
Вышестоящие:
АВАНГАРДИЗМ
МОДЕРНИЗМ
ХУДОЖЕСТВЕННЫЕ ТЕЧЕНИЯ И СТИЛИ
Нижестоящие:
СУПРЕМАТИЗМ

Основной термин-дескриптор:
АВАРИИ
Вышестоящие:
ЭКСТРЕМАЛЬНЫЕ УСЛОВИЯ
ЧРЕЗВЫЧАЙНЫЕ СИТУАЦИИ
Нижестоящие:
РАДИАЦИОННЫЕ АВАРИИ
ТРАНСПОРТНЫЕ ПРОИСШЕСТВИЯ
Ассоциативные:
АВАРИЙНО-СПАСАТЕЛЬНЫЕ ФОРМИРОВАНИЯ
ЖЕРТВЫ АВАРИЙ
КАТАСТРОФЫ [техн.]
ЛИКВИДАТОРЫ АВАРИЙ
ЛИКВИДАЦИЯ АВАРИЙ
НЕИСПРАВНОСТИ ПРИБОРОВ
Синонимы-Недескрипторы (выражаются комбинацией):
Кораблекрушения
Синонимы-недескрипторы (основной термин - альтернативный):
Катастрофы
Техногенные катастрофы

Основной термин-дескриптор:
ПРОКУРОРЫ
Вышестоящие:
РАБОТНИКИ ПРАВООХРАНИТЕЛЬНЫХ ОРГАНОВ
ЮРИСТЫ
Ассоциативные:
ПРОКУРАТУРА

Основной термин-дескриптор:
ПРОМЫШЛЕННЫЕ ЗДАНИЯ
Синонимы-недескрипторы:
Промышленная архитектура
Вышестоящие:
ЗДАНИЯ
МАТЕРИАЛЬНЫЕ АКТИВЫ
НЕДВИЖИМОСТЬ
ОСНОВНЫЕ СРЕДСТВА
СРЕДСТВА ПРОИЗВОДСТВА
Ассоциативные:
ПРОМЫШЛЕННЫЕ ПРЕДПРИЯТИЯ

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 11, June, 2010 20:17

Приведу наиболее выразительные примеры авторитетных записей, в которых к заглавному термину предлагается множество нижестоящих дескрипторов, требующих, опять-таки, повторяющегося поля в рабочем листе БД "Тезаурус". Примеры взяты из тезауруса ЦГПБ им. В. В. Маяковского, Санкт-Петербург (текстовый формат):

Основной термин-дескриптор:
НАРОДЫ
Примечание: Термин исп. в этническом значении; в значении "гражданская общность" см. "НАЦИИ".
Вышестоящие:
ГРУППЫ [соц.]
ЭТНОСЫ
Нижестоящие:
АБХАЗЫ
АВСТРИЙЦЫ
АДЫГИ
АЗЕРБАЙДЖАНЦЫ
АЛБАНЦЫ
...
ИТАЛЬЯНЦЫ
ИТЕЛЬМЕНЫ
КАЗАХИ
КАЛМЫКИ
КАНАДЦЫ
КАРАЧАЕВЦЫ
...
ТАДЖИКИ
ТАТАРЫ ВОЛЖСКИЕ
ТАТАРЫ КРЫМСКИЕ
ТУВИНЦЫ
ТУРКИ
ТУРКМЕНЫ
...
ЭСТОНЦЫ
ЮЖНЫЕ СЛАВЯНЕ
ЯКУТЫ
ЯПОНЦЫ
Ассоциативные:
АССИМИЛЯЦИЯ [этногр.]
АФРИКАНЦЫ
ЕВРОПЕЙЦЫ
КОЧЕВЫЕ ПЛЕМЕНА
МЕЖНАЦИОНАЛЬНЫЕ ОТНОШЕНИЯ
МЕНТАЛИТЕТ
НАЦИИ
...
ЭТНОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ
ЭТНОЛОГИЯ
Синонимы-Недескрипторы (выражаются комбинацией):
Кавказские народы
Народы Поволжья
...
Всего в этой авторитетной записи 85 нижестоящих дескрипторов, 16 ассоциативных. При этом, число нижестоящих терминов будет расти постольку, поскольку в базе статей будут появляться библиографические (каталогизационные) записи на статьи о других народах. Также может расти число ассоциативных терминов, если в массив базы статей будут введены описания на публикации о новых направлениях данной предметной области.

Основной термин-дескриптор:
МЕТОДЫ ИССЛЕДОВАНИЙ
Нижестоящие:
АНАЛИЗ ХУДОЖЕСТВЕННОГО ТЕКСТА
АНТРОПОМЕТРИЯ
БИБЛИОМЕТРИЧЕСКИЙ АНАЛИЗ
БИОИНДИКАЦИЯ
БИОМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ
ГЕНЕТИЧЕСКИЕ ИССЛЕДОВАНИЯ
ИНТЕНТ-АНАЛИЗ
КОНТЕНТ-АНАЛИЗ
МАТЕМАТИЧЕСКИЕ МЕТОДЫ
...
ЭКСПЕРИМЕНТАЛЬНЫЕ МЕТОДЫ
Ассоциативные:
ИССЛЕДОВАТЕЛЬСКОЕ ОБОРУДОВАНИЕ
МЕТОДОЛОГИЯ
НАУЧНЫЕ ИССЛЕДОВАНИЯ
ТЕОРИЯ ОБЩЕСТВЕННОГО ВЫБОРА
В данной авторитетной записи всего 26 нижестоящих терминов. Если бы наша библиотека была не публичной, а вузовской или специальной научной, то число методов было бы иным, а состав отражал бы профиль библиотеки и характер информационных потребностей конкретных групп пользователей-специалистов.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 03, July, 2010 13:12

Отредактирована заглавноя статья. Возможности ИРБИС по работе с тезаурусом существенно зависят от того поколения и версии программы, на которой Вы работаете.

Re: Тезаурус в ИРБИС: особенность дескрипторного ИПЯ
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 24, August, 2010 21:34

Дескрипторный информационно-поисковый язык (ИПЯ) требует учета своей специфики при индексировании и поиске. Он отличается от словаря ключевых слов: дескрипторный ИПЯ - контролируемое средство индексирования и поиска информации, значения его терминов закреплены в тезаурусе (поисковом словаре, отражающем смысловые соотношения понятий).
Сходство дескриптора с известным пользователю словом может оказаться чисто внешним. Естественно, что полноценный поиск, т.е. осмысленный, по точно отобранным терминам, содержание которых (при соответствующем поисковом предписании И-ИЛИ-НЕТ) покрывает реальное содержание информационной потребности, возможен также с использованием тезауруса. Того тезауруса, на основе которого был проиндексирован информационный массив. Пользователь должен иметь возможность увидеть полное отображение терминов тезауруса (дескрипторов, аскрипторов) в их связи, иметь возможность быстрой и удобной навигации по терминам тезауруса (более общий/более точный термин, термин из близкой области и т.п.), отбирая для поискового выражения необходимое количество терминов.

Дескрипторный ИПЯ отличается от предметных рубрик. В идеале, язык предметных рубрик также должен быть контролируемым ИПЯ - опираться на соответствующие словники, картотеки или, как сегодня, нормативные файлы предметных рубрик. Здесь основное отличие заключено в характере синтаксиса и синтагматических связей между лексическими единицами (ЛЕ) ИПЯ.
Предметная рубрика - словесное выражение темы документа. Заголовок рубрики выражает основную тему документа. Конкретизация (ограничение) темы по тематическому, географическому, хронологическому признакам, форме представления информации в документе формализованно выражена последовательностью подзаголовков. Таким образом, один термин (рубрика) стремится выразить содержание документа (или основной его части). Соответственно, для проведения поиска по конкретной (не самой элементарной теме), естественно с использованием словаря предметных рубрик, мы должны иметь представления о логике формулировки тем в словаре предметных рубрик, а главное суметь логически последовательно выстроить наше поисковое выражение. При этом, если программными средствами не предусмотрен вывод рубрик и подрубрик в единые поисковые словари (ну например, в словари (условно назовем) "тема", "география", "время", "вид документа" и т.п.), то найти информацию по вопросу, который отражен в одном из вторых-пятых подзаголовков будет нереально - мы не угадаем, к какому доступному для словарного поиска заголовку он относится.

Предмет и аспект в сложной предметной рубрике имеют строгую последовательность (жесткая синтагматическая связь между ЛЕ), определяемую предметизационной формулой.

Дескриптор выражен словом или словосочетанием, каждое из которых выражает самостоятельное понятие, выступает как отдельная точка доступа, а их последовательность в поисковом образе документа (синтагматическая связь) абсолютно не имеет значения ни для индексирования, ни для поиска: машина просто устанавливает соответствие между набором поисковых терминов документа и терминами запроса (здесь от перестановки слагаемых сумма не меняется, существенно только поисковое предписание: ИЛИ-И-НЕТ).

Дескрипторы можно сравнивать с простой предметной рубрикой. Но, опять-таки, это сходство чисто внешнее, поскольку термин поискового языка (и словаря) существует в контексте этого словаря. Например, дескриптор РЕСТАВРАЦИЯ и простая предметная рубрика Реставрация. Такая предметная рубрика обозначает только документы (книги, статьи и т.п.), основное содержание которых посвящено общим вопросам реставрации, и которые не являются учебными пособиями, альбомами и т.п. (что требовало бы формального подзаголовка и превращало бы рубрику в сложную). [В практике предметизации есть тенденция самым общим рубрикам, все-таки, присваивать хоть какой-то конкретизируюзий подзаголовок, типа "Очерки" - очень неудачное решение, посколько при алфавитной сортировке рубрик при поиске документы общего характера не начинают зримо видимый предметный комплекс, а теряются в его середине smiling smiley.] Лексическая единица "Реставрация" в большинстве случаев будет фигурировать в качестве тематического подзаголовка (подрубрики) к самым различным предметам (заголовкам): зданиям, живописным произведениям, ювелирным украшениям, тканям, интерьерам и т.п.

В свою очередь, дескриптор РЕСТАВРАЦИЯ будет представлен в качестве отдельного поискового термина в соседстве с любым набором иных терминов в описаниях документов, посвященным (в целом или частично) любым видам реставрации, "под любым соусом" рассматривающим вопросы реставрации. Соответственно, объем понятий у этих терминов (РЕСТАВРАЦИЯ и Реставрация) различен, различны будут и результаты поиска.



Редактировано 2 раз. Последний раз 22.06.2011 12:28 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: особенность дескрипторного ИПЯ
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 31, August, 2010 19:03

Серьезного разговора требует вопрос о соотношении дескрипторных ИПЯ и классификационных ИПЯ. Отмечу существенное.

Различия предметизационных ИПЯ (дескрипторный ИПЯ - частный случай, о его отличии от ИПЯ предметных рубрик см. сообщение от 24, August, 2010) и классификационных характеризуются, прежде всего, различными свойствами точности и полноты охвата информации, и соответственно точности и полноты поиска. Поиск по предметным рубоикам позволяет достигнуть высокой точности при достаточно существенных потерях в полноте релевантной информации.

При поиске с помощью тезауруса пользователь имеет возможность провести точный поиск с минимальными информационными потерями за счет включения в поисковый образ запроса всех релевантных терминов, связанных с тем дескриптором, по которому был произведен словарный "вход" в тезаурус. Пример см. в заглавной статье темы (приложенный файл).

Другое отличие предметизационного и классификационного ИПЯ основано на разнице комплексирования информации об объективной реальности. В случае сложной ПР тема (предмет) представлена во всей полноте ее проявлений и связей с различными областями знания и практической деятельности.

Сложная предметная рубрика (ПР) зримо комплексирует вокруг заголовка (основной темы) все многообразие аспектов, представленных в конкретном информационном массиве (базе данных, карточном каталоге). Такой способ организации данных может представлять интерес, прежде всего, для междисциплинарных областей зания, комплексных научных направлений (например, экология, дефектология, история культуры). Не случайно, в свое время М. А. Брискман предлагал организовать систему текущих научно-вспомогательных библиографических указателей не по систематическому (отраслевому), а по предметному принципу (Библиография в помощь науке. Л., 1975. Вып. 1. С. 73).

Предметная рубрика (ПР), таким образом, обеспечивает сквозной поиск информации о предмете объективной реальности в документах различных научных областей. Безусловно, есть и такие рубрики, заголовки которых достаточно однозначно связаны с конкретной областью знания.

Допустим, в случае "сквозного" для разных областей знания предмета тематические подрубрики, в ряде случаев, могут обеспечить смысловую локализацию заголовка предметной рубрики в рамках "своей" отрасли знания. Здесь каталогизатор/библиограф может установить соответствие между сложной предметной рубрикой и классификационным индексом, отразив его, например, в составе авторитетной/нормативной записи заголовка ПР.

Укажу один из примеров "сквозного" предметного заголовка (ПР взяты из ЭК ЦГПБ им. В. В. Маяковского, Санкт-Петербург) :

Наказания - Теория (Индекс ББК: 67.2 - раздел правоведения)
Наказания - История (63.3 (0) - всеобщая история, книга: Сто великих казней. - М., 1999)
Наказания - Социология (60.5)

Но, не всякая тематическая подрубрика будет обеспечивать отраслевую идентификацию темы. В большей степени это могут обеспечить специфические тематические подрубрики.

Таким образом, сложно обеспечить корректное соответствие между ПР и классификационным индексом для всего массива документов БД. Распределение ПР по отраслям знания в ряде случаев может быть условно.

В современных АБИС существует функция автоматического включения в поисковый образ документа индекса той или иной классификации (УДК, ББК и т.д.) при выборе соответствующей ПР или дескриптора из БД авторитетного/нормативного файла. Исходя из сказанного выше, возникает вопрос о корректности и точности такого индексирования "вслепую". Ведь делается это для организации альтернативной возможности тематического поиска (особенно значимого для пользователя при языковом барьере).

Дескрипторный ИПЯ в электронной среде является наиболее эффективным средством тематического поиска.

Но в отношении дескрипторов, установление однозначного соответствия с индексом классификации еще более проблематично. Один и тот же дескриптор может применяться к различным разделам знания и, даже, к различным по иерерхии индексам одного раздела знания. Особенно выразительно этот эффект проявляется в общественных и гуманитарных науках.

Для наглядности приведем наиболее очевидные примеры дескрипторов (как и прежде все примеры взяты из Тезауруса Аналитической библиографической БД ЦГПБ им. В. В. Маяковского, Санкт-Петербург): АВАРИИ, БИОГРАФИИ, ИСТОРИЯ, РЕСТАВРАЦИЯ, ЧЕЛОВЕЧЕСКИЙ ФАКТОР, ЮБИЛЕИ.

К выводу о невозможности полноценного отражения терминов тезауруса в иерархическом по своей природе классификационном ИПЯ (на примере рубрикатора ИНИОН) пришли специалисты ИНИОН РАН при создании тезауруса по политологии. Например, печатная версия тезауруса в качестве впомогательного аппарата содержит систематический указатель (по Рубрикатору ИНИОН), в котором дескрипторы пришлось представить не в полном объеме и не во всей полноте связей (за счет сознательного ограничения числа дублирования дескрипторов).

(Подробнее см.: Базарнова С. В., Слива А. И. Использование классификационного языка в Автоматизированной информационной системе по общественным наукам ИНИОН РАН (на материале политологии) // Качество электронных ресурсов библиотек, музеев, архивов / ЦГПБ им. В. В. Маяковского. - СПб., 2009. - С. 193-214.)

ИНИОН РАН - давний лидер ведения библиографических баз данных с одновременным использованием нескольких лингвистических средств (тезауруса (основное средство), ключевых слов, предметных рубрик, индексов Рубрикатора ИНИОН). Именно это обстоятельство делает его опыт особенно интересным.

Заключение. В современной практике ведения информационно-поисковых БД ведется работа по установлению соответствия между терминами классификационных и предметизационных поисковых словарей. Цель такой работы связана с уменьшением интеллектуальных и временных затрат каталогизатора (оператора БД) на индексирование одного и того же документа средствами различных ИПЯ, требующих использования разных методик индексирования. В идеале, это должно обеспечивать возможность альтернативного вида поиска в одном информационном массиве, "переводимость" поисковых образов чужих библиографических массивов (при международном обмене, каталогизации заимствованием и т.п.). Перспективы использования авторитетных/нормативных фалов, содержащих по признаку соответствия термины других ИПЯ требуют проведения разнообразных опытных исследований точности, полноты поиска, уровня информационных потерь и шума.



Редактировано 1 раз. Последний раз 28.01.2011 21:09 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 02, September, 2010 13:28

Недоработанность структуры рабочего листа ввода БД Тезаурус (TEZ) в ИРБИС ограничивает не только собственные возможности организаций по ведению своих тезаурусов, но и применения чужих. Например, таких авторитетных, как тезаурусы ИНИОН.

Примером служит тема "тезаурусы ИНИОН и ИРБИС" из раздела "Система ИРБИС в целом" (сент. 2009) [irbis.gpntb.ru]

Примечательно, что вопрос о внедрении (инсталляции) приобретенного (готового) тезауруса ИНИОН в БД ИРБИСа был даже не понят отвечавшим, не смотря на то, что вопрошавший участник дискуссии прикрепил файл с примерами дескрипторных статей.

Отвечавший (А. С. Карауш) показал в прикрепленном примере, что проблем с загрузкой библиографических данных у него нет. В этих примерах интереснее всего - поисковые образы документов: ключевые слова в поле 610 (т.е. примитивный путь обеспечения поиска, что называется "без заморочек" для того, кто создает базу данных).

К собственным сообщениям о требованиях к тезаурусу в АБИС добавлю ссылку на исследование ст. научного сотрудника ИНИОН РАН В. Б. Смиренского. Статья имеет универсальное значение для понимания сущности тезаурусов вообще, кроме того, показывает и специфику информационных потребностей в гуманиарных областях.

О структуре и функциональных требованиях к тезаурусу здесь сказано очень наглядно:

Смиренский В. Б. Ключевые слова, дескрипторы и концепты в тезаурусе по общественным наукам // Лингвистическое обеспечение информационных ресурсов библиотек, музеев, архивов и других учреждений культуры / ЦГПБ им. В. В. Маяковского. – СПб., 2008. – С. 206-216. – Примеч.: первоначально опубликовано на сайте конференции «Диалог» (2006): [www.dialog-21.ru]


Учитывая то обстоятельство, что ИРБИС относится к числу наиболее распространенных АБИС, задача доработки структуры рабочего листа БД Тезаурус (TEZ) и програмного сопровождения необходимых функций должна рассматриваться в качестве первоочередной.

Нерешенность этой проблемы тормозит применение на практике рациональных и перспективных средств работы с электронными массивами данных, ограничивает возможности применения ИРБИС для решения задач информационного обеспечения специалистов (да и широких кругов читателей).

В свою очередь, решив положительно функционирование модуля "Тезаурус", ИРБИС может занять "научный" сегмент рынка АБИС, вытеснив другие программные продукты. "Научный" сегмент, возможно, не такой массовый как сегмент публичных библиотек, но обладает, вероятно, большей надежностью и перспективой роста.



Редактировано 2 раз. Последний раз 03.09.2010 20:17 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 08, September, 2010 21:59

Литература по тезаурусам достаточно обширна, однако на 1990-е гг. приходится незначительное число публикаций. В это время массового создания баз даных библиотеки пошли по пути использования неконтролируемых ключевых слов, «заново открывая проблемы, решение которых описано в литературе 1960-1980-х гг.» (О. А. Лаврёнова).

Наиболее общие требования к содержанию, ведению и функциональным возможностям тезаурусов описаны в этих документах:

ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления // Сборник основных российских стандартов по библиотечно-информационной деятельности. – СПб.: Профессия, 2006. – С. 201-219.

Лаврёнова О. А. Методика разработки информационно-поискового тезауруса. - М. : Пашков дом, 2001. - 54 с. - Доступно также через Интернет: [dlib.rsl.ru] (Фрагмент см.: Библиотековедение. - 2000. - № 6. – С. 39-42).

Сукиасян Э. Р. Школа индексирования : практическое пособие. – М. : Либерея-Бибинформ, 2005. – 143 с.

Использование функциональных возможностей, отлично реализованных в модуле авторитетных файлов предметных рубрик в ИРБИС, важно (с учетом специфики тезауруса) применить в доработке модуля Тезаурус.



Редактировано 3 раз. Последний раз 22.06.2011 13:00 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 12, January, 2011 21:58

РЕШЕНИЕ ПРОБЛЕМЫ (подробнее см. в заглавной статье темы [irbis.gpntb.ru])

Аналитическая библиографическая БД ЦГПБ им. В. В. Маяковского с начала 2009 г. входит в число электронных ресурсов Корпоративной сети общедоступных библиотек (КСОБ) Санкт-Петербурга, создается с участием библиографов районных ЦБС Санкт-Петербурга, имеет общегородское значение. Основной поисковый словарь – тезаурус.

Эталон тезауруса ведется с 1994 г. в программе CDS/ISIS/M.

В 2006 г. основной массив лексики тезауруса введен в оболочку БД "Тезаурус" (TEZ) в ИРБИС – но до декабря 2010 г. использовался только как средство индексирования и поиска библиографических записей.

В декабре 2010 г., благодаря участию А. И. Бродовского (ГПНТБ России), массив лексики из БД "Тезаурус" (TEZ) вставлен в оболочку БД URUB ("универсальный рубрикатор").

Библиографы ЦГПБ и районных ЦБС Санкт-Петербурга работают в ИРБИСе в единой сети – реализация тезауруса в БД URUB на сервере КСОБ и его подключение к полю 965 "Дескрипторы" (АРМ "Каталогизатор") моментально ввела новшество в реальный производственный процесс публичных библиотек города.

URUB создан разработчиками ИРБИС специально для реализации различных контролируемых поисковых словарей и настраивается под различные задачи.

Использование URUB делает возможным полный перенос всего цикла работы с тезаурусом в ИРБИС – программу, в которой ведется собственно и библиографическая БД (ЭК).

Корректное отображение терминов тезауруса со всем комплексом смысловых связей стало возможным с помощью ИРБИС-навигатора на основе html (как в "поиске для умников"). ИРБИС-навигатор открывается теперь при обращении библиографа-каталогизатора к полю 965 "Дескрипторы" в процессе индексирования каталогизационных записей.

В служебные файлы, содержащие параметрические описания БД URUB, были внесены изменения, которые обеспечили:

- повторяемость поля для вышестоящего дескриптора;

- создание повторяющегося поля для нижестоящих дескрипторов (они отображаются в окне просмотра при создании/доработке нормативной записи, а при ее сохранении – заглавный дескриптор записи отображается в дескрипторных статьях этих терминов как вышестоящий);

- автоматическое включение заглавного дескриптора изменяемой/создаваемой нормативной записи в качестве ассоциативного во все дескрипторные статьи, заглавные термины которых внесены в поле ассоциативных дескрипторов данной записи (т.е. работает взаимная ссылка «см. также»);

- определение статуса записи (нормативная/ссылочная) путем заполнения поля "Отсылка "Смотри"";

- бывшее в URUB поле "Ключевые слова" переименовано в "Примечание", сделано повторяющимся (предполагается его использование для дефиниции (определения) термина).

НЕРЕШЕННЫЕ ЗАДАЧИ:

1. Первоочередная проблема - отображение дефиниций (определений терминов) в тезаурусе (при конвертировании данных из БД "Тезаурус" в оболочку БД URUB эта информация не попала в состав записей) – наличие определения конкретизирует содержание дескриптора и делает его выбор библиографом-каталогизатором более осмысленным в процессе создания поискового образа документа;

2. Необходимо разделить синонимы-аскрипторы (ссылки "см. ") по соответствующим категориям, для чего создать отдельные поля в структуре рабочего листа для:

- простых синонимов (заменяются одним дескриптором);

- синонимов, передаваемых комбинацией дескрипторов (все указанные термины должны включаться в поисковый образ документа) – в окне просмотра они должны отображаться с комментарием "Смотри комбинацию";

- синонимов, передаваемых одним из предложенных альтернативных дескрипторов (в поисковый образ библиограф-каталогизатор включает наиболее адекватный термин) - в окне просмотра они должны отображаться с комментарием "Смотри альтернативно".

См. прикрепленный файл с примерами "ВИДЫ СИНОНИМИЧЕСКИХ СВЯЗЕЙ В ТЕЗАУРУСЕ.doc"

3. Необходимо добавить в рабочий лист БД URUB служебное поле «Вид – Дескриптор (1) / Недескриптор (0)» как в БД "Тезаурус" – это позволит редактору тезауруса быстро выделять в массиве данных два типа записей.
С этой задачей связана проблема обеспечения функции последовательного поиска в БД URUB.

4. Необходимо также предусмотреть в составе рабочего листа тезауруса, реализованного в URUB, полей для иноязычных аналогов дескрипторов (английских, немецких) и полей для иноязычных комментариев – эта задача "на вырост".

Завершение создания эффективно работающего поискового механизма повысит привлекательность и качество использования АБИС ИРБИС! Остается надеяться на промышленную реализацию данной разработки в последующих версиях/поколениях ИРБИС!

Вложения: ВИДЫ СИНОНИМИЧЕСКИХ СВЯЗЕЙ В ТЕЗАУРУСЕ.doc (158KB)  
Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 21, June, 2011 13:55

Существенно отредактирован текст заглавного (первого) сообщения темы (21.06.2011): кратко описано решение проблемы.

Специалисты ЦГПБ им. В. В. Маяковского (Санкт-Петербург) благодарны гл. программисту ИРБИС А. И. Бродовскому за серьезный вклад в разрешение многолетней проблемы.

Описание процесса решения проблемы кратко представлено в предыдущем январском сообщении.



Редактировано 2 раз. Последний раз 21.06.2011 13:57 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 21, June, 2011 15:13

Тема уже развилась практически в статью. По сему прикрепляю ее сверху. Пусть все читают.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 28, September, 2011 05:28

1. Просится не только в статью, но и в словарь или учебник по АБИС!
2. Дескрипторные ИПЯ проходил в институте в 80-е, значит, были известны и раньше.
[gsnti-norms.ru]
[www.aselibrary.ru]



Редактировано 4 раз. Последний раз 12.11.2011 11:38 пользователем Lavrinovich.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: library_gov (IP-адрес скрыт)
Дата: 31, October, 2011 20:28

Надо организовать вебинар по БД Тезаурус в ИРБИС! Просветить народ! Записать! Дать скачать!

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Mantis (IP-адрес скрыт)
Дата: 17, November, 2011 15:24

Мы решили забить в тезаурус новые дискрипторы, скажите, а как быстро обновится список дискрипторов после внесения новых записей, а то что-то он не отображает, то что я добавил?

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Mantis (IP-адрес скрыт)
Дата: 17, November, 2011 16:53

Хотя вот, в каталогизаторе все хорошо, начали отображаться добавленные, но вот в веб ирбисе ничего, скажите, они вообще там появтся или надо будет переустанавливать веб оболочку?

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Gena (IP-адрес скрыт)
Дата: 17, November, 2011 19:36

Если вы все делаете правильно, то с момента нажатия кнопки "сохранить" новые данные доступны в Вебе или в Каталогизаторе. Кеширование баз не происходит. Если данные не отображаются, значит вы что-то не так вводите, или не так ищите

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Mantis (IP-адрес скрыт)
Дата: 18, November, 2011 14:07

а есть какие-то особые правила пополнения тезауруса? Может я и вправду что-то не так делаю, потому что уже сутки прошли а вебе ничего так и не добавилось.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 21, November, 2011 16:55

Статья явно просится в новый раздел "Лингвистическое обеспечение", который я давно предлагал здесь устроить. Туда же и вопросы о КС и ПР и прочее.
А также нужен, может быть, раздел "MARC-форматы и стандарты"...

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Mantis (IP-адрес скрыт)
Дата: 22, November, 2011 11:28

Ну так, что? Никто мне не ответит? Неужели после каждого пополнения тезауруса надо заново ставить web оболочку?

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Gena (IP-адрес скрыт)
Дата: 22, November, 2011 13:23

Пришлите вашу БД Тезауруса мне на почту и укажите, какие именно вы добавили термины



Редактировано 1 раз. Последний раз 22.11.2011 13:23 пользователем Gena.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 21, December, 2011 13:20

Конечно, это статья, а не заметка, надо только еще немного дописать. А вот где бы опубликовать? Для журналов слишком узкая тема. Лучше всего в Вики-ИРБИС или на library.ru?



Редактировано 1 раз. Последний раз 24.01.2012 07:27 пользователем Lavrinovich.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 26, December, 2011 15:10

Вариант заглавной статьи данной темы только что опубликован:

Ведение политематического тезауруса в системе автоматизации библиотек ИРБИС : опыт Центральной городской публичной библиотеки им. В. В. Маяковского / И. Е. Прозоров, Е. П. Здрелюк // Научные и технические библиотеки. - 2011. - № 11. - С. 114-123.

Работа с тезаурусом в URUB в ИРБИС в рамках корпоративного ведения электронных ресурсов публичными библиотеками Санкт-Петербурга идет успешно.

Окончательное решение проблемы требует доработки небольших, но достаточно важных вопросов:

- ввести в состав рабочего листа URUB поля для систематических и категориальных интексов и обеспечить поиск по этим признакам. Они обеспечивают сортировку терминов по отраслевому признаку и категориям (явления, процессы, вещи...) - важный инструмент для редактора БД тезауруса;

- обеспечить возможность вывода тезауруса в текстовые файлы (согласно ГОСТу) в виде: 1) лексико-семантического указателя (в алфавите всех словарных статей, дескрипторных и недескрипторных, с отражением в рамках каждой статьи связей между терминами; 2) систематического указателя (по систематическим индексам); 3) категориального указателя;

- обеспечить постоянство алфавитного порядка вывода терминов при использовании тезауруса в "поиске для умников" (вероятно, вопрос чисто технический);

- обеспечить автоматическую корректировку во всей базе тезауруса при удалении/изменениях данных в одной из словарных статей тезауруса: например, удаляя ассоциативную ссылку в одной статье (поисковый термин из категории "см. также") необходимо обеспечить автоматическое удаление обратной ссылки из связанной статьи: сейчас это приходится делать вручную. Например, удалив, из дескрипторной статьи АВТОРСКОЕ ПРАВО из числа терминов "См. также" термин ЭЛЕКТРОННАЯ ПОДПИСЬ, мы могли бы получить удаление из статьи ЭЛЕКТРОННАЯ ПОДПИСЬ термина АВТОРСКОЕ ПРАВО из перечня терминов "См. также".

Но, повторюсь, принципиально вопрос о ведении тезауруса в ИРБИС решен.

Что касается высказанной выше мысли об организации специального раздела ИРБИС-форума по лингвистическому обеспечению - это очень хорошее предложение: все рассыпанные по веткам форума темы по ключевым словам, предметным рубрикам, классификациям, тезаурусам были бы собраны вместе - это достаточно специфическое направление.

Радует интерес к теме со стороны участников форума. Некоторые из последних сообщений темы нужно прокомментировать, но чуть позже.



Редактировано 1 раз. Последний раз 23.05.2012 20:42 пользователем Иван Евгеньевич.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 24, January, 2012 07:29

Наконец-то получила поддержку идея раздела "ЛО"!

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 09, February, 2012 09:35

Для сравнения: большие проблемы с тезаурусом
[www.informsystema.ru]

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Иван Евгеньевич (IP-адрес скрыт)
Дата: 12, February, 2012 14:13

Да, проблемы с тезаурусом интересные. Дискуссия на informsystema.ru - 2006 года, интересно, что делают ее участники сегодня?

Хочется прокомментировать 2 аспекта:

- нерешенность в АБИС вопросов ведения тезаурусов.
Разработчик справедливо отметил сложность тезауруса, объяснив этим неразработанность этого вопроса в своей АБИС: даже подключение готового тезауруса рассматривается как проблема, требующая индивидуальной отладки, а о самостоятельном ведении собственного словаря речи не идет.

По разным причинам разработчики АБИС в свое время учли возможность ключевых слов и предметных рубрик, а тезауруса - нет, хотя его структура и функции в общих словах прописаны соответствующим ГОСТом.

Практика работы отечественных информационных служб 1960-х - 1980-х гг. создала теоретически обоснованный эффективный механизм организации и поиска данных - тезаурусы. Процесс массовой автоматизации отечественных библиотек в 1990-е - нач. 2000-х совпал с неготовностью библиотечного сообщества (в массе своей) решать вопросы эффективности поиска новыми средствами и - с неготовностью программных средств обеспечивать эти процессы. По существу, электронный каталог до сих пор во многом используется как инструмент учета материальных ценностей (книг, иных документов) и путеводителя по фонду (и в меньшей степени - по содержанию документов этого фонда), а также - средства автоматизированного ведения карточного каталога (библиотечный почерк сейчас по-моему уже не преподают первокурсникам). Каталогизатору не столь существенно как будут искать книгу, сколько - заполнить поле предметных рубрик (в лучшем случае - двумя рубриками).
Несколько иначе - в аналитических базах данных: задача их ведения требует более ответственного подхода к раскрытию содержания. Но, ключевые слова (даже если их присваивать много и в разных вариантах, как в проекте МАРС АРБИКОН) - не панацея, хотя за неимением лучшего - работающее средство.
Создание URUB в ИРБИСе - палочка-выручалочка для создания и ведения СВОИХ (поисковый словарь должен быть адекватен информационному массиву) различных лексикографических баз данных.

- второй аспект. Какой бы тезаурус (свой, приобретенный) мы ни использовали, его работа будет реально полезной, только тогда, когда поисковый образ документа и поисковый образ запроса будут строиться на основе одного и того же словаря - этого самого тезауруса. А, значит, документы (библиографические записи, текстовые массивы) должны быть проиндексированы этим тезаурусом.

Re: Тезаурус в ИРБИС: проблемы применения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 15, February, 2012 13:53

Тема (или темы) явно относятся к АБИС вообще и даже шире...

irbis_arbat@mail.ru

Страницы: 1234>>
Страница: 1 из 4


Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.