Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
Сомнения, вопросы и предложения
Пользователь: Алексей Лавринович (IP-адрес скрыт)
Дата: 29, December, 2004 14:58

Сомнения, вопросы и предложения о новых функциях ИРБИС64

1. Об автоматической классификации полнотекстовых документов «по признаку превышения общеупотребительной частоты». На похожем принципе основаны поисковые системы интернета, результат работы которых часто бывает анекдотическим или нулевым.
И неужели эта технология распространяется на гуманитарнцю и художественную литературу? Прмеров можно придумать сколько угодно. Например, в теологическом трактате может ни разу не встретиться слово «Бог», в лирическом стихотворении — «любовь» (любимое ключевое слово А. И. Вислого) и т. д. И наоборот — часто повторяется слово «библиотека», а речь идет не о библиотеке, а о программировании.
Видимо, это все-таки касается только научно-технической литературы, причем пользователь должен сначала сообщить системе предметную область (как при машинном переводе). Также, видимо, не обойтись без индексации «вручную», тем более что предусматривается «предварительная работа по созданию полнотекстовой базы данных и естественно-тематическая классификация текстов».
Когда-то слышал от А.И.Бродовского, идея индексирования полных текстов обсуждалась еще в 1970-е гг. и была отвергнута «по техническим причинам» (в буквальном смысле). Но сегодня должно хватить и места (на винчестерах) для индексных файлов, даже намного большего размера, чем файлы данных, и времени на их построение.

2. О тенденции любой информации объединяться в тематические группы «по интересам». Это значит, что книги на одну тему сами бегут на одну полку, а из политематической БД «похожие» записи сами себя отправляют в специализированную?

3. О «возможности находить тексты, близкие к заданному образцу. В качестве текста образца может выступать поисковый запрос читателя на естественном языке, произвольный полный текст (внешний по отношению к базе данных) или текст из базы данных»:
· запрос на естественном языке — это очень напоминает микрософтовскую «скрепку с глазами», ответы которой часто не имеют отношения к вопросу.
· полный текст — это напоминает мое предложение ввести режимы «Поиск похожих» и «Поиск похожих в интернете»

4. А как насчет смыслового анализа аудио-, видео- и графических объектов и их автоматической классификации и поиска?

Re: Сомнения, вопросы и предложения
Пользователь: Бродовский (IP-адрес скрыт)
Дата: 29, December, 2004 17:09

Все, что здесь написано очевидно имеет отношение к ПОЛНОТЕКСТОВЫМ БД, а это только лишь отдельная подсистема ИРБИС64 - поэтому для таких обсуждений надо завести отдельную тему.



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.