Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Опыт и разработки пользователей ИРБИС :  ИРБИС Irbis
 
Ключевые слова
Пользователь: Ваан Авакян (IP-адрес скрыт)
Дата: 28, February, 2005 10:55

Кто может подсказать как формируются ключевые слова. Иногда ИРБИС берет из загаловка совсем непонятно что особенно при наличи иностраннх слов, например при загаловке "What you can do about asthma" слово "can" идет в ключевые а этого совсем не нужно.


Re: Ключевые слова
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 28, February, 2005 11:00

добавьте слово can в списко стоп-слов <имя БД>.stw (кажется)

Re: Ключевые слова
Пользователь: Ваан Авакян (IP-адрес скрыт)
Дата: 01, March, 2005 12:37

Максим наверно мой пример не очень правильный просто это не едениничный случай а что делать если в загаловке есть "От Алма-Аты..." откуда в ключевые идёт АТЫ или например CU2 берется Cu что абсолютно не нужно


Re: Ключевые слова
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 01, March, 2005 12:49

Тут ничего не поделаешь. Это же ключевые слова. Можно выделить ограничителями <...>, про это читайте документацию. Я вот только не помню, это действует в заголовке или нет. Вроде действует.

Re: Ключевые слова
Пользователь: Е. Негуляев (IP-адрес скрыт)
Дата: 01, March, 2005 14:08

Я сделал отдельный словарь для ключевых слов по 610 полю, а существующий в Ирбис словарь переименовал "По все полям". В результате нет нужды бороться с описанными аномалиями, в словаре "По всем полям" нормально воспринимаются все словоформы и есть еще один "чистенький" словарь только ключевых слов. Хочу заметить, что на больших базах, особенно однотипных документов, расширенное толкование словаря "Ключевые слова" приводит к очень большой выдаче, значительная часть которой может быть слабо релеванта запросу.


Re: Ключевые слова
Пользователь: Dream (IP-адрес скрыт)
Дата: 09, March, 2005 16:06

Это делается очень просто, если вы хотите. чтобы в словарь добавлялись только слова с определенного слова, например , из поля ненормированных слов(метка 610) , то вам нужно написать в файле
<имя базы>.fst следующую строчку
6610 6 '/K=/'(v610|%|/)
Эта строчка означает, что мы берем слова только из данного поля с меткой 610. Префикс К=, это префикс именно для этого поля, префикс для других полей можно посмотреть в соответствующем рабочем листе или ini-файле.

Re: Ключевые слова
Пользователь: Ваан Авакян (IP-адрес скрыт)
Дата: 10, March, 2005 11:55

>Префикс К=, это префикс именно для этого поля

Как я понял из *.fst Префикс К= идет как раз для всех полей
Но вот в чем проблема я поменял в ini фаиле ItemName0 с "ключевые слова" на "по всем полям" но АРМу Катологизатор это без разницы как это понимать и где менять чтобы Катологизатор (да и остальные тоже) это восприняли.


Re: Ключевые слова
Пользователь: Ваан Авакян (IP-адрес скрыт)
Дата: 14, March, 2005 13:25

Вопрос снят изменение с "ключевые слова" на "по всем полям" не воспринимают базы которие есть в пакете по умолчанию, и имеют свои .ini фаилы.
А вот внесении в <имя базы>.fst ногово префикса никак не выходит. Ввод строки 610 0 mhl,(|KW=|v610/) с соответствующемимы изменениями в *.ini никчему не проводит показывает пустую плоскость поиска может в ИРБИС64 есть какие то изменения касательно <имя базы>.fst .


Re: Ключевые слова
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 14, March, 2005 14:57

А словарь-то Вы заново создали?



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.