Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Web Ирбис и Z-Ирбис :  ИРБИС Irbis
 
Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: iLq (IP-адрес скрыт)
Дата: 23, March, 2010 08:47

Интересует такая ситуация: чтобы при запросе слова "качество" искало качество, качества, качественный и т.д. В инструкции указано, что ***S21P01=3 - то же, что 1 (терминами поиска являются слова, извлеченные из текста) и дополнительно -0 слова нормализуются (извлекаются основы слов).
Что означает "извлекаются основы слов"?
У меня при поиске "качество" и при включении "третьего правила" ищет только "качество" (ну и, если усечение включено, еще "качеством").

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 24, March, 2010 14:01

Поиск с усечением -- это поиск с учётом всех возможных окончаний введённых терминов.

Поиск с извлечением -- это поиск с усечением и сохранением лишь семантически значимых фрагментов введённых терминов.

Извлечение корректно выполняется только для русского языка, т.к. эта технология реализуется с помощью словарей.


Если запрос по ключевому слову "история" с усечением будет сформулирован как

<.>история$<.>

, то запрос с нормализацией будет выглядеть так

<.>истори$<.>

Т.е. окончание будет отброшено.


> У меня при поиске "качество" и при включении "третьего правила"
> ищет только "качество" (ну и, если усечение включено, еще
> "качеством").

При включении третьего правила поиск должен происходить по слову "качеств". Посмотри параметры поиска по ключевым словам в форме Расширенного поиска.



Редактировано 1 раз. Последний раз 24.03.2010 14:08 пользователем Кирилл Соколинский (СЗТУ).

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: iLq (IP-адрес скрыт)
Дата: 26, March, 2010 14:36

Кирилл, посмотрел в электронном каталоге ГПНТБ.
Не нашел отличий в параметрах от моего поиска (кроме префикса, конечно):
<input type="hidden" name="2_S21P01" value="3">
<input type="hidden" name="2_S21P02" value="1">
<input type="hidden" name="2_S21P03" value="TK=">

При запросе "качество", качествА уже не находит.
Кирилл, где искать причину проблемы?

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 26, March, 2010 21:52

Параметры абсолютно корректные. Думаю, какие-то проблемы при обработке формы.
Я проверил на твоём каталоге запрос:

[www.libvgu.org.ru]

Нормализация слва "история" до "истори" была выполнена.



Редактировано 2 раз. Последний раз 26.03.2010 22:09 пользователем Кирилл Соколинский (СЗТУ).

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: iLq (IP-адрес скрыт)
Дата: 26, March, 2010 23:09

Понял. Завтра еще перепроверю версию модуля.

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: iLq (IP-адрес скрыт)
Дата: 27, March, 2010 09:51

Кирилл, не могу понять, помоги, плиз.
Смотри: делаю, как ты посоветовал поиск с правилом извлечения №3 в каталоге в интернете:
[www.libvgu.org.ru]

И извлекает нормально.
Но делают точно такую же ссылку для внутривузовского каталога (у нас пока вот так организовано), то есть меняю только домен, и уже не извлекает.
[terminal.vgu]
Файлы cgiirbis_64.exe cgiirbis_64.dll IRBIS64.dll идентичные. Где ивкать причину такого поведения каталога не могу понять. Подскажи.

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 27, March, 2010 13:09

А как различаются INI файлы?
Почему в данном случае недостаточно одной копии системы и для внешних и для внутренних пользователей?

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: iLq (IP-адрес скрыт)
Дата: 27, March, 2010 17:35

Про копии системы сейчас вопрос решаем.
Было несколько причин. Одна из - методические пособия в электронном виде различались на "доступные в интернете" и доступные в сети ВятГУ. С технической практически решилось - сейчас будем делать одну точку доступа. Но вот с разграничением пользователей придется подумать.
Ини файлы посмотрю в понедельник, но не должны сильно отличаться.

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: PRM (IP-адрес скрыт)
Дата: 20, April, 2011 20:39

Столкнулись с проблемой в Web-ИРБИС 2010.1: в стандартном виде поиска по ключевым словам для слов на русском языке с длиной четыре символа (например, оканчивающихся на "а") не срабатывает нормализация (извлечение основы слова).
Скажите, пожалуйста, действительно ли ограничение на длину нормализуемого слова существует?

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: Кирилл Соколинский (СЗТУ) (IP-адрес скрыт)
Дата: 21, April, 2011 14:14

PRM написал(а):
-------------------------------------------------------
> Скажите, пожалуйста, действительно ли ограничение
> на длину нормализуемого слова существует?

Да, используется жесткая установка минимальной длинны усекаемого слова. Она должна быть больше 4 символов.

PS
Замечу, что проблема учёта морфологии будет решена в J-ИРБИС 2.0, над которым я сейчас активно работаю. Например, слово "шум", породит запрос:

(<.>K=ШУМ<.>+<.>K=ШУМА<.>+<.>K=ШУМУ<.>+<.>K=ШУМОМ<.>+<.>K=ШУМЕ<.>+<.>K=ШУМЫ<.>+<.>K=ШУМОВ<.>+<.>K=ШУМАМ<.>+<.>K=ШУМАМИ<.>+<.>K=ШУМАХ<.>)

Впрочем, выбор между усечением и морфологией пользователь сможет делать самостоятельно.

Re: Третье правило извлечения термина поиска из текста ***S21P01
Пользователь: PRM (IP-адрес скрыт)
Дата: 21, April, 2011 16:45

Кирилл Соколинский (СЗТУ) написал(а):
-------------------------------------------------------
>
> Да, используется жесткая установка минимальной
> длинны усекаемого слова. Она должна быть больше 4
> символов.

Возможно, для таких поисков выделим более ярким цветом поисковый запрос...

> PS
> Замечу, что проблема учёта морфологии будет решена
> в J-ИРБИС 2.0, над которым я сейчас активно
> работаю. Например, слово "шум", породит запрос:
>
> (<.>K=ШУМ<.>+<.>K=ШУМА<.>+<.>K=ШУМУ<.>+<.>K=ШУМОМ<
> .>+<.>K=ШУМЕ<.>+<.>K=ШУМЫ<.>+<.>K=ШУМОВ<.>+<.>K=ШУ
> МАМ<.>+<.>K=ШУМАМИ<.>+<.>K=ШУМАХ<.>)
>
> Впрочем, выбор между усечением и морфологией
> пользователь сможет делать самостоятельно.

Спасибо!



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.