Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Web Ирбис и Z-Ирбис :  ИРБИС Irbis
 
Поиск по ключевым словам
Пользователь: gavrikov (IP-адрес скрыт)
Дата: 10, July, 2023 19:23

В Web-Ирбисе не идет поиск по «Ключевые слова (фраза)» — под «ключевым словом» подразумевается поиск по всем полям библиографического описания? Или только поиск по словарю «Ключевые слова» АРМ «Каталогизатор»? Просьба исправить ошибку или подсказать в какие файлы необходимо внести изменения?

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 11, July, 2023 10:15

gavrikov написал(а):
-------------------------------------------------------
> В Web-Ирбисе не идет поиск по «Ключевые слова
> (фраза)» — под «ключевым словом» подразумевается
> поиск по всем полям библиографического описания?
> Или только поиск по словарю «Ключевые слова» АРМ
> «Каталогизатор»?
Именно так.


Просьба исправить ошибку или
> подсказать в какие файлы необходимо внести
> изменения?

Re: Поиск по ключевым словам
Пользователь: gavrikov (IP-адрес скрыт)
Дата: 11, July, 2023 13:29

Что значит "Именно так"? Так работает по всем полям, что логично или только по полю ключевые слова?

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 11, July, 2023 15:30

gavrikov написал(а):
-------------------------------------------------------
> Что значит "Именно так"? Так работает по всем
> полям, что логично или только по полю ключевые
> слова?
Поиск идет по тем полям, которые подвергаются инвертированию с префиксом K=.
Если хотите знать, что это за поля, загляните в файл <имя_бд>.fst (<имя_бд>.ifs).
Если хотите изменить этот порядок, корректируйте соответствующим образом эти файлы.

Но главное в другом. Почему Вы не используете ПОЛНОТЕКСТОВЫЙ поиск ("Я ищу")? Он идет по ВСЕМ полям.

Re: Поиск по ключевым словам
Пользователь: А. Роман (IP-адрес скрыт)
Дата: 11, July, 2023 20:40

Alio написал(а):
-------------------------------------------------------
>
> Но главное в другом. Почему Вы не используете
> ПОЛНОТЕКСТОВЫЙ поиск ("Я ищу")? Он идет по ВСЕМ
> полям.

Потому, что пользователю необходим результат поискового запроса "кл. слова (фраза)" или "кл. слова в заглавии (фраза)", а полнотекстовый поиск дает не тот результат, который необходим пользователю, т.к. ищет термины в любых полях и в разных вариантах вхождения терминов (один термин в первом поле, второй во втором, третий в третьем или два термина в одном поле, а третий в другом и т.п.)

но главный вопрос: почему не работает штатный функционал?

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 11, July, 2023 22:01

А. Роман написал(а):
-------------------------------------------------------
> Alio написал(а):
> --------------------------------------------------
> -----
> >
> > Но главное в другом. Почему Вы не используете
> > ПОЛНОТЕКСТОВЫЙ поиск ("Я ищу")? Он идет по ВСЕМ
> > полям.
>
> Потому, что пользователю необходим результат
> поискового запроса "кл. слова (фраза)" или "кл.
> слова в заглавии (фраза)", а полнотекстовый поиск
> дает не тот результат, который необходим
> пользователю, т.к. ищет термины в любых полях и в
> разных вариантах вхождения терминов (один термин в
> первом поле, второй во втором, третий в третьем
> или два термина в одном поле, а третий в другом и
> т.п.)
Вы плохо знаете алгоритм полнотекстового поиска. Если найдется документ, в котором все указанные слова стоят РЯДОМ, то такой документ будет ПЕРВЫМ в выдаче. Для полнотекстового поиска нет понятия ПОЛЕ.

>
> но главный вопрос: почему не работает штатный
> функционал?
А это что значит?



Редактировано 1 раз. Последний раз 11.07.2023 22:09 пользователем Alio.

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 12, July, 2023 12:25

В связи с вопросом о поиске по КЛЮЧЕВЫМ СЛОВАМ и в частности о поиске по КЛЮЧЕВЫЕ СЛОВА (ФРАЗА) уместна маленькая лекция (для продвинутых пользователей)

Каждый термин в словаре (инверсном файле) имеет список ССЫЛОК, которые определяют участие данного термина в поиске.
Каждая ссылка имеет следующую структуру:

MFN/MM/OCC/NN

где:
MFN – mfn документа, из которого извлечен термин
MM – значение точки входа в соответствующей строке таблицы инвертирования (файл имя_бд.fst)
OCC – значение счетчика повторений
NN – порядковый номер термина в индексируемой строке

Поясним на примере.
В документе с номером 10 есть два повторения поля с меткой 1 следующего содержания:

мама папа сын
бабушка дедушка внук

В таблице инвертирования для этого поля есть строка:

100 8 (v1|%|/)

В этом случае термины получат следующие ссылки:

мама – 10/100/1/1
папа - 10/100/1/2
сын - 10/100/1/3
бабушка – 10/100/2/1
дедушка – 10/100/2/2
внук – 10/100/2/3

Если бы строка инверсии выглядела бы так:

100 8 (v1/)

то ссылки сформировались бы так:

мама – 10/100/1/1
папа - 10/100/1/2
сын - 10/100/1/3
бабушка – 10/100/1/4
дедушка – 10/100/1/5
внук – 10/100/1/6

Отсюда два важных вывода:
- счетчик повторений и порядковый номер термина ЗАВИСЯТ от наличия символа % (то есть счетчик повторений увеличивается всякий раз, когда встречается символ %, а порядковые номера при этом начинаются с единицы),
- а точка входа НЕ ОБЯЗАТЕЛЬНО совпадает с меткой поля.

Теперь поясним, что означает поиск по логике КЛЮЧЕВЫЕ СЛОВА (ФРАЗА).
При таком поиске будут выдаваться документы, в которых заданные ключевые слова (термины) имеют ссылки, у которых совпадают MFN, MM, OCC, а NN имеют значения ПО ПОРЯДКУ.
Обратимся к нашему примеру. В качестве запроса по логике КЛЮЧЕВЫЕ СЛОВА (ФРАЗА) задано

папа сын бабушка

В случае первого варианта инверсии документ с номером 10 НЕ БУДЕТ выдан - что является ПРАВИЛЬНЫМ результатом.
А в случае второго варианта инверсии документ с номером 10 БУДЕТ выдан – что является НЕПРАВИЛЬНЫМ результатом

Главный вывод: результат поиска по логике КЛЮЧЕВЫЕ СЛОВА (ФРАЗА) – так же как и по любым другим логикам – зависит ИСКЛЮЧИТЕЛЬНО от того, как построено ИНВЕРТИРОВАНИЕ, то есть от структуры файла <имя_бд>.fst

Re: Поиск по ключевым словам
Пользователь: А. Роман (IP-адрес скрыт)
Дата: 12, July, 2023 13:28

Александр Иосифович, спасибо большое за лекцию, но она не относится к сути заданного вопроса и описанной выше проблемы.
Пользоваться или нет полнотекстовым поиском решает пользователь и если ему нужнен конкретный результат запроса, то он вправе расчитывать на то, что форма поиска, предусматривающая возможность построения такого запроса будет работать.
Как Вы объясните то, что в АРМ Каталогизатор результат поиска не нулевой, а в Web-ИРБИС - 0 по запросу "кл.слова, фраза"? Разве это не ошибка Web-ИРБИС?
При этом запрос "кл.слова фраза в заглавии" - работает вполне корректно, если не считать того, что в Web-ИРБИС применяется морфология.
Скриншоты поисковых запросов прилагаю.

Вложения: Вологда-img-2023-07-12-13-20-00.png (618.5KB)   Вологда-img-2023-07-12-13-21-12.png (158.7KB)   Вологда-img-2023-07-12-13-22-21.png (210.9KB)  
Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 12, July, 2023 14:38

Интерфейс Web'а изменен. В частности, не видно строки с формулировкой запроса. Поэтому никакого ответа не будет.

Re: Поиск по ключевым словам
Пользователь: А. Роман (IP-адрес скрыт)
Дата: 12, July, 2023 15:22

Вот строка запроса:

Цитата:
http://ecat.cbs-vologda.ru/cgi-bin/irbis64r_plus/cgiirbis_64_ft.exe?isPersonalPanelOn=1&Z21ID=1021U0S204T7E1G113&I21DBN=BOOK_FULLTEXT&CHECKINDEX=&SEARCHIN=&USES21ALL=0&SEARCH_STRING=&FT_REQUEST=&FT_S21STR=&C21COM1=Искать&FT_PARAMS=&FT_DISTANCE=&S21CNR=5&FT_RESTRICT=1&AVT=&NAME_main=&NAME_S21STR=&NAME_S21P02=1&NAME_S21P03=T%3D&NAME_S21LOG=1&A1_main=&A1_S21STR=&A1_S21P01=2&A1_S21P03=R%3D&A34_main=&A34_S21STR=&A34_S21P01=2&A34_S21P03=V%3D&A35_main=&A35_S21STR=&A35_S21P01=0&A35_S21P03=MHR%3D&DAT_S21P06=&DAT_S21P07=&DAT_S21P03=G%3D&DAT_S21P02=1&DAT_S21LOG=5&DP_S21P06=&DP_S21P07=&DP_S21P03=DP%3D&DP_S21P02=1&DP_S21LOG=5&S21ALL=&variant_search_field_selector=%257B%2520%2522field_type%2522%2520%253A%2520%2522input%2522%252C%2520%2522parameters%2522%2520%253A%2520%2522S21P01%253D0%2526S21P03%253DK%253D%2526S21LOG%253D2%2526S21P02%253D0%2522%252C%2520%2522autocompleteType%2522%2520%253A%2520%2522wholeQuery%2522%2520%257D&VAR_main=древней+руси&VAR_S21STR=древней+руси&VAR_S21P01=0&VAR_S21P03=K%3D&VAR_S21LOG=2&VAR_S21P02=0&P21DBN=BOOK&FT_S21LOG=4&FT_S21P03=K%3D&FT_S21P01=3&S21STN=1&S21REF=10&S21FMT=briefHTML_ft&C21COM=S&S21COLORTERMS=1&FT_PREFIX=KT%3D

а на дистрибутивном варианте точно такая же картина. Проверяли схожие запросы в других инсталляциях Web-ИРБИС, где интерфейс не был изменен пользователем. Как только проверим результат работы на той же БД но в дефолтном исполнении Web-ИРБИС - сообщим о результате.



Редактировано 2 раз. Последний раз 12.07.2023 15:23 пользователем А. Роман.

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 12, July, 2023 16:12

Мне нужен пример на ДИСТРИБУТИВНОМ Web-ИРБИС64+, на дистрибутивной БД с использованием стандартного Windows сервера ИРБИС64 (в случае поиска по Каталогизатору)
Т.е. важно знать, какой Web используется: шлюзовой или на PHP
а в случае работы Каталогизатора - какой используется сервер ИРБИС64.



Редактировано 1 раз. Последний раз 12.07.2023 16:34 пользователем Alio.

Re: Поиск по ключевым словам
Пользователь: Куделя (IP-адрес скрыт)
Дата: 12, July, 2023 17:55

Поиск "А В" в вебе по сценарию "Ключ.слова (ФРАЗА)" это не поиск (A+B), это поиск именно "А В". То есть по логике результат запроса "Древняя русь" будет только в том случае если в БД есть 610 поле в котором так и написано "древняя русь". То, что вы хотите, это поиск "Ключ.слова (ВСЕ)"

Иркутская ОГУНБ
ИРБИС64.21Турбо
WebИРБИС-PHP

Re: Поиск по ключевым словам
Пользователь: А. Роман (IP-адрес скрыт)
Дата: 12, July, 2023 19:41

Куделя написал(а):
-------------------------------------------------------
> Поиск "А В" в вебе по сценарию "Ключ.слова
> (ФРАЗА)" это не поиск (A+B), это поиск именно "А
> В". То есть по логике результат запроса "Древняя
> русь" будет только в том случае если в БД есть 610
> поле в котором так и написано "древняя русь". То,
> что вы хотите, это поиск "Ключ.слова (ВСЕ)"

Максим, "Кл. слова (ВСЕ)" совсем не то что нужно пользователю, т.к. это дает результат не только "А Б", но и "А ... Б" где "..." может составлять любое количество других терминов, разделяющих А и Б в одном поле, а также А и Б в варианте "Кл. слова ВСЕ" могут быть в совершенно РАЗНЫХ полях, что совершенно не соответствует ожиданию и потребности пользователя, которому нужно чтобы термины были в любой строке в люмой ее части (или в заглавии в случае "кл. слова фраза в заглавии") но шли друг за другом.

Re: Поиск по ключевым словам
Пользователь: А. Роман (IP-адрес скрыт)
Дата: 12, July, 2023 19:56

Alio написал(а):
-------------------------------------------------------
> Мне нужен пример на ДИСТРИБУТИВНОМ Web-ИРБИС64+,
> на дистрибутивной БД с использованием стандартного
> Windows сервера ИРБИС64 (в случае поиска по
> Каталогизатору)
> Т.е. важно знать, какой Web используется: шлюзовой
> или на PHP
> а в случае работы Каталогизатора - какой
> используется сервер ИРБИС64.

Ну, это же Вы и сами можете у себя посмотреть и смоделировать. К слову, дистрибьюторам теперь ведь формально не разрешается ничего делать с дистрибутивами ИРБИС кроме как передавать пользователям... Да и какие-либо обязательства по тестированию ИРБИС из новых договоров новый менеджмент Ассоциации почему-то исключил...

Не совсем понял, что значит с использованием Стандартного Windows?
У ИРБИС разве есть ограничения к версиям Microsoft Windows выше 2008 ?

По БД ЭК тоже если записи в ней введены "без изысков", и она проиндексирована стандартными ifs|fst не понимаю чем она не подходит для диагностики проблемы?

В отношении того, что у пользователя: обычный TCP/IP сервер версии 2021.1_D1, ОС Microsoft Windows 10 Pro, Web-ИРБИС64+ cgi.



Редактировано 1 раз. Последний раз 12.07.2023 19:57 пользователем А. Роман.

Re: Поиск по ключевым словам
Пользователь: Alio (IP-адрес скрыт)
Дата: 12, July, 2023 20:35

А. Роман написал(а):
-------------------------------------------------------
> Alio написал(а):
> --------------------------------------------------
> -----
> > Мне нужен пример на ДИСТРИБУТИВНОМ
> Web-ИРБИС64+,
> > на дистрибутивной БД с использованием
> стандартного
> > Windows сервера ИРБИС64 (в случае поиска по
> > Каталогизатору)
> > Т.е. важно знать, какой Web используется:
> шлюзовой
> > или на PHP
> > а в случае работы Каталогизатора - какой
> > используется сервер ИРБИС64.
>
> Ну, это же Вы и сами можете у себя посмотреть и
> смоделировать.
Расскажите, как мне это сделать...



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.