Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Общие вопросы АБИС :  ИРБИС Irbis
 
Увидеть каталог из глобальной сети
Пользователь: immortal (IP-адрес скрыт)
Дата: 07, July, 2009 22:20

Вот я тут подумал, у всех программ есть вэб поиска в электронном каталоге, неоднократно поднимался вопрос о индексации ЭК в поисковых машинах (яндекс, гугл) внимание вопрос: а у Вас индексируется ЭК? если да то камим образом.
Варианты предпологаемых ответов
- нет.
- нет, а оно нам надо?!
- нет, нам и не надо
- только полные тексты
- да, это стандартная функция программы
- да _________________ (описать механизм)
просто интересно, если у кого это реализовано, то интересно как, я например просто сделал ссылку "найти все записи"

а вобщето я белый и пушистый...



Редактировано 1 раз. Последний раз 09.07.2009 10:00 пользователем immortal.

Re: Увидеть каталог из глобальной сети
Пользователь: Konstantinus (IP-адрес скрыт)
Дата: 08, July, 2009 00:18

да, но нормально индексирует только Гугл.

Пример:
[www.google.com]

400 тысяч страниц в индексе

Re: Увидеть каталог из глобальной сети
Пользователь: immortal (IP-адрес скрыт)
Дата: 08, July, 2009 14:12

нет, я про индексирование записей ЭК. большинство ЭК представлены в интернет путем формы поиска с полем ввода запроса и кнопкой найти, но ни одна поисковая система не может вводить в это поле буквы и нажимать кнопку найти, следовательно записи ЭК не будут видны из поисковым машинам.

Проще говоря, у Вас в ЭК есть запись с автором Кушеев, заходим в гугл, пишем Кушеев, найдет эту запись?

Re: Увидеть каталог из глобальной сети
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 08, July, 2009 17:01

Если на сайте есть поиск по словарю, то проиндексируются все термины. Однако каталог сам по себе динамичен и в поисковики, стандартными средствами индексируя вашу страницу каталога, не дадут нормального результата.
По этому как вариант сделать ссылку с главной страницы, которая бы открывала страницу со списокм ссылок на все записи каталога. ПО крайней мере эти ссылки будут постоянными и со временем не потеряют своей актуальности.
Вообще в Крыму я слышал, что сейчас ведутся какие-то переговоры с Google как раз по поиску в электронных каталогах. Думаю стоит немного подождать и мы все увидим уже реализованным :).

Re: Увидеть каталог из глобальной сети
Пользователь: Alio (IP-адрес скрыт)
Дата: 08, July, 2009 17:51

Сводный каталог по НТЛ, который ведет ГПНТБ России, индексируется Google - у нас есть с ними соответствующая договоренность. Для этого мы предоставляем им БД в USMARC-XML формате.

Re: Увидеть каталог из глобальной сети
Пользователь: Konstantinus (IP-адрес скрыт)
Дата: 08, July, 2009 19:59

Ключевая фраза
Цитата:
Alio
у нас есть с ними соответствующая договоренность
А у простых веб-мастеров такой договоренности нет.
Поэтому нам остаеться только вариант предложенный Максимом.

Re: Увидеть каталог из глобальной сети
Пользователь: immortal (IP-адрес скрыт)
Дата: 09, July, 2009 09:58

на РБА-2009 я задавал вопрос про индексирование, в том, числе и рекламировал сделанный вэб поисковик свой, в котором реализовано как раз, так как описал Максим.
Но вот некоторые для того, чтобы поисковые машины искали записи (ну в основном конечно есть необходимость искать записи документов на электронном носителе, для получения доступа к ним из интернет) используют паралельно с ЭК ещё и програмное обеспечение специально для полнотекстовых и/или электорнных документов.
Я лично считаю это неверным, ибо электронный документ это абсолютно такой же документ как любой на другом носителе, и должен быть описан точно так же как и любой другой (естественно с заполнением соотв поля типа URL), хотя данный способ имеет место быть. Вопрос то не в том, как это сделать ,а в том, у кого как сделано, наверно надо было опрос сделать

Re: Увидеть каталог из глобальной сети
Пользователь: immortal (IP-адрес скрыт)
Дата: 09, July, 2009 10:01

Цитата:
индексируется Google - у нас есть с ними соответствующая договоренность
т.е. яндекс не найдет, или у гугла светится этот каталог для поисковиков?

Re: Увидеть каталог из глобальной сети
Пользователь: Konstantinus (IP-адрес скрыт)
Дата: 09, July, 2009 12:50

Там вообще все сложно.
Например у меня в базе 1000 записей. Но ПС может их получить:
1) как результат "псевдочеловеческого поиска" по моей базе - они этого делать не умеют
2) перейдя по ссылкам, например "поиск по словарю" - в глубь "по терминам", или через новые поступления и т.д.

По второму пункту, скажу так. Некоторые записи попадают в индекс несколько раз, некоторые ниразу.

Как я вижу будующее.
Человек ищет книгу, в результате он помимо результатов поиска получает предложения ее купить, или взять в ближайшей библиотеке.
Для этого должен быть согдан сервис, через который библиотеки смогут передавать ПС свои БД.
О подобном говорили в Крыму. Как я понял на базе ГПНТБ будет создан некий шлюз, через который Гугл будет получать информацию о книгах.

Из своих наблюдений скажу, что ни Рамблер ни MSN и другие поисковики вообше нормально веб-Инбис не индексируют.

Яндекс тоже не любить ссылки больше 40 символов. А посмотрите ссылку с веб-ирбиса...

Но направление правильное.

хотя я считаю что надо просто сделать инструмент, который совсем не сложен с техничнской точки зрения, а может работать уже сейчас. Жаль в Крыму небыло Константина Сбойчакова.
Его суть в том что надо свормировать сайтмап с всеми ссылками ЭК (точнее с результатами поиска в которых почередно будет отображена 1,2...n-я запись ЕК), и скормить его стандартными средствами ПС.


Что-то меня занесло

Re: Увидеть каталог из глобальной сети
Пользователь: immortal (IP-адрес скрыт)
Дата: 09, July, 2009 21:13

дак и получается, что лучше способа чем сделать ссылку "найти все записи" нет чтоли?

Re: Увидеть каталог из глобальной сети
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 10, July, 2009 10:27

Самый лучший способ - это чтобы ПС искали самостоятельно в каталоге, а не страницы индексировали. Но поскольку на данном витке развития это не возможно (случай, о котором рассказал АИ несколько другой), то ссылка "Весь каталог" является самой действенной мерой.

Re: Увидеть каталог из глобальной сети
Пользователь: IRBIS Ukraine (IP-адрес скрыт)
Дата: 19, December, 2009 16:37

Alio написал(а):
-------------------------------------------------------
> Сводный каталог по НТЛ, который ведет ГПНТБ
> России, индексируется Google - у нас есть с ними
> соответствующая договоренность. Для этого мы
> предоставляем им БД в USMARC-XML формате.

В базе же нет ссылок на веб-сайт.

Что происходит после индексации?

Re: Увидеть каталог из глобальной сети
Пользователь: Gena (IP-адрес скрыт)
Дата: 19, December, 2009 19:34

Александр Иосифович, а вы бы могли немного рассказать о вашем соглашении с Гуглом? Или это сугубо внутренняя информация? Может ли рядовая библиотека рассчитывать на подобное сотрудничество?

По поводу индексации Электронного каталога. Изучал этот вопрос и задал в Гугле поиск по описаниям книг, скопированых из Веб-Ирбиса. Гугл отозвался и вернул ссылки на наш Веб-Ирбис. Вот что удалось выяснить: у гугла есть собственный кеш и он сканирует и сохраняет себе в памяти страницы, созданные и загруженные кем бы то ни было. Как происходит перехват и сохранение динамически созданных страниц - не знаю, но то, что без каких либо заявок я смог получить от гугла 11 тысяч ссылок на наш каталог, это есть. С другой стороны, гугл самостоятельно проиндексировала и сохранил - это хорошо, но он же сохранил 11 тысяч ссылок, а не почти 30 тысяч, как должно было бы быть, если бы индексировались все существующие записи. Может стоит копать в сторону каких-то академических репозитариев и протоколов обмена? Есть же OAI и ему подобные. Вобщем, проблема остается и надо искать пути ее решения, потому что меня, к примеру, уже замучали индексом цитируемости и параноей с созданием по мимо привязанных к записям полных текстов еще и ведением внешнего репозитария, преимущество которого только в том, что он автоматически индексируется в ряде поисковых машин.

AVD System, Техническая поддержка, [www.open4u.ru]



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.