Кирилл Соколинский (СЗТУ) написал(а):
> Индексированию подвергается словарь. Сравните
> ссылки, которые генерирует текущая версия (в
> которой, кстати, стоят файлы защищающие от
> индексирования)
Что-то мне мой небольшой опыт подсказывает, что Гугл слегка умеет обходить эту защиту. Словарь он ест только в путь. Чего он не умеет (пока) это листать страницы при множественном выводе (только первые 20 штук).
А по поводу обсуждаемой темы хочу посоветовать обратиться к Инструментам Google для вебмастеров. Там есть много возможностей управлять тем, что индексируется, например, можно исключать из поиска некоторые результаты.
В описанном случае, скорее всего, гугл стянул страницу по термину словаря "ЛІЦЕЙ", а указанная в запросе книга там тогда была. Сейчас словарь обновился и книга "уплыла" на другую страницу.
С гуглом так дела не водят. Он не всегда знает, что у Вас база обновилась.
Вот пример Вашей очень плохой ссылки [
irbis.zu.edu.ua]
которую выдает гугл по поиску той же книги. Выдает он правильно, только формат стоит fullw_print, а это значит, что выскакивает диалог печати и это предназначено для вывода на печать, а не в просмотр.
Из рекомендаций, сделайте файл robots.txt в корне сайта, как, например, обсуждалось в этой: [
irbis.gpntb.ru] теме, зарегистрируйтесь в Гугл инструметах для вебмастеров и посмотрите, что и как в ищут в Вашей библиотеке через гугл.
З.Ы. Как общее замечание для разработчиков: по-моему, стоило бы ввести в код страниц параметры, управляющие кэшированием или временем действительности страниц, тогда бы гугл не хранил так долго устаревшие страницы.
З.З.Ы. Хотя с другой стороны он тогда чаще бы их проверял... Вобщем, как кому нравится.