to SokV
Дело в том, что проблема не в том, чтобы проиндексировать документ, которого нет "здесь", т.е. локально на сервере, где происходит индексация, а в том, что индексировать надо то, что прилетает из каталога по импорту(это всегда есть локально). А в каталоге доступны для заполнения подполя ^A ^I и ^T. Ссылка на файл в подполе ^I может быть либо локальной C:\FullText\Document.pdf или глобальным урлом [
lib.omgpu.ru]
Для машины, на которой происходит индексирование эти два пути по сути локальные. Просто локальный каталог, где свалены полнотекстовые документы C:\FullText отображён на каталог веба, чтобы можно было раздавать этот документ через инет с парольной авторизацией.
При вбивании этой ссылки в каталожную карточку как локальной C:\FullText\Document.pdf - всё здорово. И индексация проходит и урлы полнотекстовые на раздачу идут нормально, когда прописываешь
FullTextPathDbn=С:\\Fulltext\\
FullTextPathWeb=http://lib.omgpu.ru/FullText/
Но здорово всё ровно до того момента, пока всё полнотексты лежат в одном месте т.е. в C:\FullText\
А если в разных папках? Или на разных серверах? И вот тут уже есть необходимость вводить в ^I непосредственно инетовский урл, а не локальную ссылку, а её указывать отдельно. А урл часто подразумевает авторизацию и не пускает напрямую к файлу. Но как быть с индексацией? Вот здесь уже есть необходимость в ссылке локальной или NB, которая не видна из инета, но доступна внутри.
При импорте в полнотекст из каталога должна работать простая логика: если есть локальная ссылка(не в подполе ^I, а где-то ещё, например ^B), то для индексации документа используется она, а если если доступен только урл(или локальная ссылка в подполе ^I), то пытаться индексировать через неё. Это оптимальный вариант для рассредоточенного хранения полнотекстовых документов на внутренних серверах при сохранении единообразия урлов в вебе полнотекстов и каталоге(оттуда тоже можно будет получать доступ к документам по урлу с разграничением доступа, а не по локальной ссылке, которая на вебе каталога ещё и работать не будет!)
SokV написал(а):
-------------------------------------------------------
> В ИРБИС осуществляется индексирование
> полнотекстовых документов, размещённых в
> Интернете. Например, у меня без проблем
> осуществляется индексирование документа
> [
ftp.gpntb.ru]
> При этом в 952 поле
> ^Iftp://ftp.gpntb.ru/pub/irbis/irbis64_2008.doc^Bi
> rbis64_2008.doc :
> [
ftp.gpntb.ru]
У меня проблема в другом.
Суть не в том индексируется ли удалённый документ, мне это, в общем-то, и не надо, а в том, что
1. есть внутренний доступ и есть внешний и валить их в кучу не очень хорошо
2. неплохо бы соблюсти хоть какое-то единообразие при доступе к полнотексту из карточки каталога(и из веба и из арма) и собственно полнотекстового веба, а это возможно, только когда подполе ^I содержит именно урл, а не локальную ссылку, но здесь вступают противоречия с необходимостью индексации документа, описанные выше
> Возможно, недоразумение возникает из-за
> существующих ограничений на вид URL ссылки. АРМ
> Администратор перед индексированием сохраняет файл
> локально на диске, при этом тип файла определяется
> по имени, и предполагается, что URL завершается
> именем файла. В противном случае URL ресурс не
> индексируется. Если такое правило не устраивает,
> можно подумать как сделать иначе.
Я думаю, в моём случае это не играет роли т.к. локальная ссылка в подполе ^I индексирует файл нормально, а индексировать чужие файлы мне, пока по крайней мере, не понадобися.
> Интернет ресурсы в общем случае действительно не
> подвергаются индексированию. Мы не конкурируем с
> Гуглом или Яндексом )))
Как бы и не рвусь :))
> tvjirbis
>
> Какого вида URL вы пытаетесь использовать, можно
> пример?
Угу выше всё, вроде и описал. Если чего ещё неясно объясню - не проблема :)