Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 25, November, 2010 14:59

в ЭК к некоторым записям прикреплены ссылки на внешние объекты, которые находятся не в корневой папке базы, а например вот по такому пути:

c:\IRBIS64\Datai\КАКАЯТО_БАЗА\ПОЛНЫЙ ТЕКСТ\А\123.doc

далее, когда в администраторе полных текстов выбираю "Добавить тексты из ЭК" нахожу файл КАКАЯТО_БАЗА.par начинается процесс добавления, но документы которые находятся не в корневом каталоге базы не добавляются, как это починить?



Редактировано 1 раз. Последний раз 25.11.2010 23:50 пользователем kkk.

Re: добавление текста из ЭК
Пользователь: ochagova (IP-адрес скрыт)
Дата: 25, November, 2010 15:48

А впереди есть имя машины?
В вашем случае можно использовать относительный адрес.
Прочитайте заметку "Внешние объекты....."

Re: добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 25, November, 2010 23:58

я и использую относительный адрес, тоесть в приведённом мной примере в записи в поле 951 у меня такая строка:

A^ПОЛНЫЙ ТЕКСТ\А\123.doc,

тоесть тут всё хорошо, из каталогизатора доступ есть, но проблема вот в чем, если добавать этот документ в полнотекстовую базу при процессе добавления он не добавляется )

я пробовал перемещать его в корневую директорию базы тоесть путь у документа будет вот такой:

c:\IRBIS64\Datai\КАКАЯТО_БАЗА\123.doc (в записи, в поле 951:A^123.doc)
тогда все работает и текст находится

как сделать так, чтобы документ при добавлении из ЭК в полнотекстовую базу добавлялся и из поддиректорий?

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 29, November, 2010 11:29

Действительно, есть такая проблема. Я взял на заметку, будем разбираться.

Re: добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 29, November, 2010 12:04

спасибо



Редактировано 1 раз. Последний раз 06.12.2010 13:44 пользователем kkk.

Re: добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 06, December, 2010 13:44

можете сказать примерные сроки решения проблемы?

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 06, December, 2010 16:11

До завтра постараюсь решить или назвать срок решения.

Какая у вас версия полнотекстового ИРБИС?

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 06, December, 2010 17:04

Проблема решена. Необходимо знать вашу версию.

Re: добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 07, December, 2010 11:49

2009.1

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 07, December, 2010 16:01

Исправленный .exe файл полнотекстового АРМ Администратор версии 2009.1 выложен на ftp. Если будут вопросы по получению обновления, пишите личное сообщение.

Re: добавление текста из ЭК
Пользователь: kkk (IP-адрес скрыт)
Дата: 08, December, 2010 12:53

спасибо, все заработало

Re: добавление текста из ЭК
Пользователь: whim (IP-адрес скрыт)
Дата: 08, February, 2011 07:00

Здравствуйте!
У меня такая же проблема.
Файлы хранятся в \IBIS\book\. Открываю АРМ Администратор полнотекстовый 2010.1. перехожу на вкладку "внешние объекты электронного каталога", нажимаю кнопку "добавить". мне предлагается выбрать файл. тип файла стоит "Параметрический файл БД" захожу в директорию IBIS. там только один файл данного типа PRKKK, выбираю его(за отсутствием других вариантов) нажимаю "открыть". Выдается сообщение "Документы успешно добавлены", но никаких документов при этом не появляется ни в списке Администратора ПБД, ни вообще в ПБД. Может, я что-то делаю не так?

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 09, February, 2011 17:45

Вы действуете неправильно. Если вы хотите добавить внешние объекты из базы IBIS, то при выборе параметрического файла БД вам не следует заходить в папку IBIS, вам необходимо в папке DATAI выбрать файл IBIS.PAR.

Re: добавление текста из ЭК
Пользователь: whim (IP-адрес скрыт)
Дата: 10, February, 2011 11:39

спасибо ) действую так, потому что четкой инструкции, подкрепленной иллюстративным материалом нет ((

И еще такой вопрос: при повторном добавлении текстов из ЭК каждый раз добавляются:
а) только новые тексты
б) те, которые уже есть в полнотекстовой БД заменятся, новые допишутся
в) те, что были продублируются(т.е укажется что они дублетные и удалятся), новые-допишутся



Редактировано 2 раз. Последний раз 14.02.2011 03:39 пользователем whim.

Re: добавление текста из ЭК
Пользователь: ochagova (IP-адрес скрыт)
Дата: 10, March, 2011 13:55

а) да, "новость" определяется по имени внешнего объекта (поле 951)
б) нет
в) нет

Re: добавление текста из ЭК
Пользователь: tvjirbis (IP-адрес скрыт)
Дата: 02, February, 2012 19:34

А если в качестве адреса использовать URL(http://...)?
У меня тоже не добавляется.
Ирбис 2010.1
Сорри, если где-то уже есть ответ. Искал долго по всем топикам - не нашёл.
Инетовский урл даёт возможность привязаться к авторизации, например, университетского портала достаточно просто и защищать от неавторизованного доступа довольно надёжно. При этом нет ограничений на то откуда этот доступ осуществляется.



Редактировано 1 раз. Последний раз 05.02.2012 23:08 пользователем tvjirbis.

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 07, February, 2012 17:52

Если я правильно вас понял, вы говорите о ситуации, когда в некотором исходном электронном каталоге используются URL ссылки на тексты. И на основе данного ЭК создаётся полнотекстовая база данных.

Такие тексты, на которые есть URL-ссылка должны попадать в полнотекстовую базу данных и словарь. Если у вас этого не происходит, вероятно дело в том, что при добавлении текстов в ПБД из ЭК не доступен Интернет или данные тексты.

Если проблема не в этом, пишите, будем разбираться.

Re: добавление текста из ЭК
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 08, February, 2012 09:34

Во время прошлого обучения Администратору провел тест с режимом темы. В каталоге IBIS есть документы с прикрепленными ссылками на [gpntb.ru] и еще куда-то. Тест показал, что интернет-ресурсы не подвергаются индексированию. Это очень печально, потому что никакой сложности в выгрузке открытых интернет-ресурсов в общем-то нет. Не сложно использовать для этого wget, получая на выходе временные HTML, DOC, RFT, DJVU, PDF файлы. Хотя бы открытые для начала.

Re: добавление текста из ЭК
Пользователь: tvjirbis (IP-адрес скрыт)
Дата: 09, February, 2012 09:36

SokV написал(а):
-------------------------------------------------------
> Если я правильно вас понял, вы говорите о
> ситуации, когда в некотором исходном электронном
> каталоге используются URL ссылки на тексты. И на
> основе данного ЭК создаётся полнотекстовая база
> данных.
Угу, так и есть.

> Такие тексты, на которые есть URL-ссылка должны
> попадать в полнотекстовую базу данных и словарь.
> Если у вас этого не происходит, вероятно дело в
> том, что при добавлении текстов в ПБД из ЭК не
> доступен Интернет или данные тексты.
Не попадает, в том-то и дело. И инет и тексты все на месте. Правда доступ к ним строго авторизованый. Возможно проблема в этом, но как тогда сделать, чтобы и урл засасывался и виден был как ссылка на инетовский урл, а не на локальный или NB адрес?

> Если проблема не в этом, пишите, будем
> разбираться.


Если я ставлю в поле урла полный локальный путь "C:\...", то всё нормально. В полнотекстовой базе это попадает в 952^B(кстати почему не 951^B?) и отображается как локальная ссылка т.к. урла не импортируется, его там просто нет. А мне надо, чтобы были именно инетовский адрес. Так может и в каталогизаторе забивать поле 951^B(в форме сейчас предлагаются для заполнения только ^A ^I и ^T) локальным адресом, а не 951^I? Я думаю, это решит проблему т.к. позволит не оглядываться на танцы с бубном для авторизации по инет урлу, т.к. есть локальная ссылка. Для той ситуации, которую привёл Максим(доступ удалённый и файла нет локально), то она должна срабатывать только, если есть урл, но нет локальной сссылки.

Оно, конечно частным порядком решается подстановкой параметров в irbis_server.ini типа:
FullTextPathDbn=С:\\Fulltext\\
FullTextPathWeb=http://lib.omgpu.ru/FullText/
Но это решение только для случая, когда все полные тексты свалены в один каталог. А если локальные пути разные и урлы тоже разные? Вот тут и поможет введение поля 951^B, коего сейчас не предлагается для ввода каталогизатору. Если кто уже решал таку проблему - поделитесь плиз. Лучше, конечно получить это от разработчиков, чтобы не править каждый раз при переходе на новую версию. Я так понимаю, что поправить там всего лишь менюшку ввода в каталогизаторе, да скрипт переноса из каталога в полнотексты. Если не будет ответов, то делать мне всё равно прийдётся, но времени много уйдёт на разбирательства и отладки. А дел и других - по уши. Если бы разработчики подсказали какие файлы править, то я бы и сам справился.
Спасибо, тем, кто откликнется.



Редактировано 1 раз. Последний раз 12.02.2012 18:49 пользователем tvjirbis.

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 21, February, 2012 13:29

В ИРБИС осуществляется индексирование полнотекстовых документов, размещённых в Интернете. Например, у меня без проблем осуществляется индексирование документа [ftp.gpntb.ru]
При этом в 952 поле ^Iftp://ftp.gpntb.ru/pub/irbis/irbis64_2008.doc^Birbis64_2008.doc : [ftp.gpntb.ru]

Возможно, недоразумение возникает из-за существующих ограничений на вид URL ссылки. АРМ Администратор перед индексированием сохраняет файл локально на диске, при этом тип файла определяется по имени, и предполагается, что URL завершается именем файла. В противном случае URL ресурс не индексируется. Если такое правило не устраивает, можно подумать как сделать иначе.

Интернет ресурсы в общем случае действительно не подвергаются индексированию. Мы не конкурируем с Гуглом или Яндексом )))

tvjirbis

Какого вида URL вы пытаетесь использовать, можно пример?

Re: добавление текста из ЭК
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 21, February, 2012 15:28

По поводу конкуренции.
И не нужно с ним конкурировать. Если документ прикреплен, значит он кому-то нужен и его нужно проиндексировать.

По поводу правила.
А если в URL указывается еще и строка запроса, то такой URL тоже не валидный? Что-то как-то сложно. А просто запросить у сервера то, что этому URL он может выдать, никак нельзя?

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 24, February, 2012 16:25

Да, думаю можно будет сделать доработку, где вид возвращаемого по URL контента будет определяться по заголовку Content-type ответа сервера. Я займусь этим.

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 27, February, 2012 13:36

Я снял ограничения на вид URL, о которых говорил выше. Вид возвращаемого по URL контента определяется по заголовку Content-type.

Максим, спасибо за замечания!

Обновлённая версия входит в новые поставки 2011.1. Для тех, кто получил версию 2011.1 ранее, обновление предоставляется по запросу, необходимо обратиться к Бродовскому Александру Иосифовичу или ко мне.



Редактировано 1 раз. Последний раз 28.02.2012 12:51 пользователем SokV.

Re: добавление текста из ЭК
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 27, February, 2012 18:06

Пока не вижу ничего на FTP. Если не сложно, вышли ссылку на новый Администратор в личные сообщения.



Редактировано 1 раз. Последний раз 27.02.2012 18:06 пользователем Панев Максим.

Re: добавление текста из ЭК
Пользователь: tvjirbis (IP-адрес скрыт)
Дата: 11, March, 2012 21:08

to SokV

Дело в том, что проблема не в том, чтобы проиндексировать документ, которого нет "здесь", т.е. локально на сервере, где происходит индексация, а в том, что индексировать надо то, что прилетает из каталога по импорту(это всегда есть локально). А в каталоге доступны для заполнения подполя ^A ^I и ^T. Ссылка на файл в подполе ^I может быть либо локальной C:\FullText\Document.pdf или глобальным урлом [lib.omgpu.ru]
Для машины, на которой происходит индексирование эти два пути по сути локальные. Просто локальный каталог, где свалены полнотекстовые документы C:\FullText отображён на каталог веба, чтобы можно было раздавать этот документ через инет с парольной авторизацией.
При вбивании этой ссылки в каталожную карточку как локальной C:\FullText\Document.pdf - всё здорово. И индексация проходит и урлы полнотекстовые на раздачу идут нормально, когда прописываешь
FullTextPathDbn=С:\\Fulltext\\
FullTextPathWeb=http://lib.omgpu.ru/FullText/
Но здорово всё ровно до того момента, пока всё полнотексты лежат в одном месте т.е. в C:\FullText\
А если в разных папках? Или на разных серверах? И вот тут уже есть необходимость вводить в ^I непосредственно инетовский урл, а не локальную ссылку, а её указывать отдельно. А урл часто подразумевает авторизацию и не пускает напрямую к файлу. Но как быть с индексацией? Вот здесь уже есть необходимость в ссылке локальной или NB, которая не видна из инета, но доступна внутри.
При импорте в полнотекст из каталога должна работать простая логика: если есть локальная ссылка(не в подполе ^I, а где-то ещё, например ^B), то для индексации документа используется она, а если если доступен только урл(или локальная ссылка в подполе ^I), то пытаться индексировать через неё. Это оптимальный вариант для рассредоточенного хранения полнотекстовых документов на внутренних серверах при сохранении единообразия урлов в вебе полнотекстов и каталоге(оттуда тоже можно будет получать доступ к документам по урлу с разграничением доступа, а не по локальной ссылке, которая на вебе каталога ещё и работать не будет!)

SokV написал(а):
-------------------------------------------------------
> В ИРБИС осуществляется индексирование
> полнотекстовых документов, размещённых в
> Интернете. Например, у меня без проблем
> осуществляется индексирование документа
> [ftp.gpntb.ru]
> При этом в 952 поле
> ^Iftp://ftp.gpntb.ru/pub/irbis/irbis64_2008.doc^Bi
> rbis64_2008.doc :
> [ftp.gpntb.ru]
У меня проблема в другом.
Суть не в том индексируется ли удалённый документ, мне это, в общем-то, и не надо, а в том, что
1. есть внутренний доступ и есть внешний и валить их в кучу не очень хорошо
2. неплохо бы соблюсти хоть какое-то единообразие при доступе к полнотексту из карточки каталога(и из веба и из арма) и собственно полнотекстового веба, а это возможно, только когда подполе ^I содержит именно урл, а не локальную ссылку, но здесь вступают противоречия с необходимостью индексации документа, описанные выше

> Возможно, недоразумение возникает из-за
> существующих ограничений на вид URL ссылки. АРМ
> Администратор перед индексированием сохраняет файл
> локально на диске, при этом тип файла определяется
> по имени, и предполагается, что URL завершается
> именем файла. В противном случае URL ресурс не
> индексируется. Если такое правило не устраивает,
> можно подумать как сделать иначе.
Я думаю, в моём случае это не играет роли т.к. локальная ссылка в подполе ^I индексирует файл нормально, а индексировать чужие файлы мне, пока по крайней мере, не понадобися.

> Интернет ресурсы в общем случае действительно не
> подвергаются индексированию. Мы не конкурируем с
> Гуглом или Яндексом )))
Как бы и не рвусь :))

> tvjirbis
>
> Какого вида URL вы пытаетесь использовать, можно
> пример?
Угу выше всё, вроде и описал. Если чего ещё неясно объясню - не проблема :)

Re: добавление текста из ЭК
Пользователь: SokV (IP-адрес скрыт)
Дата: 20, March, 2012 10:34

Вы предлагаете в электронном каталоге помимо ссылок на внешние объекты в виде URL в подполе ^I храненить локальную ссылку для индексирования в некотором подполе? Получается что в ЭК эта локальная ссылка использоваться не будет, а понадобится только при импорте в полнотекстовую БД? Эта идея выглядит странно.

Можно попытаться проработать этот вопрос. Допустим, можно было бы добавлять локальную ссылку помимо URL непосредственно в полнотекстовую БД. Но нужно понимать, что этим кто то должен заниматься, и не вполне понятно как этот кто то будет это делать (искать нужные записи и сопоставлять URL и локальный путь). Может быть можно было бы придумать какое то правило (с использованием параметров ini файла), в соответствии с которым ИРБИС автоматически по URL получал бы локальный путь и\или наоборот. В любом случае, это должно быть общим решением, не под одну организацию.

Доработки в области ссылок на полные тексты - это дискуссионный вопрос. В этой теме с 2011 года есть ещё рассуждения об этом.

Мне кажется, для проблемы, описанной tvjirbis, есть ещё принципиально другой путь, не знаю, насколько он реализуем в вашем случае. Текст мог бы выдаваться без запроса пароля, если обращение происходит с сервера, на котором происходит индексирование.



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.