Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 16, February, 2006 21:16

Первое замечание: при поиске документов в каталоге остановка поиска возможна по Esc (упоминания об этом в интерфейсе при сканировании нет, а надо). После сканирования появляется окно добавления найденных документов в базу. В нем не работает кнопка "Прервать"!!!
Но это так, мелочи.
Хотелось бы иметь возможность выбора типов файлов, которые следует искать в каталоге. Ну вот не нужно мне, допустим заносить в базу HTML, нужны только DOC, PDF. Хотелось бы иметь возможность указать это. Кроме того, очень не редко, когда в базу пишется более 1000 документов. При выделении ПОС Эвристика ограничена 1000 значений. Тоже не удобно.

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 22, March, 2006 18:20

Еще предложение: при добавлении файлов в каталог необходима (очень-очень) проверка на существование добавляемого файла уже в каталоге. Дело в том, что файлы в каталог добавляются без ведома администратора. Следовательно в базу нововведенные файлы не помещаются. Так вот нужно, чтобы при указании какого-либо каталога (или файла) проводилась такая проверка, и если файл уже в базе, то его добавлять не нужно.

К тому же старое предложение по указанию масок добавляемых файлов остается в силе.

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 17, May, 2006 19:31

Я так и не разобрался, как работает АРМ ПТ Читатель. Что значит ссылка
<a href="http://IrbisServerFTR?com=smfn&dbn=TEXT&mfn=000061&REQKEYW=ABBOT%24">
Описание ПТ Администратора есть, а вот описания, как работает АРМ ПТ Читатель нет ВООБЩЕ!!! Судя по всему, там очень даже есть, о чем поведать.
Столкнулся вот с какой проблемой: тексты наши лежат в папке, никак не связанной с папкой ИРБИС64. В базе 952^b содержит абсолютный путь. При попытке обратится к файлы по ссылке "Полный текст" мне выдается сообщение, что файл не найден и указан абсолютный путь. Это понятно. Но как это исправить? Ложить тексты в папку с базой мне совсем не хочется, да и исправлять последствия недоработки программы - это неуважение прежде всего к себе.
Попробовал сделать дополнительное поле, которое содержало бы тот путь до файла, по которому обращение идет постоянно, т.е. [elib.mubint.ru]... Поле назвал 953 и оно содержало только этот путь. В результате в окне просмотра текста что-то вроде "текст не найден c:\TEMP". Вот прочем тут темп? Ладно, думаю. Может ищет в подполе ^b. Действительно, ищет в irbisr_fulltext.ini->[main]->full_text-name->^b. Но в ответ все равно
Цитата:
Файл отсутствует или поврежден
[elib.mubint.ru]...
Так как же всетаки надо указывать путь, чтобы достучатся до таких файлов?

Есть еще маленькая проблема: поскольку все это хозяйство еще и файл-серверное, а ПТ Ирбис я поставил в ту же папку, что и обычный Ирбис, мне приходится открывать на доступ папку с Ирбисом для всех. Есесьно, разрешение на папку IRBIS64 для всех стоит только READ. А вот дальше внутри уже расставляю execute для irbisr_fulltext.exe и WRITE для irbisr_fulltext.ini. Но вот незадача, для ини-файла права берутся от папки IRBIS64 и ини-файл для записи закрыт. При закрытии читателя выдается сообщение
Цитата:
Unable to write to \\<server>\IRBIS64\irbisr_fulltext.ini
А что и зачем туда вообще пишется?

В общем, продукт сырющий до безобразия оказался. При этом реально в сеть можно показать ПТ базу только через ПТ веб-интерфейс. А он дополнительных денег стоит и настройка нужна серьезная.

Вывод: уважаемые разработчики, я очень надеюсь, что вы не оставите мою критику без внимания, поскольку такие ошибки оставлять без внимания не возможно (деньги ведь уплачены).

Re: Ирбис64 ПТ. Предложения
Пользователь: Jack_Loving (IP-адрес скрыт)
Дата: 18, May, 2006 12:26

Максим, я принимаю твое возражение на то, что нет документации на продукт, но то, что он сырющий???!!! Извини, но много уже исправлено в обновлении, одну из исправленных там ошибок ты описал - запись в INI-файл. Помоему Бродовский тебе писал, что есть обновление ПТ. Ладно.
А вот по поводу описания - я постараюсь сегодня создать хотя бы краткое описание ПТ и выстави на FTP.
Начну отвечать по порядку:
1. разбор ссылки: <a href="http://IrbisServerFTR?com=smfn&dbn=TEXT&mfn=000061&REQKEYW=ABBOT%24">
Поясню, начиная, по-моему, с ПТ версии 2005.2.3 - все команды(URLссылки) выглядят и работают, как CGI-команды. Это сделано для того, чтобы движок, написанный для шлюза можно было включать в локальный читатель – чтобы все было едино. Тогда HTML-файлы и форматы написанные для шлюза, можно будет использовать и в локальном читателе и наоборот. Поэтому, далее начнем разбор ссылки, адрес «IrbisServerFTR» – означает, что эта ссылка должна быть ОБРАБОТАНА шлюзом локального читателя (так называемый имитатор шлюза). Если стоит, например “www.gpntb.ru”, то ссылка НЕ будет обрабатыватся локальным читателем, а будет обрабатываться Internet Explorer-ом и приведет к переходу на “www.gpntb.ru”.
Далее разбираем команды CGI:
com=smfn – показать полный текст. Расшифровывается COM – Command, SMFN – ShowMFN;
dbn=text – текст брать из БД “TEXT”. Расшифровывается DBN – DataBaseName;
mfn=000061 – взять полный текст из записи №61.
reqkeyw=ABBOT%24 – выделить слова в тексте. Список слов в кодировке UTF-8, слова разделены между собой знаком «+». Расшифровывается REQKEYW – RequestKeywords.

2. Поле 952^b:
«В базе 952^b содержит абсолютный путь. При попытке обратится к файлы по ссылке "Полный текст" мне выдается сообщение, что файл не найден и указан абсолютный путь» отвечаю: все верно – в этом поле лежит абсолютный путь на файл, программа пытается открыть файл по этому пути и не находит его. Значит этого файла просто там нет. «Это понятно. Но как это исправить?» - что исправить?! «Ложить тексты в папку с базой мне совсем не хочется» - зачем класть тексты в папку с базой? Файлы кладутся в папку с базой только в том случае, если они проиндексированы с относительными путями. Максим, поясни эту проблему, может быть я не до конца тебя понял. А путь «C:\Temp» - это путь, по которому пишутся временные файлы читателя. В данном случае ты попытался указать в качестве полного пути на файл в поле 952^b путь на "http://elib.mubint.ru/" - это не верно, потому что там указываются пути только на ФАЙЛЫ. Действительно мы пока не предоставляем такой возможности указания полного теста на URL-ссылку, а не на файл.
3. Распределение прав на папки и файлы в них:
Это вопрос, конечно, уже не к разработчикам ИРБИС, но как опытный специалист не только в программировании, но и в администрировании, я тебе расскажу маленький «секрет» :). Судя по всему у тебя стоит FAT32 или FAT. В этих файловых системах можно назначать права доступа только на папки. Для того, чтобы можно было назначать права на файлы и папки в отдельности – тебе нужно переконвертировать твою файловую систему в NTFS, я надеюсь ЧТО такое NTFS тебе объяснять не нужно, как специалисту :).

Хочу тебя попросить не говорить о том, что продукт сырой, не разобравшись в этом и то, что мы обманываем пользователей, что берем деньги и не предоставляем соответствующий сервис :). Этими неосторожными «движениями» ты просто наше лицо необоснованно разукрашиваешь в другой цвет :)

Ссылка на файл краткого описания будет объявлена в сообщениях разработчиков.
Удачи...

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 18, May, 2006 14:15

Женя.
1.
Цитата:
адрес «IrbisServerFTR» – означает, что эта ссылка должна быть ОБРАБОТАНА шлюзом локального читател
Ну так от куда локальный читатель возмет этот файл, если я все файлы индексировал на сервере. Путь в 952^b абсолютный на сервере. Есесьно, что у клиентов по этому пути ничего нет и быть не может. За разъяснение спасибо. Еще, я так понимаю, если есть команда, обрабатываемая локальным шлюзом, то должна быть команда, обрабатываемая серверным читателем. На локальной машине НИКАКИЕ пути обрабатываться не ДОЛЖНЫ. Все пути в базе лежат серверные. Локально эти пути не работают в большинстве случаев.
3. Конечно NTFS. Что еще может стоять на сервере? Очень жду исправленого читателя, который ини не перезаписывает.

По поводу моего резкого тона: если продукт настроить не возможно, то он сырой :). К сожалению тон этот обоснован. Я уже упоминал про проблемы с ПТ Читателем в мягком тоне. Ответа жду уже месяца 4. Стоило спросить жестче, сразу все встало на свои места. Я ничего против вас, как разработчиков, не имею. Но иногда терпение кончается. Очень надеюсь, что совместными усилиями мы придем к истине.

ЗЫ. "не говорить о том, что продукт сырой, не разобравшись в этом" будет документация, тогда и разговор другой будет :)

ЗЗЫ. И еще, раз уж наконец завязался предметный диалог: планируется ли вообще разработка клиент-серверного ПТ Читателя?

С уважением,
Максим



Редактировано 3 раз. Последний раз 18.05.2006 14:30 пользователем Панев Максим.

Re: Ирбис64 ПТ. Предложения
Пользователь: Jack_Loving (IP-адрес скрыт)
Дата: 18, May, 2006 14:47

Я опять ничего не могу понять. Не пойму твой ход мысли. Во-первых, все у нас настраивается и веб-шлюз с читателем, например, могут работать одновременно из одной папки и с одной и той же БД. Это все предусмотрено и не только это.
Поясни ситуюцию подробнее. Где у тебя стоит Web-шлюз? Где у тебя стоит DATAI? Напиши, что у тебя написано на конктретной записи в метке 952^b. В этой ситуайии ты скорее всего не понимаешь идеи, чем ошибка программы. Но я, конечно, не исключаю ошибки, но не в этой сфере. Я так понял, что ты хочешь чтобы одна и таже БД была доступна локально и через Web?! Если так, то для этого достаточно стандартных настроек локального читателя и настройки INI-файла веб-шлюза.

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 18, May, 2006 20:35

Для начала: веб-шлюз и ПТ Читатель я не смешивал. Вернее о веб-шлюзе я вообще не упоминал.

А теперь по порядку:
1. На сервере по пути D:\FULLTEXT\ лежат файлы PDF. Добавляю я их в базу с абсолютными путями естественнно. В результате в записях 952^b=D:\FULLTEXT\mytext.pdf
2. Сам Ирбис установлен на сервере в папке D:\IRBIS64\. Там компоненты: административная часть и ПТ Ирбис (Администратор и читатель).
3. Только для АРМ ПТ Читатель мне нужно открыть папку IRBIS64 на чтение всем. Пусть так. Открываю. Все читают, писать не могут. Но АРМ ПТ Читатель хочет что-то туда писать (даже тот обновленный, что ты прислал сегодня)!!! Пытаюсь для ини-файла поставить индивидуальные разрешения - ничего не получается. Файловая система - NTFS. Ладно, может дождусь версию без записи ини-файла.
4. Запускаю ПТ Читателя с клиентской машины так \\<сервер>\IRBIS64\Irbis64_FullText.exe
Делаю поиск. Жму "Полный текст". В ответ

Файл отсутствует или поврежден
D:\FULLTEXT\mytext.pdf

Ну так это понятно, его же нет на локальной машине. Получается, что ПТ Читатель не доработан в плане работы с удаленной машины с текстами, которые занесены в базу с абсолютными путями. В любом случае доступ к нашему архиву предоставляется ИСКЛЮЧИТЕЛЬНО через web-сервер IIS. А значит путь, по которому необходимо достучаться до файла, выглядит примерно так
[elib.mubint.ru]
5. Пробую решить проблему добавлением дополнительного поля, которое будет содержать этот путь. Делаю ГК, получаю результат. В \Datai\Deposit\BriefHTML_web_mfn.pft прописываю вместо
'<a href="',v2002,'?com=smfn&dbn=',v2001,'&mfn=',MFN,'&REQKEYW=',&unifor('+3e',v2000),'">Полный текст</a>'

'<a href="',v953^b,'">Полный текст</a>'

Доступ осуществляется, пароль спрашивается, только файл грузится не в нижнее окно просмотра текстов, а в верхнее, где располагаются результаты поиска.

Вот в кратце то, с чем я столкнулся. Надеюсь ты больше не скажешь
Цитата:
Я опять ничего не могу понять
Да и после всего этого я в праве называть продукт "сырым".

Re: Ирбис64 ПТ. Предложения
Пользователь: Jack_Loving (IP-адрес скрыт)
Дата: 19, May, 2006 15:23

Максим, ты совершенно прав. У тебя все правильно работает. Но, чтобы сделать так, чтобы все работало, как ТЫ хочешь - слушай сюда :) ПТ Читатель - это файл-серверное приложение. Поэтому, когда ты его запускаешь не на сервере, то он ищет файл по полному пути на ЭТОЙ машине, а не на сервере, т.е. по пути D:\Fulltext\....., ты так выше и описал. А для того, чтобы файлы, проиндексированные на сервере с полными путями, были доступны с других машин - нужно открыть для них доступ. В частном случае это делается обычным расшариванием папок с полными текстами на сервере - ПЕРЕД тем как их индексировать. Затем индексируешь эти файлы и при этом указываешь пути на папки не путем выбора их "D:" "Fulltext" и ОК, а таким "Вся сеть" "Сеть Microsoft" "<сервер>" "<зашаренная папка>" - и все будет работать. Мы это все продумали еще перед созданием ПТ. Но пока не занимались решением добавления файлов по полному пути и доступом к ним с других машин. Пока это решается так, как я описал выше. Можешь эту недоработку называть "сыростью" :) ;) Но это логично на файл-серверном приложении и не было бы простительно на клиент-серверном!!!
По поводу записи в INI-файл. Приношу свои извинения, ошибся. Мы эту ошибку заметили еще 2 месяца назад, но внесли исправления уже в новую версию, а не в ту, которую я тебе выслал. Я сейчас обязательно исправлю. Сорри!!! Максим ты прав и еще я тебе говорил, что ты на конкретный файл можешь поставить отдельные права, я проверил на XP с NTFS - нельзя. Получается можно только на W2000 Server или W2003 Server, я считал, что для этого достаточно просто NTFS. В этом ты тоже оказался не виноват!

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 19, May, 2006 16:06

Женя. Это я понял. Но есть один момент
Цитата:
В любом случае доступ к нашему архиву предоставляется ИСКЛЮЧИТЕЛЬНО через web-сервер IIS.
Как мне быть в этом случае? Мне нужно, чтобы файл, который будет указан в каком-либо поле с путем типа h t t p : / / e l i b . m u b i n t . r u / l i b / m y t e x t . p d f открылся в нижнем окне. Для этого он должен быть пропущен через IrbisServerFTR. Это возможно сделать? Только так, поскольку файл-серверный доступ к нашему архиву я никогда не открою для всех по нескольким причинам:
1. Невозможно посчитать статистику обращения;
2. Легко любой человек может скопировать этот архив и распространять. Следовательно рушатся авторские права;
3. Библиотечный сервер давно уже не использыется как файл-сервер. Нагружать его так совсем не рационально.

Re: Ирбис64 ПТ. Предложения
Пользователь: Jack_Loving (IP-адрес скрыт)
Дата: 22, May, 2006 10:58

Макс, для этого есть ПТ-веб. По поводу отображения HTML в нижнем окне, это нужно подумать, как реализовать. Дело в идее, нижнее окно предназначено для отображения полных текстов документов и все.
А для отображения URL ссылок в качестве полных текстов, то их же нужно сначала через администратор внести, а для этого он не преднозначен. В общем у тебя проблема, не совсем относящаяся к локальному ПТ.

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 23, May, 2006 20:18

Еще и на ПТ веб документации не нашел.
Женя! Очень прощу выслать документацию на веб. Параметры там не совпадают с обычным вебом никак, по этому без доку вообще мертво. Плз на почту.

Re: Ирбис64 ПТ. Предложения
Пользователь: Jack_Loving (IP-адрес скрыт)
Дата: 24, May, 2006 10:33

Конечно, я вышлю обязательно. Я еще пишу документацию. Может быть сегодня закончу и сразу объявлю в форуме и выставлю на FTP.
Параметры с обычным вебом совпадают по названию, но только в случае, где можно их применить к ПТ, иначе они просто не уместны и поэтому не поддерживаются.
Документация по описанию параметров ПТ будет одна, как для локального ПТ, так и для веб, потому что движок один.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 30, May, 2006 15:49

Да, все-таки еще даже очень сырой!
И не обижайтесь, дорогие и уважаемые коллеги-помощники-друзья-единомышленники!
И не в смысле программных (а тем более форматных) ошибок, а в смысле замысла, концепции, идеологии, назначения, позиционирования… И все больше прихожу к выводу, что все это не было продуманно с самого начала.
Ведь если ПТ модуль — это в первую очередь именно модуль, и лишь во вторую очередь отдельный продукт, он должен быть изначально, по умолчанию, интегрирован с «главными», библиографическими, АРМами.
И выглядит это так, что три разных системы случайно оказались в одном флаконе, т .е. в директории IRBIS64 — библиграфическая, полнотекстовая и VHCA — с совершенно разными назначениями, способами работы и GUI. Правда, есть файлы с одинаковыми ISIS-расширениями и с похожей структурой — pft, ws и т. д., но их роль в ПТ модуле явно третьестепенная.

irbis_arbat@mail.ru



Редактировано 3 раз. Последний раз 11.10.2011 08:44 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 28, November, 2006 15:50

Скачал и установил Greenstonе. Пока не было времени подробно разобраться, но первое впечатление вроде бы лучше, чем от ИРБИС64 ПТБД. Кроме того, эта система бесплатна и, что особенно забавно, рекомендуется или рекомендовалась на сервере ГПНТБ, кажется, в разделе «Электронные библиотеки России».
Конечно, недостаток Greenstonе – неинтегрированность (неинтегрируемость?) с ЭК (=библиографическими БД).
С другой стороны, с ПТ ИРБИСом в этом смысле по-прежнему… не все ясно. Вроде бы, с одной стороны, он изначально разрабатывался как один из модулей ИРБИСа, и именно в этом его отличие от чисто полнотекстовых систем и поисковиков (и именно в этом, насколько я уловил, состоит вклад в науку Константина Олеговича). А с другой стороны, интеграция полнотекстовых и библиографических БД вроде бы не нужна, хотя и возможна?
Хотелось бы узнать мнение обо всем этом разработчиков ИРБИСа и разработчиков программы «Электронные библиотеки России». Или, может быть, кто-нибудь поделится опытом применения Greenstone?



Редактировано 1 раз. Последний раз 11.10.2011 08:41 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 28, November, 2006 15:53

Философтизмы

А вдруг через несколько лет появятся совершенно новые, немыслимо совершенные алгоритмы поиска и смыслового анализа. А в каждом доме, в каждой конторе, в каждой деревне и в детском саду будет гигабитный (как минимум) инет, 4-ядерные 4-процессорные компы с терабайтными (как минимум) винтами.



Редактировано 4 раз. Последний раз 18.12.2012 14:16 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, November, 2006 15:13

Еще нашел подтверждения пророчеств Брюсова, Лема и других (а также голливудских ужастиков) о будущей "войне с машинами" в докладе Земскова на "Ярославле-2005", где он говорил об "информационных цунами" и тому подобных вещах.

Re: Ирбис64 ПТ. Предложения
Пользователь: Слепой снайпер (IP-адрес скрыт)
Дата: 27, April, 2007 15:17

Ура господину Лавриновичу! Я насчет Greenstone. Правда, я вышел на этот проект через свои источники...



Редактировано 1 раз. Последний раз 27.04.2007 16:46 пользователем Слепой снайпер.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 13, June, 2007 01:18

«мдя»…
Ура-то оно,мне,конечно ура, и да здравствует оно, конечно,да здравствует … ну дык а как жы енту всенародную славу и всеесенгешное уважение конвертувати, скажимо так, мяхко ховоря, у матерыальну форму (типо $)?



Редактировано 1 раз. Последний раз 06.07.2007 00:45 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 06, July, 2007 00:47

Очень не мешало бы провести сравнительное тестирование хотя бы 2-3-х полнотекстовых систем.
А пока не встречалось хотя бы анализа и даже ПОПЫТКИ сформулировать общие требования к «ПТ-софту», рекомендации по его разработке и т. д.



Редактировано 1 раз. Последний раз 11.10.2011 08:39 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 06, July, 2007 00:48

… ну нету больше на сайте ГПНБ России раздела «Электронные библиотеки".
И, условно говоря, «Программа Шрайберга» отвергнута в пользу, условно говоря, «Программы Грефа». Ну и что с того?
Однако Greenstone никуда не делся остается бесплатным и русифированным… Очевидно, что его недостаток – отсутствие интеграции с бгр. БД. Впрочем, в ИРБИС64 ПТ с этим дело обстоит тоже неважно или никак.



Редактировано 1 раз. Последний раз 11.10.2011 08:38 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 04, October, 2011 17:14

Печальная новость [www.aselibrary.ru]



Редактировано 1 раз. Последний раз 06.10.2011 05:41 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 05, October, 2011 12:39

Почему печальная? Полнотекстовый Ирбис, как я уже говорил, в текущей его реализации не имеет будущего, если не будет как минимум поддерживать автоматическую индексацию хранилища, без участия администратора.
Пока что он не способен заменить DSpace.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 06, October, 2011 05:31

Имел в виду другое - что больше нет RSL DC.



Редактировано 1 раз. Последний раз 07.10.2011 07:34 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 13, June, 2012 04:36

Панев Максим написал(а):
-------------------------------------------------------
> Хотелось бы иметь возможность выбора типов файлов,
> которые следует искать в каталоге. Ну вот не нужно
> мне, допустим заносить в базу HTML, нужны только
> DOC, PDF. Хотелось бы иметь возможность указать
> это.
И еще хотелось бы иметь то же самое в поисковиках, именно там бывает очень нужно.... тем более в ожидании библиосковиков.

irbis_arbat@mail.ru



Редактировано 3 раз. Последний раз 22.10.2012 03:17 пользователем Lavrinovich.

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 01, July, 2012 17:46

Новые новые идеи:
- Полнотекстовый веб-Комплектатор
- Полнотекстовый веб-Каталогизатор
Как, зачем и почему, еще не знаю, но чувствую, что в этом что-то есть. Но Максим считает, что все это относится к ЭБС
[irbis.gpntb.ru]
А почему?

irbis_arbat@mail.ru

Re: Ирбис64 ПТ. Предложения
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 18, July, 2012 08:17

Важно, что воспринимаются наиболее распространенные форматы файлов. И логично было бы включить их в число выходных, при этом если выходной формат не HTML, должна будет автоматически генерироваться HTML-копия выходного
документа (по аналогии с Google), возможно также ZIP-копия.
Но массивы данных, загружаемых из интернета, могут включать и многие другие форматы. Например, в Электронной библиотеке РГБ — PDF (основной), DOC, TXT, TIFF, JPEG, HTML, XML, у РКП — еще какие-то… (можно бы добавить DHTML, XHTML, PHP, XLS, MDB, DBF)...
Значит, нужно автоопределение форматов и автоконвертирование во «внутрисистемные».
Относительно недоосуществленной идеи поиска «схожих текстов к тексту из
полнотекстовой БД» и «поиска схожих текстов к внешнему (по отношению полнотекстовой БД) тексту». Логика и здравый смысл подсказывают, что такими внешними текстами должны быть прежде всего опять-таки интернет-ресурсы. из чего следует необходимость дальнейшей интеграции ИРБИСа с браузерами и
поисковиками.

irbis_arbat@mail.ru



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.