Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
Полнотекстовые базы дынных.DJVU
Пользователь: я2008 (IP-адрес скрыт)
Дата: 23, July, 2008 15:26

Подскажите, поддерживает ли ПБД формат DJVU?

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Alio (IP-адрес скрыт)
Дата: 23, July, 2008 16:46

Да, поддерживает.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: я2008 (IP-адрес скрыт)
Дата: 23, July, 2008 17:03

Тогда у меня еще вопрос. я скачала с Интернета журнал он в DJVU, а засунуть его в базу ПБД не могу. Вернее путь добавляется, но при "создать словарь" выдает ошибку: Floating point division bu zero. И в Читателе ПБД этого журнала нет. Что я не так делаю???

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 23, July, 2008 17:44

А этот DJVU содержит текстовый слой?

Re: Полнотекстовые базы дынных.DJVU
Пользователь: я2008 (IP-адрес скрыт)
Дата: 23, July, 2008 22:10

что значит текстовый слой? в этом журнале есть страницы на которых только рисунки и есть страницы с текстовым описанием и схемами вязания.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 24, July, 2008 00:27

Формат DJVU представляет из себя картинки, на которые наложен текст (если предварительно картинки были распознаны). Однако ни что не мешает создать файл формата DJVU без текстового слоя, который содержит ТОЛЬКО картинки. Ирбис ПТБД понимается только те форматы, которые СОДЕРЖАТ текст. Самостоятельного распознавания Ирбис ПТБД не производит.
А из этого следует, что если вы скачали (или любым другим образом получили) файл формата DJVU без текстового слоя, то использовать его в Ирбис ПТБД бесполезно.

Судя по вашему описанию, этот файл представляет из себя журнал по вязанию. Такого рода материалы (если они скачаны из Internet) ОЧЕНЬ (или даже всегда) редко содержат текстовые слои. Чаще это просто отсканированные журналы без какого-либо распознавания (чит. текстового слоя). По этому я могу поставить следующий предварительный диагноз: этот файл не пригоден для использования в Ирбис ПТБД (да и в любых других системах ПТБД, которые мне известны).

Re: Полнотекстовые базы дынных.DJVU
Пользователь: я2008 (IP-адрес скрыт)
Дата: 24, July, 2008 09:15

Спасибо за ответ. теперь понятно. Да скорее всего этот журнал без текстового слоя.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 22, September, 2008 16:59

Здравствуйте.

Подскажите, пожалуйста, как добавить документ в формате djvu, ведь формат там не прописан и такой документ не видно в Администраторе.

И еще один вопрос, если документ сохранен в pdf или djvu формате, он должен перед этим быть распознан и только потом сохранен в данных форматах, я правильно понимаю, иначе система его не будет читать.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 26, September, 2008 15:22

DJVU поддерживается в версии ИРБИС полнотекстовые БД 2007.2

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 29, September, 2008 14:16

Скажите пожалуйста, а когда будет распространятся версия 2007.2, просто мы купили (Ирбис. Полнотекстовые БД) этим летом и у нас версия 2007.1.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 29, September, 2008 16:50

Вам необходимо получить последнюю версию ИРБИС ПБД
Свяжитесь с группой договоров
646 36 05

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 07, November, 2008 11:52

Здравствуйте.
Подскажите, пожалуйста, почему при добавлении документов в djvu формате сам документ как бы добавляется в базу, а вот создать словарь не получается. Администратор выдает сообщение "Floating point division by zero". И как следствие данный документ в "Читателе" найти нельзя, хотя текстовый слой в документе существует и в самой программе DJVU, поиск произвести, возможно.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 07, November, 2008 16:55

Пришлите этот файл djvu на ksboychakov@yandex.ru

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 11, November, 2008 14:25

Здравствуйте Константин.
Я как вы посоветовали, переустановила систему на сервере, но это ничего не дало, потом я установила ее на обычной машине (для пробы), тоже ничего не получилось. Система не создает словарь на djvu и pdf файлы, выдает сообщение "Floating point division by zero" и зависает.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 11, November, 2008 15:59

Индексируются ли файлы WORD с расширением DOC?

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 11, November, 2008 16:53

Да, и zip, и rar, и html иднексюруются, а вот pdf и djvu нет.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 12, November, 2008 09:52

Добавьте в базу данных файл pdf и проделайте только отбор
Меню Актуализация-Создать словарь заново
Найдите в директории workdir файл имяБД.ln1 и посмотрите его содержимое
Будут ли там ключевые слова из текстов с префиксом KT=

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 12, November, 2008 11:23

Нет там нет ключевых слов из текста. Я на всякий случай его прикрепила.

Вложения: FT.ln1 (346 bytes)  
Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 13, November, 2008 14:28

Попробуйте расположить файлы внутри директории базы данных

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 13, November, 2008 17:45

Попробовала, результат тот же.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 24, November, 2008 11:14

Попробуйте создать директорию с:\temp

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 25, November, 2008 18:41

Такая директория на машине уже есть, я так понимаю в нее нужно положить книгу и добавить в базу. Я попробовала, результат тот же, словарь не создается.

Re: Полнотекстовые базы дынных.DJVU
Пользователь: hklibnpu (IP-адрес скрыт)
Дата: 25, December, 2008 16:34

Здраструйте уважаемые разработчики. Задаю свой вопрос еще раз если возможно, пожалуйста, ответе, а то я уже замучилась искать причину, почему нельзя добавить в базу документы djvu. На форуме в одной из тем я прочла о конверторах pdf, это подвигло меня посмотреть на ini-файл администратора повнимательней, в разделе

#converters paths
PDF2TXT=.\Converters\PDF2TXT\
DISK_FREE_SIZE_TEST=1

я так понимаю, идет речь только о pdf, а где же djvu?

тогда я добавила еще одну строку, по аналогии

#converters paths
PDF2TXT=.\Converters\PDF2TXT\
djvu2djvu=.\Converters\djvu2djvu\
DISK_FREE_SIZE_TEST=1

и было "счастье" документы djvu, добавились и их можно было найти, но произошла другая проблема не всегда эти документы открываются через WEB - ПБ, также не открываются заархивирование документы, хотя поиск проводится. Может в нашем дистрибутиве допущены ошибки, а может я делаю что-то не так. Помогите, пожалуйста.
ini-файл Администратора ПБ из дистрибутива я прикрепляю.

Вложения: IRBISA_FullText.INI (1.6KB)  
Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 26, December, 2008 10:28

Возможно у Вас версия 7.1
Для версии 7.2 ини файл администратора выглядит вот так

[Main]
DeflexFullText=0
Tools=0
DBNNAMECAT=dbnam1_FT.mnu
DBNNAMECAT2=dbnam2_FT.mnu
DBNNAMECAT3=dbnam3_FT.mnu
IMPORTMNU=IMPORTW.MNU
EXPORTMNU=EXPORTW.MNU
COPYMNU=FST.MNU
HLPFILE=irbis64_for_texts.hlp
FontName=Arial
FontCharSet=204
EmptyDBN=BLANK
EtalonDBN=IBIS
CurDBN=TEXT
DATAPATH=.\DATAI\
WORKDIR=.\workdir
ACTABPATH=isisacw
RecUpdif=0
PRMARCFORMAT=MARC

DataBaseItem=1
OpenDBItem=1
NewDBItem=1
ClearDBItem=1
DeleteDBItem=1
CloseDBItem=1
ImportDBItem=1
ExportDBItem=1
CopyDBItem=1
UnLockItem=1
UnLockDBItem=1
UnLockRecordItem=1
UnLockListItem=1
RestatItem=1
ExitItem=1
ActualItem=1
ActualIfItem=1
LoadIfItem=1
LoadIfCompleteItem=1
LoadIf0Item=1
LoadIf1Item=1
LoadIf2Item=1
ReorgIfItem=1
ReorgMfItem=1
ServiceItem=1
CopyMfItem=1
RestoreMfItem=1
DeletedListItem=1
UnactualListItem=1
LockedListItem=1
DiagnosMfItem=1
OptionItem=1
AutoaskingItem=1
ToolsItem=1
ToolWSItem=1
ToolIniItem=1
ToolTreeItem=1
ToolTabItem=1
HelpItem=1



[TEXTS]
Converter_Word=0
Converter_PDF=0

TEXT_HEURISTIC=.\Visual HCA\
TEXT_COMMON=.\Visual HCA\COMON\
TEXT_COMMON_DICTIONRY0=COMONW.DCT
TEXT_COMMON_DICTIONRY1=ENGLN.DCT
TEXT_COMMON_DICTIONRY2=SPANISH.DCT
TEXT_NAME2=Испанский
TEXT_FILE_ADD_PORTION=100
#TAGS
FULL_TEXT_Name=952
FULL_TEXT_Words_Number=20
FULL_TEXT_Index=21
FULL_TEXT_BRIEF=22
#special constants
FULL_TEXT_NUMWORDS_IN_BRIEF=30
FULL_TEXT_NUMWORDS_INDEXED=0
FULL_TEXT_MAX_WORD_LEN=4

#converters paths
PDF2TXT=.\Converters\PDF2TXT\
PDF2PDF=.\Converters\PDF2PDF\
PDF2DJVU=.\Converters\PDF2DJVU\
DJVU2DJVU=.\Converters\DJVU2DJVU\

#test memory before adding texts
DISK_FREE_SIZE_TEST=1

#if > 0 coordinates of words in image are saved in DB
FULL_TEXT_IMAGE_TAG=953

FORMAT_CASHABLE=1

#Для распознавания картинок в JPG формате
[ABBY]
EngineDllPath=...FREngine.dll
DeveloperSN=....

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Constantin (IP-адрес скрыт)
Дата: 26, December, 2008 10:39

Пришлите мне на почту Ваши файлы djvu и pdf - я вышлю в ответ пример их индексирования.
ksboychakov@yandex.ru

Re: Полнотекстовые базы дынных.DJVU
Пользователь: ArtProud (IP-адрес скрыт)
Дата: 12, November, 2009 13:57

Здравствуйте.
Хотел спросить - как узнать есть ли текстовый слой в документе
pdf или djvu?В просмотрщике есть возможность это увидеть?

Re: Полнотекстовые базы дынных.DJVU
Пользователь: Gena (IP-адрес скрыт)
Дата: 12, November, 2009 14:48

Есть, попытайтесь мышкой выделить текст как в Ворде. Если тектс выделяется - значит есть текстовый слой.



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.