Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Опыт и разработки пользователей ИРБИС :  ИРБИС Irbis
 
Проблемы конвертации
Пользователь: Vladimir Kim (IP-адрес скрыт)
Дата: 21, May, 2004 14:20

Добрый день!

К сожалению, столкнулись с многочисленными проблемами конвертации записей из Библиотеки 5.0 в Ирбис - далего не все поля ложатся корректно - более того часто это оказывается заметно не сразу. Никакая из четырех предложенных vmarki, к сожалению, не дает приемлемого результата...

Пожалуйста, скажите, каким материалами Вы пользовались при написании конвертора из usmark в unimark. И где можно найти описание взаимного соответствия полей этих форматов?

Заранее благодарен!

С уважением, Владимир Ким
Инженер-программист НБ МИФИ

Re: Проблемы конвертации
Пользователь: Карауш (IP-адрес скрыт)
Дата: 23, May, 2004 05:42

А идеальная ли версия USMARC в программе Библиотека-5? Программа относительно новая и, естественно, что мало опыта переноса баз из внутреннего формата Библиотека-5---ИРБИС.
Есть множество пользователей программы Библиотека-5, которым просто нужен конвертор, и пройти путь конвертирования должен именно пользователь, а не разработчики ИРБИСа, у которых такой программы нет. Станьте таким пользователем, который разберется с этими проблемами, опишите их, и Вы заслужите уважение не только у пользователей ИРБИСа, но и Библиотеки-5.


Re: Проблемы конвертации
Пользователь: Vladimir Kim (IP-адрес скрыт)
Дата: 24, May, 2004 14:36

Добрый день Карауш,

>Станьте таким пользователем, который разберется с этими проблемами
:) Мне кажется, что у любого пользователя любого коммерческого продуката не должно возникать проблем, а если они возникают, разработчики программы в первую очередь должны позаботиться о том, что бы их решить в минимальные сроки.

С уважением, Владимир Ким
Инженер-программист НБ МИФИ

Re: Проблемы конвертации
Пользователь: Карауш (IP-адрес скрыт)
Дата: 24, May, 2004 15:00

> :) Мне кажется, что у любого пользователя любого коммерческого продуката не должно возникать проблем

Попробуйте сконвертировать текст из Word в Лексикон со всеми картинками и метатегами и распечатайте результат :).
Если у Библиотеки 5 своя структура данных (закрытая разработчиками), да такая, что даже пользователи ее получить не могут, то что говорить о конкурентах ПО. Вы сами-то верите, что данные внутренней структуры данных Библиотека 5 где-то можно посмотреть в таблице?

Если Вы их выгружаете через стандартный формат UNIMARC, RUSMARC, MARC-21, то никаких сложностей быть не должно (там основная проблема постобработки- исправления ошибок каталогизаторов, которые неправильно набивали - не в те поля изначально). Хотя для того, чтобы сконвертировать MARC-21 в RUSMARC мне лично пришлось очень долго настраивать конвертор с учетом "местных особенностей" каталогизаторов, поскольку каждый понимает стандарт в меру своей "испорченности".

Re: Проблемы конвертации
Пользователь: Vladimir Kim (IP-адрес скрыт)
Дата: 24, May, 2004 15:34

Карауш писал(а):

> > :) Мне кажется, что у любого пользователя любого
> коммерческого продуката не должно возникать проблем
>
> Попробуйте сконвертировать текст из Word в Лексикон со всеми
> картинками и метатегами и распечатайте результат :).
> Если у Библиотеки 5 своя структура данных (закрытая
> разработчиками), да такая, что даже пользователи ее получить не
> могут, то что говорить о конкурентах ПО. Вы сами-то верите, что
> данные внутренней структуры данных Библиотека 5 где-то можно
> посмотреть в таблице?
При чем тут внутренняя структура? В Библиотеке можно сохранить запись в марк формате - это достаточно для того, что бы разбрать/анализировать/модифицировать всю базу, например, с помощью Perl.

Именно usmark формат уже затем мы пытаемся залить в Irbis

> Если Вы их выгружаете через стандартный формат UNIMARC,
> RUSMARC, MARC-21, то никаких сложностей быть не должно (там
> основная проблема постобработки- исправления ошибок
> каталогизаторов, которые неправильно набивали - не в те поля
> изначально). Хотя для того, чтобы сконвертировать MARC-21 в
> RUSMARC мне лично пришлось очень долго настраивать конвертор с
> учетом "местных особенностей" каталогизаторов, поскольку каждый
> понимает стандарт в меру своей "испорченности".

С этим мы тоже столкнулись, по этому перед конвертированием произвели глобальную кооректуру базы на уровне формата usmark. Для чего написали специальный набор Perl модулей.

С уважением, Владимир Ким
Инженер-программист НБ МИФИ


Re: Проблемы конвертации
Пользователь: Карауш (IP-адрес скрыт)
Дата: 24, May, 2004 16:52

> При чем тут внутренняя структура? В Библиотеке можно сохранить запись в марк формате - это
> достаточно для того, что бы азбрать/анализировать/модифицировать всю базу, например, с помощью Perl.

Как раз внутрення структура и дает ошибки. Например, кто сказал, что в подполя географических рубрик должны падать в UNIMARC с той же логикой? В UNIMARC логика предметная, в USMARC - территориальная. Вы это как автоматом разложите???

Далее. Как внутренний формат ИРБИСа - не совсем UNIMARC, так же внутренний формат Библиотеки 5 - не совсем USMARC. И это нормально, поскольку технологические поля никто и никогда не нормировал.


Re: Проблемы конвертации
Пользователь: Vladimir Kim (IP-адрес скрыт)
Дата: 24, May, 2004 17:41

Карауш писал(а):

> > При чем тут внутренняя структура? В Библиотеке можно
> сохранить запись в марк формате - это
> > достаточно для того, что бы
> азбрать/анализировать/модифицировать всю базу, например, с
> помощью Perl.
>
> Как раз внутрення структура и дает ошибки. Например, кто
> сказал, что в подполя географических рубрик должны падать в
> UNIMARC с той же логикой? В UNIMARC логика предметная, в USMARC
> - территориальная. Вы это как автоматом разложите???
>
> Далее. Как внутренний формат ИРБИСа - не совсем UNIMARC, так
> же внутренний формат Библиотеки 5 - не совсем USMARC. И это
> нормально, поскольку технологические поля никто и никогда не
> нормировал.

Не совсем Вас понимаю - Вы же пишете конвертор не из внутреннего формата Библиотеки во внутренний Ирбис. Библиотека сохраняет в марк формате и конвертору необходимо правильно подцеплять уже марк файл, а не базу данных Библиотеки во внутреннем формате.

С уважением, Владимир Ким
Инженер-программист НБ МИФИ

Re: Проблемы конвертации
Пользователь: Карауш (IP-адрес скрыт)
Дата: 24, May, 2004 19:28

> Не совсем Вас понимаю - Вы же пишете конвертор не из внутреннего формата Библиотеки во
> внутренний Ирбис. Библиотека сохраняет в марк формате и конвертору необходимо правильно
> подцеплять уже марк файл, а не базу данных Библиотеки во внутреннем формате.

Так я говорю про MARC. MARC (ISO-2709, Z39.2) - это всего лишь физическая структура файла, последовательности байт.
А вот форматы USMARC, RUSMARC, UNIMARC - это логические схемы данных для фалов со структурой MARC. Вот Вы в каком из MARCов выгружаете? Вы все это время писали логику: "Я выгрузил в виде таблицы", но не разу не написали про структуру этой таблицы и названия столцов (строк). А от этого все и зависит, вы же конвертируете внутренние данные из одних ячеек в другие? А раз так, то структуру нового формата ПО Библиотека 5 знать просто необходимо и сравнивать ее с эталонным USMARC, чтобы данные нормально импортировались.


Re: Проблемы конвертации
Пользователь: Vladimir Kim (IP-адрес скрыт)
Дата: 28, May, 2004 10:46

Карауш писал(а):

> > Не совсем Вас понимаю - Вы же пишете конвертор не из
> внутреннего формата Библиотеки во
> > внутренний Ирбис. Библиотека сохраняет в марк формате и
> конвертору необходимо правильно
> > подцеплять уже марк файл, а не базу данных Библиотеки во
> внутреннем формате.
>
> Так я говорю про MARC. MARC (ISO-2709, Z39.2) - это всего
> лишь физическая структура файла, последовательности байт.
> А вот форматы USMARC, RUSMARC, UNIMARC - это логические схемы
> данных для фалов со структурой MARC. Вот Вы в каком из MARCов
> выгружаете?
USMARK

> Вы все это время писали логику: "Я выгрузил в виде
> таблицы", но не разу не написали про структуру этой таблицы и
> названия столцов (строк).
А разве для того же USMARK поля и формат записей не стандартизирован? (я имею ввиду кроме 9-ти сотых полей)

> А от этого все и зависит, вы же
> конвертируете внутренние данные из одних ячеек в другие? А раз
> так, то структуру нового формата ПО Библиотека 5 знать просто
> необходимо и сравнивать ее с эталонным USMARC, чтобы данные
> нормально импортировались.
Как я понимаю, USMARK - это один из стандартов записи в MARK файл библиографического оаписания, т.е. стандарт в какое поле/подполе идет та или иная информация об издании. Т.о. от Библиотеки 5.0 ничего зависить не должно.

С уважением, Владимир Ким
Инженер-программист НБ МИФИ



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.