Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Опыт и разработки пользователей ИРБИС :  ИРБИС Irbis
 
Страницы: <<12
Страница: 2 из 2
Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 03, October, 2012 09:06

Lavrinovich написал(а):
-------------------------------------------------------
> Карточки нужны, не нужны... недавно очень удивился
> -"сам" Э.Р.Сукиасян полагает, что они будут
> всегда...

Самое интересное, что печать карточек отнимает у меня самое большое количество времени. Все остальные действия уже давно автоматизированы, а кое-кто до сих пор продолжает впечатывать оглавления вручную. Причём за ту же зарплату. Почему для операторов вообще не предусмотрен какой-либо карьерный рост?! Для других специальностей существует хотя бы сетка разрядов.
Самое обидное - даже не зарплата, а осознание того факта, что ты занимаешься, в общем-то, ненужным делом. Делаешь десятки карточек в неделю, а сколько из них реально пригодятся людям за обозримое количество лет? К самому электронному каталогу обращаются вообще единицы. И все карточки для ретро-каталога (который "Имидж") отсканировал практически я один - разработав по ходу дела утилиту с интерфейсом для сканера и автоматической инкрементацией номеров создаваемых файлов для карточек. Много ли из этой работы окажется востребованным?

Хотелось бы приложить свои силы к реально нужному делу и чтобы была отдача. Но где его найти? Заполнял резюме на сайте онлайнового кадрового агентства, и ни одного отклика. Я подозреваю даже, что "охотники за головами" дальше первой строчки и не читают, где у меня написано: "Программист в библиотеке" (что формально неправда, но по сути верно). То, что описывается дальше, - что именно я разработал, - никому не интересно - видимо, у людей есть определенный стереотип насчет должности программиста в библиотеке - ну, что это никакой не программист, а просто человек, хоть что-то понимающий в компьютерах на фоне всей массы библиотечного контингента. А если бы наврал в резюме, что годик поработал в какой-нибудь фирме - небось, пригласили бы уже хотя бы на собеседование.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, October, 2012 10:09

Кое-какие ссылки о ретроконверсии
[irbis.gpntb.ru]

irbis_arbat@mail.ru



Редактировано 1 раз. Последний раз 04.10.2012 11:32 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, October, 2012 10:13

S-presso написал(а):
-------------------------------------------------------
> Lavrinovich написал(а):
> --------------------------------------------------
> -----
> > Карточки нужны, не нужны... недавно очень
> удивился
> > -"сам" Э.Р.Сукиасян полагает, что они будут
> > всегда...
>
> Самое интересное, что печать карточек отнимает у
> меня самое большое количество времени. Все
> остальные действия уже давно автоматизированы, а
> кое-кто до сих пор продолжает впечатывать
> оглавления вручную. Причём за ту же зарплату.
> Почему для операторов вообще не предусмотрен
> какой-либо карьерный рост?! Для других
> специальностей существует хотя бы сетка разрядов.
Видимо потому, что в штатных расписаниях библиотек нет должности "оператор", в отличие от, например, органов НТИ. А если это, как выражается Геннадий, "студенты-отработчики", то есть практиканты, какая же у практикантов может быть зарплата?
То есть уточняю, не каталогизаторы, не библиографы опять-таки, а именно "механические набивальщики"? Они могут еще в фирмах, специализирующихся по ретроконверсии типа "ПроСофт-М" [irbis.gpntb.ru]
Вот тут именно про операторов в библиотеке - "студентов-отработчиков"
[irbis.gpntb.ru]


А на тему "программист в библиотеке"... бесконечная тема, хотя и сильно надоевшая... см. тут
[irbis.gpntb.ru]
а о самовнушении тут
[irbis.gpntb.ru]
и еще тут, насчет моего "цинизма" [irbis.gpntb.ru]
...прямо не форум, а энциклопедия и неисчерпаемый кладезь народной мудрости...

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 03.10.2012 10:22 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 03, October, 2012 10:41

Lavrinovich написал(а):
-------------------------------------------------------
> Видимо потому, что в штатных расписаниях библиотек
> нет должности "оператор", в отличие от, например,
> органов НТИ. А если это, как выражается Геннадий,
> "студенты-отработчики", то есть практиканты, какая
> же у практикантов может быть зарплата?

Очевидно, у нас такая должность всё-таки имеется, потому что еще человека три-четыре этим занимаются (и кажется, все на полставки). И я никакой не студент и не практикант. У меня законченное высшее гуманитарное образование и сертификат международного образца об окончании компьютерных курсов, которые приравниваются ко второму высшему образованию, если защитить диплом. Конкретно я учился 2 года, а многие ли из "обработчиков" могут показать хотя бы корочку об окончании курсов операторов? Поэтому мне представляется странным, что у нас должна быть одна и та же зарплата.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, October, 2012 12:00

S-presso написал(а):
-------------------------------------------------------
> Хотелось бы приложить свои силы к реально нужному
> делу и чтобы была отдача. Но где его найти?
Наверное в Ассоциации ЭБНИТ...
Кто может оценить по достоинству? Наверное участники КРЫМов и ЛИБКОМов...


А в целом вижу, что многое осталось так же, как и 10-15 лет назад... особенно психологически... увы...

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 03.10.2012 12:05 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Konstantinus (IP-адрес скрыт)
Дата: 03, October, 2012 15:35

Интересно что это за курсы, и где можно такой диплом защитить :)

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 03, October, 2012 16:58

Lavrinovich написал(а):
-------------------------------------------------------
> Кто может оценить по достоинству? Наверное
> участники КРЫМов и ЛИБКОМов...
>

Собирался съездить в этом году на ЛИБКОМ, но родной вуз не выделяет денег - мы отмечаем 100-летний юбилей консерватории. По этой причине наша заведующая в этом году тоже не едет. Соответственно, я смогу попасть туда, только если соберу нужную сумму и найду человека, который согласится составить мне компанию.

Konstantinus написал(а):
-------------------------------------------------------
> Интересно что это за курсы, и где можно такой
> диплом защитить :)

Вот их сайт у нас в городе: aptechsar.com. В других городах тоже есть свои офисы, в Москве-то уж точно. Моя специализация называется "сертифицированный программист" (ACCP). На ней изучают C, HTML, Javascript и основы SQL, потом Java и сервлеты, и наконец C# и ASP.NET. В конце каждого семестра защищаем проект. До конца четвертого семестра доходят единицыsmiling smiley (о чём нас всех и предупредили в самом начале, и, собственно, так оно и получилось, но другим группам может повезти больше...). Диплом имеют право защищать те, у кого уже имеется высшее образование. Еще у них есть курсы дизайнеров, сисадминов и что-то еще.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 04, October, 2012 05:15

"Программист в библиотеке"... очень у многих, и отнюдь не только у библиотекарей, непонятно откуда взялось и навсегда застряло в голове уравнение:
"компьютер = пишущая машинка"

Именно из-за этого я долго балансировал между психозом и инсультом (перефразируя нашего классика), получил инвалидность по гипертонии. А бесился совершенно напрасно - гораздо позже где-то прочитал; "под программистом в 99,99 % случаев подразумевают интеллектуальную машинистку".
Причем "интеллектуальную" в том смысле, что нужно исправлять смысловые, стилистические и орфографические ошибки, расставлять знаки препинания за авторов - кандидатов наук по марксизму-ленинизму. Но было уже поздно...

irbis_arbat@mail.ru



Редактировано 1 раз. Последний раз 04.10.2012 12:16 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 04, October, 2012 08:30

Цитата:
Lavrinovich
очень у многих, и отнюдь не только у библиотекарей, непонятно откуда взялось и навсегда застряло в голове уравнение:
"компьютер = пишущая машинка"

Наверное, и у тех чиновников, которые устанавливали размер оплаты труда для оператора ПК в библиотеке. Правильно, зачем платить машинистке? Нам же нужен для работы только Word, и больше ничего (сам недавно слышал это от сисадмина, который устанавливал ПО на мой компьютер). А что мои собственные разработки теперь не идут - это, конечно, не его дело. Даже если не брать такие "глобальные" вещи, как БАРСиК - нужна хотя бы элементарная утилитка для преобразования текста в нижний регистр (если, конечно, вообще установлен FineReader, иначе остается только повеситься). Да мало ли что еще может понадобиться?..

Не говоря уже о том, что именно мне часто приходится решать у нас все технические вопросы, связанные с использованием компьютеров. Такая вот "интеллектуальная машинистка". Естественно, за это никто не платит.

А если бросать эту работу сейчас, то все технические инновации у нас просто заглохнут - боюсь, теми, кто придет мне на смену, компьютер и будет использоваться как пишущая машинка.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 15, October, 2012 06:49

О необычных для библиотекаря способах ввода данных в БД
[irbis.gpntb.ru]
[www.ict.edu.ru]
[infosoc.ru]
[www.thermophysics.ru]
[elementy.ru]
[thermophysics.ru]
Именно этих авторов, А.В.Островскую и М.С.Трахтенгренца, можно включить в ваш список литературы.... Тем более что у них есть и свои разработки - конверторы DAT и IsoWin.



Редактировано 2 раз. Последний раз 04.11.2012 00:18 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 22, October, 2012 03:32

S-presso написал(а):
-------------------------------------------------------
> Alio написал(а):
> --------------------------------------------------
> -----
> > Однако... Так сделайте так, чтобы по умолчанию
> > этот файл открывался другим редактором.
>
> Да нет, меня вполне устраивает и Word - на работе
> он вполне лицензионный. Суть в другом - почему бы
> не сделать возможность редактировать содержимое
> карточки, не выходя из Каталогизатора? Простейший
> встроенный текстовый редактор. У нас тут все
А насчет бесплатно... ...конечно, нам, скифам диким, вольным и буйным, вроде того же Стёпы Возьняка, отдавай все задарма по-прежнему, и еще скажи спасибо, что в живых на этот раз оставили законного владельца... Когда столицей Скифии была Ольвия (как раз нынешний Николаев), мы только и делали, что нюхали дым конопляный и грабили "бедных греков" (как выразился Е.А.Евтушенко, сибирский белорус, а значит, тоже скиф)... золото, серебро, благовония, опять-таки амфоры с вином (у нас ведь "нет даже винограда", по словам великого скифского философа, поэта и князя Анахарсиса, который из Ольвии опять-таки)... и красных девок половецких к седлам привязывали... впрочем, это уже "Слово о полку Игореве", то есть через 18 веков, про других князей, но разницы никакой... Летит, летит степная кобылица и мнет ковыль...

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 04.11.2012 00:13 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 23, October, 2012 18:04

Цитата:
S-presso написал(а):
-------------------------------------------------------
> Alio написал(а):
> --------------------------------------------------
> -----
> > Однако... Так сделайте так, чтобы по умолчанию
> > этот файл открывался другим редактором.
>
> Да нет, меня вполне устраивает и Word - на работе
> он вполне лицензионный. Суть в другом - почему бы
> не сделать возможность редактировать содержимое
> карточки, не выходя из Каталогизатора? Простейший
> встроенный текстовый редактор. У нас тут все
На форуме по МАРК-SQL говорят, что в нем есть свой редактор, который иногда улучшается. Никогда не задумывался, но фактически он есть в любой АБИС, иначе ввод и редактирование были бы просто невозможны, только такое слово не употребляется. Вероятно, в ИРБИСе он из Delphi?

Кстати, буквально на днях размышлял о том, что можно было бы сделать визуальный редактор, генерирующий файл с разметкой на языке форматирования ИРБИС. С его помощью каждый пользователь смог бы, например, сам настраивать внешний вид карточек. Да, знаю, что там целый язык программирования (в отличие от HTML), но ведь можно было бы упростить создание конструкций посредством визуального проектирования (как это сделано в том же Delphi)?

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Gena (IP-адрес скрыт)
Дата: 23, October, 2012 19:53

Угу, а как объяснить машине, что выведенный мною лейбл должен учитывать гост на 60 страниц? И тут далеко не только один изык разметки данных принимает участие, но и RTF/HTML.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 23, October, 2012 20:53

Если честно, то описание RTF, которое идет в комплекте с Ирбисом, как-то не очень способствовало у меня возникновению ощущения понимания (впрочем, подозреваю, что и мои собственные технические описания не намного лучше, в то время как с позиции составителя всё изложено четко и ясно - да, к описанию языка форматирования ИРБИС это тоже относится!). Можно, конечно, проштудировать тему в Интернете, но хотелось сразу получить результат в виде готовой разметки карточки на отдельную статью в формате RTF. Opensource-библиотека для работы с RTF под .NET позволила мне это сделать, не вникая в детали формата. Подозреваю, что не всякий потенциальный конечный пользователь также захочет разбираться как с RTF, так и с ЯФ. Для задания формата выводимого текста с использованием RTF/HTML он скорее предпочтёт воспользоваться редактором типа WYSIWYG (ведь в текстовых процессорах нам же не приходится генерировать теги RTF вручную, да и HTML-странички не всегда создают в блокноте).

Насчет ГОСТов ничего не могу сказать - просто не сталкивался с такой проблемой, у нас всё не так строго: лишь бы была карточка (а ни для чего другого у нас язык разметки и не нужен). Как бы я заставил программу их учитывать? Ну, может, заранее составил бы все такие описания по различным ГОСТам и подключал бы в качестве шаблонов. В целом, идея такая: для вывода RTF/HTML используем средства WYSIWYG, для языка разметки - средства наподобие RAD (возможно, с мастерами для тех же ГОСТов, к примеру, и визуальными конструкторами программ наподобие блок-схем).

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Gena (IP-адрес скрыт)
Дата: 24, October, 2012 01:24

1. В Ирбисе все стандартные выходные документы уже есть. Что вы предлогаете еще разрабатывать? Разве комплект карточек не формируется по умолчанию? Разве требуются еще какие-то доработки?

2. Если вам приходится редактировать карточки, то это значит говорит об одном из двух:
2.1. или у вас принципы работы с КК отличаются от тех, на которых работают оставшиеся 2000 пользователей Ирбиса (и тут стоит задуматься организационно)
2.2. Или стоит обратится к специалистам/посидеть самому и довести формат формирования карточек до такого уровня, при котором ручная работа над ними исключается

3. В люлм случае, даже и в случае с ручной отрисовкой шаблона вы получите сугубо макет, но ни какое не наполнение, под которое вам понадобится все равно писать обработку на языке форматирования данных Ирбис и подключать его. Так где же профит? Более того, никто не запрещает вам пользоваться в своих выходных формах возможностями WYSIWYG - я многие таблицы в начале рисовал в Верде, потом сохранял в формате RTF, а далее открывал в блокноте и нарезал для своих нужд на куски. Чаще всего разметка представляет из себя таблицу с невидимыми линиями. Если нарисовать таблицу, а потом в каждую ячейку забросить какую-то уникальную информацию (например 1111111111111,222222222222222,333333333333), то в текстовом редакторе вполне просто одно отличить от другого.

Итог: вам не хотелось изчучать язык форматирования, а вот изучить Opensource-библиотека для работы с RTF под .NET захотелось. Это ваше право и ваш путь. Но это было применено к решению этой проблемы. А дальше когда-нибудь рийдется дорабатывать веб-ирбис, который так же использует язык ирбиса. И что тогда? Опять таки не хочется же учить язык разметки ирбис. Прийдется писать парсеры и налету резать страницы от веб-ирбиса и доводить их до ума в своем веб-сервер?

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 24, October, 2012 03:53

Поддерживаю концептуально - не следует умножать число сущностей сверх необходимости (Оккам). Сложное уникальное решение и только для собственного удовольствия?
А вот почти то же от Гены [irbis.gpntb.ru]

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 28.10.2012 06:32 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 24, October, 2012 09:03

Цитата:
Gena
Итог: вам не хотелось изчучать язык форматирования, а вот изучить Opensource-библиотека для работы с RTF под .NET захотелось.

Не совсем. Мне хотелось сделать так, чтобы можно было печатать карточку на отдельную статью (в общем случае - на отдельный пункт оглавления) нажатием единственной кнопки. Сейчас это реализовано в БАРСиКе как отдельная вкладка того самого окна, где отображается полное описание документа (текущей записи). Ее содержимое меняется каждый раз при выборе пункта оглавления. И не поверите: текст в этом окне даже можно редактироватьsmiling smiley. Я мог бы просто выводить текст со сгенерированной мной разметкой RTF на печать.

Цитата:
или у вас принципы работы с КК отличаются от тех, на которых работают оставшиеся 2000 пользователей Ирбиса (и тут стоит задуматься организационно)

Я не знаю, чем наши принципы отличаются от принципов работы других пользователей. Просто была поставлена такая задача: печатать карточки, делая в тексте отступы в соответствии с разметкой (верхняя горизонтальная и две вертикальные линии слева). Поэтому и приходится подгонять их в Word'е. Если бы не это, нужную мне разметку я смог бы создать и средствами Ирбиса (не считая КК на отдельные статьи) - ну, или кто-то более в этом сведущий. А вот с учетом требований здесь уже необходимо что-то, что можно было бы назвать OLR (Optical LINE Recognition)smiling smiley. Будет ли в результате определения геометрических параметров генерироваться определенное описание формата на языке Ирбис, для которого затем можно будет вызвать функцию форматирования из irbis_client64.dll, или же просто конечный вид карточки в формате RTF для конкретной записи - не суть важно. Тут важна сама технология.

Цитата:
Или стоит обратится к специалистам/посидеть самому и довести формат формирования карточек до такого уровня, при котором ручная работа над ними исключается
Готов согласиться, если объясните мне, как это сделать с учетом вышеизложенных требований. Только вариант с шаблонами на ЯФ для каждого вида разметки карточек прошу не предлагать: иногда карточки и из одного комплекта различаются настолько, что, например, верхняя строчка текста поднимается вверх, выше первой линии, а текст в следующей строке оказывается перечеркнутым.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 26, October, 2012 04:31

Принципы Я.Л.Шрайберга и Ф.С.Воройского - всегда и для всех!
Как любил говорить последний (цит. по памяти): максимально широкое использование наиболее распространенных, стандартных, готовых, типовых решений... То есть заимствовать "по максимуму" всё качественное и общепризнанное. Или вот другой мой учитель А.Г.Гурский - всю жизнь предпочитает продукцию Microsoft, и не потому, что она лучше, а именно потому, что стандартнее.

irbis_arbat@mail.ru

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 04, November, 2012 00:19

О похожих необычных для библиотекаря способах ввода данных:
[irbis.gpntb.ru]
[www.ict.edu.ru]
[infosoc.ru]
[www.thermophysics.ru]
[elementy.ru]
[thermophysics.ru]

irbis_arbat@mail.ru



Редактировано 4 раз. Последний раз 03.12.2012 09:49 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, November, 2012 05:00

Дунаевская написал(а):
-------------------------------------------------------
> Lavrinovich написал(а):
> --------------------------------------------------
> -----
> > Как минимум одно недоумение: в содержании после
> > заглавия статьи указывается номер только первой
> ее
> > страницы, например, "С. 35", а нам нужно "С.
> > 35-59"
> Здесь форма записи не контролируется - можно
> указывать интервал страниц
>
> > Второе: могут быть переводчик, автор
> предисловия.
> > Редко, но бывает, и бывает очень нужно их
> указать;
> > мой любимый пример - предисловие Б.И.Маршака к
> > статье А Хопкинсона
> > [www.gpntb.ru],
> в
> > содержании их тоже нет
> Естественно, в одной строке содержания невозможно
> ввести всю библиографию, но у первых 3-х авторов
> есть подполе "Функция", для "других авторов" можно
> корректировать поле 926, а всю остальную
> неотраженную здесь библиографию дополнительно
> ввести в созданную запись аналитики.
А вот бы нажал одну кнопку (как в ракете из "Незнайки на Луне", то есть при коммунизме) и получил полный комплект аналитики по одному сборнику, журналу... но если нет задач печати карточек и ведения специализированных БД, аналитика просто не нужна? Естественно, при очень качественном и полном описании самих изданий.

irbis_arbat@mail.ru

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 30, November, 2012 16:55

Цитата:
Lavrinovich
Возможно ли в принципе автоматическое формирование аналитики из основного описания, так сказать, саморазборка оглавления (содержания)?

Цитата:
Lavrinovich
А вот бы нажал одну кнопку (как в ракете из "Незнайки на Луне", то есть при коммунизме) и получил полный комплект аналитики по одному сборнику, журналу...

Цитата:
Lavrinovich
2. не приведет ли реализация проекта к усугублению негативных традиций, когда, постоянно вводя данных в БД, библиографы не знают слов «база данных»


Нажми на кнопку - получишь результат
И твоя мечта осуществится
Нажми на кнопку, но что же ты не рад
Тебе больше не к чему стремиться

гр. "Технология", 1991.


Что обидно, на текущей работе мне действительно больше не к чему стремиться. Вряд ли я (или кто-либо ещё) смогу пользоваться БАРСиКом лучше, чем сейчас. Остаются мелкие изменения косметического характера. Ну, и надо ещё хотя бы частично перевести программу на работу с бесплатными компонентами. Тогда и демо-версию можно будет выложить (которая, как и входящая в её состав библиотека Nicomsoft OCR, позволит осуществлять операции по сканированию и распознаванию в течение 40 дней). Вот только возможности сохранить запись в БД там не будет (для демки будет достаточно и простого копипаста - кстати, ранние версии моей программы для оглавления работали именно так).

А что касается проекта по авторазбору оглавления, то по крайней мере в моём представлении он носит настолько глобальный характер, что под него не грех бы и грант выделить, и сторонних разработчиков привлечь. К сожалению, до сих пор нашей библиотеке не удалось получить ни одного гранта и вообще какого-либо финансирования.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 01, December, 2012 07:38

Однажды нес пастух куда-то молоко,
Но так ужасно далеко,
Что уж назад не возвращался.
Читатель! Он тебе не попадался?
Козьма Прутков

Братья Райт тоже были единственными пассажирами своего изобретения. Чукча писатель, чукча и читатель. Еще в 80-е разработчики писали с гордостью "интерфейс интуитивен и доступен непрограммисту".

irbis_arbat@mail.ru



Редактировано 1 раз. Последний раз 06.12.2012 04:47 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, December, 2012 05:05

Но вот сам способ ввода кажется странным и неэффективным. Чтобы было понятнее, вот об очень похожем способе

Трахтенгерц М.С.
Технология подготовки информации для баз данных в обменном формате ISO2709
В этой статье рассматриваются вопросы техники и организации подготовки входящего потока информации на примере информационно-поисковой системы CDS/ISIS for Windows (далее ISIS), используемой в Теплофизическом центре Института высоких температур РАН для базы данных ТЕРМАЛЬ.
Это можно сделать двумя способами:
- последовательно вводить поля документа с помощью системного интерфейса и сохранить законченный документ;
- импортировать массив документов, имеющих формат стандарта ISO 2709 для обмена данных.
Второй способ значительно эффективней, но для этого нужно, чтобы массив документов был бы ранее кем-то подготовлен.
С помощью сети Интернет стали доступны многие документы (статьи, книги, материалы из периодических изданий и т.д.), которые должны отражаться в соответствующих БД. Это позволяет обойти ручной набор текстов и значительно уменьшить трудозатраты на ввод данных.
Интерфейс системы ISIS можно использовать и в этом случае, копируя строки из электронного документа сначала в буфер обмена и затем в нужное поле интерфейса.
Но можно также некоторым определенным образом разметить электронный документ в отдельном редакторе и с помощью специальной программы получить эту информацию в формате ISO 2709. Соединив подготовленные таким образом записи из разных сеансов работы и/или различных сотрудников в достаточно большой файл, эти данные можно ввести в базу данных одним сеансом.
Не представляет проблемы также использование подобной схемы при документах на бумажных носителях. С помощью сканера и программы распознавания легко получить в электронном виде необходимую для ввода в базу данных часть документа (авторы, название статьи, реферат и т.д.) и использовать ее для сокращения ручного набора текста, а затем и записи для базы данных в формате ISO 2709.
[...]
Правила разметки текста заключаются в следующем:
Текст, подлежащий преобразованию в формат ISO 2709 заключается между первым символом @ и завершающей комбинацией символов $$$. Все, что находится вне этих символов, исключается из преобразования и может быть использовано для комментариев и рабочих указаний как в начале текста, так и между документами.
Информация, подлежащая внесению в некоторое поле БД, начинается с тэга этого поля (состоящего из трех цифр в системе ISIS) и заканчивается символом тильда ~.
[...]
Несколько полей могут помещаться в одной строке текста.
Последовательность полей в записи значения не имеет.
Как видно, эти правила просты и очевидны.
[...]
Программа преобразования размеченного соответствующим образом текста в формат обмена ISO 2709 IsoWin состоит из двух основных функциональных частей - собственного текстового редактора для разметки текста и конвертора текста.
В качестве редактора может быть использован также любой другой, который сохраняет текст в файле точно в таком же виде, каком он виден в окне этого редактора.
[...]
Программа IsoWin практически может стать основным инструментом рабочего места оператора подготовки информации для ввода в БД. В ТФЦ работа организована таким образом, что готовые документы от операторов поступают к администратору БД, который составляет массивы для очередного пополнения БД через операцию импорта. Он же осуществляет контроль правильности записей [...]
Освоенная ТФЦ ИВТ РАН новая технология работы с базами данных ISIS for Windows, которая распространяется UNESCO, показала свою эффективность и может быть рекомендована для широкого использования научными институтами, библиотеками, а также отдельными специалистами, имеющими дело с большими объемами информации [...]

[www.unesco.org]


[thermophysics.ru]
ТЕРМАЛЬ - база данных в Теплофизическом центре ИВТАН
Введение
Теплофизический центр ИВТАН был основан в 1973 году и с самого
начала он ориентировался на использование вычислительной техники.
[...]
В ТФЦ приходилось использовать доступную технику различных поколений (БЭСМ 3 и 4, ЕС ЭВМ, современные персональные компьютеры, а среди информационных систем АСИОР, для ЕС, ISIS для РС.
[...]
Пополняемая современная ИПС на базе ISIS с возможностями предоставления полнотекстовых электронных копий работ (статей и др.). Эта система может служить отличным информационным инструментом как для больших лабораторий, так и для личных потребностей научного сотрудника
[...]
Ввод документа состоит в последовательном заполнении записями полей с помощью рабочего листа, формируемого пользователем при создании
БД. Это можно сделать несколькими способами:
- самостоятельно набирать содержимое полей подготовленного документа по такому шаблону
- переносить записи из электронной статьи или отбирать их из другой базы данных, что требует многих операций по выделению, переносу через клипборд и размещению данных в нужных полях
- вводить новые документы группой произвольного объема с использованием операции “импорт”. В этом случае требуется, чтобы документы были представлены в формате обмена ИСО 2709.
Для реализации третьего варианта ввода электронных документов
разработана программа IsoWin. Она [...] позволяет улучшить контроль правильности подготовки данных, а также удобнее организовать работу группы сотрудников, занимающихся подготовкой информации для БД.

Освоенная ТФЦ новая технология работы [...] показала свою эффективность и может быть рекомендована для широкого использования как научными институтами, так и лично специалистами. Она имеет ценные новые функции, в том числе использование гипертекстовых ссылок для выхода на документы Интернет или на полнотекстовые документы.

irbis_arbat@mail.ru



Редактировано 8 раз. Последний раз 26.12.2012 11:40 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, December, 2012 05:06

Нажми на кнопку, получишь результат...
Мастера (Wizards, правильно Волшебники, Колдуны), макросы, макроскрипты (только в МАРК-SQL), форматные выходы ("юниформы") - если не вдаваться в тонкости, разные (или всего лишь по-разному называемые) средства получения примерно одного результата? Чуть не забыл мои любимые IBF, пакетные командные задания ИРБИСа - вот что действительно просто, наглядно, удобно и уникально!

Из Руководства по CDS/ISIS для Windows:
Следующая особенность пакета заключается в гибкости вывода записей на экран и печать. Это достигается благодаря специальному языку форматирования. Язык фор­матирования подвергался критике из-за своей сложности и запутанности, но [...] мы пытаемся показать, что он далеко не так сложен даже для малознакомого с компью­тером пользователя.

Из Общего описания системы ИРБИС:
Для новичков может показаться, что некоторые форматы являются очень сложными для понимания. Однако, все форматы, даже громоздкие, состоят по сути из довольно простых команд или функций, разделенных запятыми или пробелами. Кажущаяся сложность связана с тем, что формат может состоять из многих таких команд.

Так будем ли вместо этого "вешать свои кнопки"?


S-Presso, а что произойдет, если по вашему методу вводить фрагменты распознанной "расширенной латиницы" - немецких, французских, польских, чешских текстов? Сохранится ли диакритика, или будут кракозябры, или чистая латиница?

irbis_arbat@mail.ru



Редактировано 10 раз. Последний раз 04.12.2012 07:38 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: S-presso (IP-адрес скрыт)
Дата: 04, December, 2012 16:46

Цитата:
S-Presso, а что произойдет, если по вашему методу вводить фрагменты распознанной "расширенной латиницы" - немецких, французских, польских, чешских текстов? Сохранится ли диакритика, или будут кракозябры, или чистая латиница?

Проверил сейчас, поскольку самому стало интересно, что будет в результате. Взял для примера такое бибописание (оно было распознано уже достаточно старой версией компонента Nicomsoft, и здесь хорошо видны все его недостатки), самую малость его подредактировав (исправил несколько пограничных символов и добавил в аннотацию немного диакритики):

Войцеховский А.И.
В365 Тайны подземного мира / А. И. Войцеховский. — М.:
Вече. 2007. — 416 С. (Загадки ИСТОРИИ).
ISBN 978-5-9533-191 5-7
Д&#257;нн&#257;я книга рассматрива&#277;т проблемы, относящиеся к нашей планете: ее происхождению, строению, внутреннему состоянию и вещественному составу. %нако главное место В ней уделено некоторым особенностям, тайнам и загадкам, связанным с подземным И ПОДВОДНЫМ мирами Земли.
ВО МНОГИХ древних мифах И сказаниях народов нашей планеты ГОВОРИТСЯ О существовании разумной ЖИЗНИ В ее недрах. Современные ученые ОТНОСЯТСЯ К ЭТОЙ идее весьма сдержанно ИЛИ вовсе не принимают ее ВО внимание. Впрочем, СОбЫТИЯ И некоторые факТЫ последнего времени заставляют МНОГИХ ИЗ НИХ задуматься И ИЗменить свое прежнее мнение.
Существует ЛИ «полая» Земля?.. Раскрыта ЛИ тайна систем ПОДземных туннелей?.. ЧТО находится на дне морей И океанов?.. ЯВЛЯется ЛИ наша Земля ЖИВЫМ И разумным существом?..
Ответы на ЭТИ И многие другие ВОПРОСЫ читатели получат, ПРОчитав эту книгу, содержащую обширный фактический материал, а также наиболее известные гипотезы о так называемом внутреннем (подземном И ПОДВОДНОМ) мире нашей планеты.

"Прогнав" его через БАРСиК, получил в Каталогизаторе запись с сохранением расширенных символов. При том, что в самой оболочке БАРСиКа отображается чистая латиница. Приложенный файл получен путём экспорта записи из Каталогизатора в кодировке UTF-8. Если же экспортировать в кодировку Windows, также будет чистая латиница.

Кстати, как раз сегодня вышла новая версия OCR SDK v3.6. Скачать можно отсюда: [www.nicomsoft.com] (Примечание: это демо-версия, и только для разработчиков, хотя написать на её основе некий аналог FineReader, в общем, не так сложно - по крайней мере, в первом приближении). Качество распознавания уже заметно улучшено в сравнении с тем, что в примере, но для длинных оглавлений я бы по-прежнему не стал советовать этот компонент. Как мне объяснял автор, пока задача хорошего распознавания русского языка не является приоритетной, и для качественного выполнения моих задач (т.е. внедрения в библиотеках) нужно подождать по крайней мере несколько месяцев. Правда, с тех пор уже как раз прошло несколько месяцев smiling smiley... а воз и ныне там (диплом не защищён, оглавления по-прежнему обрабатываются FineReader'ом : с привлечением БАРСиКа - у меня; без БАРСиКа - у других наших сотрудников; с одним Word'ом - к сожалению, пока у большинства прочих бибработников...).



Только что перестроил проект с новой версией компонента. Можете сами посмотреть на улучшения в отношении OCR за прошедшие несколько месяцев. Я специально не стал ничего редактировать, и сохранил запись как есть (а какой символ (единственный!) и в каком месте следовало вставить, сообразит любой каталогизатор) - вы найдёте её импортируемый вариант во втором приложенном файле.

ВойцеховскийА.И.
B65 Тайны подземного мира / А. И. Войцеховский. — М.:
Вече, 2007. — 416 с. (Загадки истории).
ISBN 978-5-9533-1915-7
Данная книга рассматривает проблемы, относящиеся к нашей планете: ее происхождению, строению, внутреннему состоянию и вещественному составу. Однако главное место в ней уделено некоторым особенностям, тайнам и загадкам, связанным с подземным и подводным мирами Земли.
Во многих древних мифах и сказаниях народов нашей планеты говорится о существовании разумной жизни в ее недрах. Современные ученые относятся к этой идее весьма сдержанно или вовсе не принимают ее во внимание. Впрочем, события и некоторые факты последнего времени заставляют многих из них задуматься и изменить свое прежнее мнение.
Существует ли «полая» Земля?.. Раскрыта ли тайна систем подземных туннелей?.. Что находится на дне морей и океанов?.. Является ли наша Земля живым и разумным существом?..
Ответы на эти и многие другие вопросы читатели получат, прочитав эту книгу, содержащую обширный фактический материал, а также наиболее известные гипотезы о так называемом внутреннем (подземном и подводном) мире нашей планеты.


Да, технологии развиваются, и мы вместе с ними.hot smiley (Всё, пошёл приводить свой алгоритм разделения на поля в соответствие с ГОСТ 7.1-2003).

Вложения: Тайны подземного мира_UTF-8.TXT (2KB)   Тайны подземного мира.TXT (1.2KB)  
Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 05, December, 2012 04:56

Во всем мне хочется дойти до самой сути
Б.Л.Пастернак

Уважаемый Senya, снова радует Ваш энтузиазм, несмотря ни на что. Превращать все в чистую латиницу - это романизация, метод Библиотеки Конгресса США, значит вполне солидный, авторитетный.
***
Привел большие цитаты из М.С.Трахтенгерца, чтобы обдумать и обсудить оптимальные способы... очень уж непривычно, небиблиотечно...
Вот еще О необычных для нас способах ввода данных:
[irbis.gpntb.ru]
[www.ict.edu.ru]
[infosoc.ru]
[www.thermophysics.ru]
[elementy.ru]
[thermophysics.ru]

irbis_arbat@mail.ru



Редактировано 4 раз. Последний раз 01.01.2013 07:32 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 02, January, 2013 07:18

Предмашинная обработка, пакетный ввод - почти никто не помнит этих терминов из практики ОНТИ 70-х. Кстати, термин CDS/ISIS, унаследованный ИРБИСом, "рабочий лист", взят оттуда. Первоначально это были настоящие большие бумажные листы, заполнявшиеся экспертами, а данные вводились в пакетном режиме операторами. И никаких каталогизаторов, библиографов. Изредка эта технология применяется и сегодня.
***
Дорогие коллеги, единомышленники, соратники, друзья, помощники, учителя!
С Новым годом, Рождеством вас всех, счастья, любви, дружбы, здоровья, творчества, радости! Успехов в бизнесе, науке, искусстве, спорте и всем остальном!
Как советовал всем людям Заратуштра - добрые мысли, добрые слова, добрые дела.

irbis_arbat@mail.ru



Редактировано 2 раз. Последний раз 02.01.2013 11:33 пользователем Lavrinovich.

Re: Дипломная работа о разработке вспомогательного модуля БАРСиК для ИРБИС
Пользователь: Лавринович Алексей (IP-адрес скрыт)
Дата: 13, April, 2022 04:45

Профессиональное решение похожей задачи - FormReader, разработка ABBYY в области ICR (Intelligent Character Recognition). Технологию FlexiCapture видимо можно представить как преобразование текста в таблицу или простейшую базу данных. Технология позволяет организовать автоматический ввод данных из печатно-рукописных "гибких форм", то есть таких, у которых размеры и расположение отдельных полей на разных экземплярах могут не совпадать. Каталожные карточки и библиографичекие списки можно рассматривать как "гибкие таблицы" с невидимыми границами полей (областей и элементов библиографического описания).,объем которых может очень сильно варьировать.
Это не реклама

Иностранный агент

Страницы: <<12
Страница: 2 из 2


Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.