Здравствуйте. Хочу предложить свои услуги для группы адаптации. Пишу на C++ Builder (теоретически могу и на Delphi), C#, немного знаю сервлеты и ASP.NET. Сейчас обкатываю новые идеи на самостоятельно разрабатываемом мной АРМе "АльтерВвод" - [
irbis.gpntb.ru].
На данный момент есть такие предложения, которые я планирую в скором времени реализовать (по крайней мере, для себя):
1. Поиск в пользовательском режиме. Здесь пользователь может задавать свою собственную функцию для поиска (вызываемую из его DLL), которая принимает входные данные поискового запроса и возвращает результат в виде списка MFN найденных записей.
2. Автоматическая коррекция всех повторений отдельно выбранных подполей для таких многократно повторяющихся полей, как оглавление, список статей, персоналий и т.д. Призвана помочь в исправлении допущенных библиотекарем ошибок либо последствий вставки распознанного текста (например, оглавления) из буфера обмена. В настоящий момент АРМ "АльтерВвод" позволяет путём выбора соответствующих опций, применяемых сразу ко всем, либо к выбранным повторениям конкретных подполей:
* переносить инициалы авторов статей сборников (или произведений, входящих в оглавление) в конец строки;
* разделять фамилию и имя по отдельным подполям, переносить текст подполя в нижний регистр (с сохранением заглавной букве в начале, если это название статьи или произведения, или в начале каждого слова, если это имя автора);
* убирать лишнюю точку в конце;
* удалять неправильно сформированные сведения об ответственности.
Можно было бы предусмотреть и пользовательские функции для автокоррекции, либо свои unifor'ы с поддержкой регулярных выражений для поиска и замены.
3. Библиоредактор. Заполнение полей новых записей, не выходя из текстового редактора. Опять-таки относится к обработке распознанного средствами OCR текста оглавления или биб. описания. Выделение фрагментов текста с занесением в соответствующие поля, выбираемые из списка. И снова пользовательские режимы для вызова внешних подпрограмм, позволяющих автоматизировать распределение данных по нужным полям. Для последнего у меня уже имеется парочка плагинов (работающих, правда, не в режиме библиоредактора, а подключаемых непосредственно к АРМ "АльтерВвод" и - теоретически - к Каталогизатору согласно документации), один из которых сам пытается разбить на отдельные поля текст биб.описание, а второй последовательно разбирает текст оглавления для перевода в формат Ирбиса - здесь для выделения из текста границ отдельных подполей приходится задавать регулярные выражения. Возможно, удастся каким-то образом упростить и автоматизировать и этот процесс, если последовательно выделить несколько повторений одного и того же подполя и заставить компьютер найти закономерность (подходящие регулярные выражения для границ).