Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
ИМИДЖ-КАТАЛОГ :  ИРБИС Irbis
 
Автоматический перевод распознанного текста с иностранного языка
Пользователь: library_gov (IP-адрес скрыт)
Дата: 30, August, 2011 12:02

В отделе иностранной литературы оказались ОТДЕЛЬНЫЕ картотеки (КК) на фонды ИНОЯЗЫЧНОЙ литературы, т.е. фонд англоязычных, франкоязычных и т.д. источников. Возникло такое желание:

- по желанию пользователя включать функцию автоматического перевода результатов распознавания с конкретного языка, с помощью лицензионных продуктов, например LINGVO, как происходит распознавание с помощью продукта ABBYY
- создать отдельный поисковый словарь по результатам автоперевода, а может быть сбрасывать и в общий словарь, распознанного текста....
- в окне просмотра предусмотреть переключатель, который мог подключать изображение КК с ВСТРОЕННЫМИ в русскоязычный текст и ПОЛНОСТЬЮ переведенным иноязычным текстом с КК, как это происходит с подключением оборотной стороны КК

Для чего это предлагается? Ясно, что автоперевод это "подстрочник", а не идеальное решение, НО это решение может помочь при поиске читателю, который НЕ знает иностранный язык, а КК может содержать ПОЛНОСТЬЮ иноязычный текст, а кроме того, может быть поможет каталогизатору при редактировании КК после распознавания, допустим для ОТБОРА источников для более глубокого описания, чем результат распознавания КК на источник.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Alio (IP-адрес скрыт)
Дата: 30, August, 2011 13:05

Идея здравая...
Если можете - подскажите программный "движок" для перевода.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: library_gov (IP-адрес скрыт)
Дата: 30, August, 2011 13:47

Идея здравая...

Спасибо, Александр Иосифович...

Если можете - подскажите программный "движок" для перевода.

ABBYY Lingvo - на "Крым-2011" был "круглый стол" по вопросам использования словарей для перевода этой компании, в частности для проверки грамматики русского языка в среде ИРБИС

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: library_gov (IP-адрес скрыт)
Дата: 31, August, 2011 11:30

К концу этого года, по имеющейся информации, фирма ABBYY готовит специальный продукт, который позволит переводить части текста с одного языка на другой, с учетом семантики, "пакетами", примером такого пакета, по всей видимости может стать текст с КК. Постараюсь в ближайшее время, с разрешения компании, предоставить более полную информацию о данном продукте.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 01, October, 2011 14:34

Как и многое другое, предлагал сделать это давно, но и сам тогда считал невозможным.
Очень сильно пересекается с автопереводом вообще - пока не решенная задача, и решена будет в лучшем случае не скоро.
А как быть с правилами библ. описания, специфическими сокращениями и т. д.?



Редактировано 1 раз. Последний раз 28.11.2011 10:01 пользователем Lavrinovich.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Gena (IP-адрес скрыт)
Дата: 03, October, 2011 12:09

По большому счету, это не так уж и важно - поисковые запросы чаще строятся отталкиваясь от ключевых терминов с усечениями, а библиотечная пунктуация и сокращения для читателя редко представляют интерес.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 04, October, 2011 11:23

А если в ЭК нет КС или они очень некачественные? Видел такое, что в это поле "вбивали" даже так называемые врезки - элемент полиграфического дизайна, часто используемый в газетах (броская цитата из статьи, выделенная крупным шрифтом). Это, конечно, абсурд и крайний случай.



Редактировано 2 раз. Последний раз 28.11.2011 10:02 пользователем Lavrinovich.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Gena (IP-адрес скрыт)
Дата: 04, October, 2011 17:10

И? Мы не прыгаем выше головы, мы предлагаем новый инструмент для работы со старыми технологиями. Это первая ступень автоматизации и она уже значительно повышает качество поиска. Хотите качество поиска еще выше - вводить тезаурусный поиск, повышайте квалификацию систематизаторов... Но это уже не относится к данному продукту. Имидж-каталог - это не полноценный Электронный каталог. Я бы его рассматривал сугубо как промежуточное звено дл тех случаев, когда требуется быстро, а о качестве можно пока что не думать.

Оффтоп. По поводу ключевых слов - я вообще мало встречал в своем родном городе библиотек, которые подходили бы к выбору ключевых слов с научной точки зрения. По моим скромным прикидкам, в разных ЭК от 10% до 30% КС вообще неинформативны, составлены неправильно или не отражают суть документов. И это большая проблема! По этому я все больше задумываюсь о введении тезаурусов как для поиска, так и для ввода КС.



Редактировано 1 раз. Последний раз 04.10.2011 17:13 пользователем Gena.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 05, October, 2011 05:10

Когда писал, думал не об имидж-каталоге, а о КС вообще.
Рекомендации Воройского по индексированию КС все забыли или не читали. Сейчас не могу их найти, хотя нашел несколько похожих.
И опять скажу: берите готовый словарь КС из "Б-ки 4.02", пусть немного устаревший, но качественный.



Редактировано 2 раз. Последний раз 28.11.2011 10:03 пользователем Lavrinovich.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Gena (IP-адрес скрыт)
Дата: 05, October, 2011 11:37

Тему ключевых слов надо перенести в отдельную ветку.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: library_gov (IP-адрес скрыт)
Дата: 07, October, 2011 22:53

И? Мы не прыгаем выше головы, мы предлагаем новый инструмент для работы со старыми технологиями. Это первая ступень автоматизации и она уже значительно повышает качество поиска. Хотите качество поиска еще выше - вводить тезаурусный поиск, повышайте квалификацию систематизаторов... Но это уже не относится к данному продукту. Имидж-каталог - это не полноценный Электронный каталог. Я бы его рассматривал сугубо как промежуточное звено дл тех случаев, когда требуется быстро, а о качестве можно пока что не думать.

согласен... потом записи на которые выводит читатель нужно/можно дорабатывать в первую очередь ... активная часть фонда... и так далее, если есть силы каталагизационные.... можно говорить о корпоративном РЕДАКТИРОВАНИИ тех записей, которые подняты со дна каталожных ящиков... главное их УВИДЕТЬ... а именно это предоставляет "имидж-каталог"...



Когда писал, думал не об имидж-каталоге, а о КС вообще.
И опять скажу: берите готовый словарь КС из "Б-ки 4.02", пусть немного устаревший, но качественный.

как может быть "готовым" словарь КС, если он постоянно пополняется... в ИРБИС именно так... а если он не пополяется,а нормируется, так это уже не КС, а почти дескрипторы... там и до тезауцруса недалеко.... а против тезауруса я не возражаю....

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 11, October, 2011 07:01

Берите готовый в том смысле. что берите за основу, хотя бы как "информацию к размышлению", а не в том смысле, что без изменений.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 23, October, 2011 15:41

Воройский говорил "мягко нормированный"...

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 24, October, 2011 09:59

Похоже, что поиск в ИРБИС гораздо совершеннее, богаче нюансами, чем в поисковиках. Там, конечно, тоже есть логические операторы, но их мало кто знает и использует. И тоже есть расширенный поиск...
Хотя, действительно, до Гугла всем далеко. Но так уж ли умно он определяет релевантность? Вспоминаю хвалебную публикацию в журнале «Научные и технические библиотеки России», называлась что-то вроде «Избавление от посредников». Из нее, кажется, впервые я узнал о Гугле. А теперь думаю, что он «лучше всех» не за счет гениальности его создателей, а за счет бюджета и железа (по подсказе М. Панева).
Но почему же в Гугле пропал расширенный поиск? Или мне мерещится?



Редактировано 2 раз. Последний раз 21.08.2012 08:12 пользователем Lavrinovich.

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 28, November, 2011 10:04

Gena написал(а):
-------------------------------------------------------
> Тему ключевых слов надо перенести в отдельную
> ветку.
Не то что в ветку - в новый раздел "Лингвистическое обеспечение"!

Re: Автоматический перевод распознанного текста с иностранного языка
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 02, December, 2011 08:09

После распознавания часто требуется ручная корректировка, так что уже поэтому автоперевод не получится?



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.