Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис   
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Темы: <<>>
Навигация: Список темНовая темаИскатьВойти
Visual HCA
Пользователь: kneuuser (IP-адрес скрыт)
Дата: 27, August, 2010 14:59

Добрый день!!
Библиотека Киевского национального экономического университета.
Наша библиотека купила полный пакет ИРБИСа. Именно с программой Полнотекстовые БД Version 2006.2 возникли проблемы.
Мы установили програму и загрузили несколько баз данных. Пытались классифицировать словари ПОС по темам на несколько кластеров с помощью приложения Visual HCA: она самовольно выключалась и давала сбой при добавлении текстов больше 6.
Возможно разделение словаря на кластеры (темы) вручную (с помощью раскрашивания кластеров), но это крайне неудобно из-за большого объема текстов и словарей, которые нам предстоит загружать.Есть ощущение, что программа работает не по системе, а случайно генерирует результаты. ОНа отказывается грузить в Естественно-тематический классификатор БД тексты после их класификации.
Какой есть возможный выход из этой ситуации? Мы заинтересованы в том, чтобы работа с большим количеством текстов (в библиотеке их будут тысячи) не занимала много времени и работала стабильно.
P.S.Visual HCA версия 1.3 (Эвристический анализ)

Re: Visual HCA
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 27, August, 2010 16:21

Скажу так: я с самого начала появления этого приложения пытался выделить из текстов смысловые словари. К сожалению, ни в одном наборе полных текстов у меня не получилось это сделать более менее качественно.
Это слишком наукоемкий инструмент и в нем очень много настроек. Уверен, что Константин Олегович, написавший его, смог бы любое множество документов классифицировать по темам. Но то он. Простым смертным остается на это приложение только молиться.
то, что данные не случайны - это конечно же 100%. Ни о какой рандомизации и речи быть не может. Просто Этот инструмент не доведен до уровня, когда им сможет пользоваться простой пользователь.

В связи со всем выше сказанным могу вам рекомендовать только одно: не пользуйтесь этим инструментом. Просто создавайте словарь по всем текстам и ищите без тематики. Это тоже достаточно эффективный поиск и дает свои результаты.

Re: Visual HCA
Пользователь: kneuuser (IP-адрес скрыт)
Дата: 30, August, 2010 10:51

Спасибо Вам большое, что как-то помогли разрешить нашу дилемму!!

Re: Visual HCA
Пользователь: whim (IP-адрес скрыт)
Дата: 29, September, 2010 05:36

Здравствуйте, Максим!
Абсолютно с вами согласна, что "Этот инструмент не доведен до уровня, когда им сможет пользоваться простой пользователь". Я вот уже неоднократно читаю и не понимаю до конца всего. Может есть какое-нибудь другое руководство, более подробное?

Re: Visual HCA
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 29, September, 2010 07:09

Более подробное руководство:

Сбойчаков Константин Олегович. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки : Дис. ... канд. техн. наук : 05.25.05 : Москва, 2003 169 c. РГБ ОД, 61:04-5/2564

[www.dslib.ru]

Re: Visual HCA
Пользователь: whim (IP-адрес скрыт)
Дата: 29, September, 2010 07:36

спасибо )) Ну это конечно хорошо, но он все-таки как разработчик мог бы написать другое руководство к своей системе, более подробное, а не эту анотацию к диссертации ))

Re: Visual HCA
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 29, September, 2010 08:16

Другой нет. Вернее в дистрибутиве есть автореферат этой диссертации.

Re: Visual HCA
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 29, May, 2011 04:54

И написано ужасно, и сам исчез, и ссылка устарела.
Какую же великую научную проблему он разрабатывает сейчас? Наверно, теорию единого поля или Общую Теорию Всего?



Редактировано 4 раз. Последний раз 06.12.2011 15:28 пользователем Lavrinovich.

Re: Visual HCA
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 19, July, 2011 03:22

Или идея возникла раньше времени?



Навигация:Список темИскатьВойти
Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.