Umid-ii	Локализация	Клавиатура	Орфография	СЛОВАРЬ
Наборы инструментов	Транслитерация в латиницу	Конвертеры и декодирование	Редактор списков	Планы и развитие

СЛОВАРЬ

НАЗНАЧЕНИЕ СЛОВАРЯ В КОМПЛЕКСЕ ПРОГРАММ

ГЛАВНЫЕ ОТЛИЧИЯ ПРИЛОЖЕНИЯ ОТ ЕГО АНАЛОГОВ.

Ответы на ваши вопросы

Словари в процессах обнаружения ошибок.

Словарь - это исходный набор слов , необходимый для поиска и обнаружения ответов на поставленные к нему запросы. В данном случае словарь служит для сравнения ошибочных записей в документах пользователя. Какой должен быть объём словаря, чтобы его пользователь мог отслеживать допускаемые ошибки? Как определить его оптимальные размеры?

Это очень спорный вопрос, и на него трудно дать однозначный ответ. Дело в том, что увеличение объёма словаря не гарантирует пользователя от возможных ошибок в проверяемых текстах. Если учитывать, что до настоящего времени нет у пользователя такого компьютера, который понимал бы смысл набираемых текстов. Всё, на что способен компьютер - это выполнить быстро задание по запрограммированному алгоритму. Это означает, что в предложении, содержащем фразу: пачка сигарет или почка сигарет, печка сигарет ошибок обнаружить он не сможет. Вывод прост - процесс обнаружения ошибок меньше зависим от количества слов в базе, в сравнении с алгоритмом анализа и обнаружения ошибок, а так же - от качественного состава словаря.

Основным назначением данного словаря является оказание помощи при запросах для перевода с узбекского языка. При работе с текстом документа важно, быть уверенным в правильном изложении, что связано с необходимостью поиска и сравнения с образцовым написанием в "базе знаний". Как правило, пользователь обращается к словарю, не зная правописания нужного слова, или его толкования (перевода). Этот словарь решает такие проблемы

Назначение словаря в комплексе программ.

Главным назначением словаря является способность в нахождения ответов на поставленные к нему запросы. Не мене значимым является возможность обновления и сохранения обновленной информации. Словарь узбекского языка в комплексе программ

Для этого в проекте UMID-II были реализованы следующие программные решения:
- отслеживание ошибок при вводе запроса, правильности записей всех дополнительных символов в словах на узбекском языке, т.е. проводится анализ возможных ошибок при сравнение с образцовой записью;
- дополнение в базу "спорных" вариантов записей, которые ориентируют пользователя в его правильном выборе ответов.

На рисунке показан пример запроса с словарю: слово курмок выполняется заведомо с типичными ошибками. Однако, как можно видеть, словарь возвращает два варианта написания этого слова. При выделении слова из списка - получаем его значение перевода. Предварительный анализ ошибок при запросах к "базе знаний" позволил использовать это приложение по своему прямому назначению - возвращать необходимые варианты ответов.

Основной словарный запас для "базы" UMID-II был сформирован на проверяемых текстах документов и методических руководств, публикуемых в юриспруденции. Много слов заимствовано из Законодательных актов. Остальные, необходимые для анализа, словоформы будут пополняться программно из Ваших документов в процессе проверки ошибок.

При инсталляции комплекса программ UMID у Вас на компьютер подгружаются начальная "база знаний" которая состоит из пяти списков словарей:

новые слова - для дополнений новыми словами с переводом;
основной словарь - для сравнения при записи новых словоформ;
авто-замена - для слов с однозначным толкованием;
ваша лексика - для хранения всех новых словоформ (обучение);
новые аффиксы - для автоматической генерации новых словоформ при проверке ошибок.

Все словари, при инсталляции приложения, имеют первоначальные записи, которые остаются у пользователя и после де инсталляции (удаления) комплекса программ. При всех последующих установках программы UMID-II, она работает со списками, которые были оставлены ранее. Таким образом каждый пользователь будет иметь свою индивидуально развиваемую "базу знаний", содержание которой отражает профессиональную специализацию и интеллект пользователя.

Главные отличия от аналогичных приложений.

Здесь Вы можете набирать слово, даже не зная его правописания. Попробуйте, к примеру, найти в словаре из 80000 слов, слово хукукий, в котором Вам не известно его написание. Это слово состоит из пяти букв, которые могут писаться с элементом и без него. Используя несложные вычисления, получим 5^2 = 25 число вариантов при просмотре значений в словаре. UMID все комбинации символов обнаруживает моментально.

При обращении к словарю (при вводе с клавиатуры, или перетаскиванием "мышкой" прямо из документа в WORD) слово проверяется во всех списках, при этом делается предположение, что записанное слово может содержать ошибку. Исследуются все возможные комбинации кодов. Результаты выводятся в списке диалога на форме.

Это его главное отличие от аналогичных электронных словарей позволили с уверенностью именовать - орфографическим.

Перспективным направлением развития этого приложения считается дальнейшее обновление новыми возможностями:
    -    поиск слов на узбекском языке по переводам с русского языка;
    -    поиск слов одинаковых по смыслу, но разных в изложении (тезаурус для слов на узбекском языке);
    -    обработка информации в представлении на узбекском языке в латинице.
    -    возможность формирования дополнительных тематических словарей.

ВРЕМЯ, НЕ ЖДЁТ..

Вы можете высказать свои замечания автору проекта Комплекс программ UMID-II, посетив открытый форум.

Если Ваше предложение окажется конструктивным, то Вы вправе рассчитывать на вознаграждение.
Принимаются предложения от спонсоров и по вопросам коммерциализации проекта
e-mail

Для подробного изучения состава проекта Вы можете скачать его описание - 200k