Ru | Eng
24 апреля 2024
Почта


 
Архив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отделФундаментальная электронная библиотекаФундаментальная электронная библиотекаАрхив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отдел



 

Научная жизнь  | Конференции и семинары  | 2005  | Современные информационные технологии и филология  | Э.В. Квяткевич 


Э.В. Квяткевич (Познань)

Опыт морфологического компьютерного словаря существительных польского языка

В рамках проекта создается программа морфологического синтеза существительных польского языка. Основная задача морфологического синтеза - порождение грамматических форм слова по заданным парадигмам. В данный момент на базе польского языка не наблюдается программных средств указанного направления, способных решать подобного рода задачи. Это имеет следствием прежде всего отсутствие поисковых систем должного уровня, учитывающих морфологическую специфику польского языка. Наиболее популярные польские поисковые машины (www.onet.pl, www.wp.pl, www.interia.pl) по всем основным показателям не могут сравниться с аналогичными российскими, что является существенным препятствием на пути развития польского сегмента сети Интернет и польского информационного пространства в целом.
Одной из причин такого неутешительного положения вещей стало отсутствие на материале польского языка грамматического словаря, подобного словарю А.А. Зализняка, который, как широко известно, лег в основу российских программ морфологического анализа и в конечном счете – поисковых систем русского интернета.
Первоочередной задачей было составление адекватной классификации субстантивного словоизменения, т.к. имеющиеся в наличии классификации были или неполны или недостаточно подробны для использования в системах автоматического синтеза. Для создания классификации был выбран компромиссный подход, удобный для практического решения поставленной цели и адекватный с лингвистической точки зрения.
Следующим этапом стала разработка алгоритмов анализа слова, приписывающих ему соответствующие словоизменительные характеристики. Также был разработан алгоритм, порождающий полную парадигму слова по заданной характеристике.
Разработанная программа анализирует слово, предлагает пользователю допустимые для него типы склонения и возможные чередования. Окончательный выбор словоизменительного типа остается за пользователем, который в случае необходимости добавляет в парадигму и формы-исключения.
В дальнейшем предполагается продолжение работы над созданием такого словаря, что подразумевает, в первую очередь, выход за рамки субстантивного словоизменения и разработку программ морфологического синтеза для других частей речи.
 



В этом разделе:
   
 

                                         121069, г. Москва,
                                         ул.Поварская 25а.
                                         info@imli.ru





© ИМЛИ им. А.М.Горького РАН

Интернет-портал ИМЛИ РАН создан при поддержке Программ фундаментальных исследований Президиума РАН «Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006)

Дизайн и программная поддержка - Компания BINN.
http://www.binn.ru