Ru | Eng
05 декабря 2024
Почта


 
Архив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отделФундаментальная электронная библиотекаФундаментальная электронная библиотекаАрхив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отдел



 

Научная жизнь  | Конференции и семинары  | 2005  | Современные информационные технологии и филология  | А.А. Пичхадзе, А.И. Зобнин 


А. А. Пичхадзе, А. И. Зобнин (Москва)

Синтаксическая разметка древнерусского текста
в полнотекстовых базах данных

В 2004-2005 гг. началась синтаксическая разметка текстов, входящих в состав корпуса древнерусских переводных памятников XI-ΧΙΙΙ вв. Одновременно совместно с Лабораторией автоматизации лингвистических исследований Удмуртского государственного университета во главе с В. А. Барановым разрабатывались и продолжают разрабатываться принципы синтаксического разбора древнерусского текста. В рамках универсальной модели разметки синтаксиса, разработанной в Удмуртском университете, была создана база данных с набором форм для синтаксической разметки. Программа позволяет выделять в тексте синтаксические единицы разных уровней (словоформы, предложения и их предикативные части, фразеологические обороты), указывать их свойства (синтаксическая функция и т.д.); устанавливать связи и свойства связей между единицами (например, равноправие однородных членов, подчинение главным словом зависимого), а также указывать роль единицы в составе связи (главная / зависимая, основная / связующая и т.д.). Каждая связь получает определение как со структурной, так и со смысловой точки зрения. При синтаксическом разборе используется информация из морфологической разметки. Отмечается совпадение или расхождение с греческим оригиналом в отношении наличия связи и порядка слов, образующих концы связи. Валентность глаголов характеризуется как обязательная, факультативная или отсутствующая. Получены некоторые нетривиальные лингвистические результаты, касающиеся порядка слов в древнерусском.
В перспективе планируется автоматизировать заполнение некоторых полей базы данных по значениям других полей и улучшить пользовательский интерфейс (в частности, добавить графическое представление разметки). 
 



В этом разделе:
   
 

                                         121069, г. Москва,
                                         ул.Поварская 25а.
                                         info@imli.ru





© ИМЛИ им. А.М.Горького РАН

Интернет-портал ИМЛИ РАН создан при поддержке Программ фундаментальных исследований Президиума РАН «Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006)

Дизайн и программная поддержка - Компания BINN.
http://www.binn.ru