|
|
Научная жизнь | Конференции и семинары | 2005 | Современные информационные технологии и филология | А.А. Пичхадзе, А.И. Зобнин
А. А. Пичхадзе, А. И. Зобнин (Москва)
Синтаксическая разметка древнерусского текста в полнотекстовых базах данных
В 2004-2005 гг. началась синтаксическая разметка текстов, входящих в состав корпуса древнерусских переводных памятников XI-ΧΙΙΙ вв. Одновременно совместно с Лабораторией автоматизации лингвистических исследований Удмуртского государственного университета во главе с В. А. Барановым разрабатывались и продолжают разрабатываться принципы синтаксического разбора древнерусского текста. В рамках универсальной модели разметки синтаксиса, разработанной в Удмуртском университете, была создана база данных с набором форм для синтаксической разметки. Программа позволяет выделять в тексте синтаксические единицы разных уровней (словоформы, предложения и их предикативные части, фразеологические обороты), указывать их свойства (синтаксическая функция и т.д.); устанавливать связи и свойства связей между единицами (например, равноправие однородных членов, подчинение главным словом зависимого), а также указывать роль единицы в составе связи (главная / зависимая, основная / связующая и т.д.). Каждая связь получает определение как со структурной, так и со смысловой точки зрения. При синтаксическом разборе используется информация из морфологической разметки. Отмечается совпадение или расхождение с греческим оригиналом в отношении наличия связи и порядка слов, образующих концы связи. Валентность глаголов характеризуется как обязательная, факультативная или отсутствующая. Получены некоторые нетривиальные лингвистические результаты, касающиеся порядка слов в древнерусском. В перспективе планируется автоматизировать заполнение некоторых полей базы данных по значениям других полей и улучшить пользовательский интерфейс (в частности, добавить графическое представление разметки).
|
|
|
|