Ru | Eng
16 июля 2024
Почта


 
Архив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отделФундаментальная электронная библиотекаФундаментальная электронная библиотекаАрхив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отдел



 

Научная жизнь  | Конференции и семинары  | 2005  | Современные информационные технологии и филология  | В.Б. Литвинов 


В. Б.Литвинов (Снеженск)

ИСПОЛЬЗОВАНИЕ ЯЗЫКОВ ГИПЕРТЕКСТОВОЙ РАЗМЕТКИ
ПРИ ПОДГОТОВКЕ ЭЛЕКТРОННЫХ СЕТЕВЫХ ИЗДАНИЙ

Независимый проект «Русская виртуальная библиотека» (http://www.rvb.ru) существует с 1999 года, когда этот проект был поддержан Институтом «Открытое общество» (Фондом Джорджа Сороса). Фактически этот проект стал первым проектом русского сектора интерната, направленным на создание гипертекстовой библиотеки, предназначенной для использования как широкой, так и профессиональной филологической аудиторией. Именно создание обширного и расширяющегося гипертекста, включающего как тексты русской литературы, так и исследовательские метатексты (в первую очередь, комментарии), было и остается приоритетной задачей проекта.
Для решения этой задачи нами использовался язык разметки Hypertext Markup Language (HTML), версия 4.0, [1], поскольку с одной стороны, этот язык напрямую поддерживается пользовательским программным обеспечением (user agents / web browsers), в отличие от обычно используемых в академических проектах языков SGML/XML на основе системы TEI [2], а с другой стороны, позволяет вносить в разметку мета-информацию, т.е. информацию, которая может быть в дальнейшем использована для поиска и построения гипертекста. Эта мета-информация включает, во-первых, идентификаторы элементов разметки, и во-вторых, классы элементов разметки. Идентификаторы, соответственно, используются в качестве закладок, и на них направляются гиперссылки. Так как при подготовке текстов уникальные идентификаторы приписываются всем повторяющимся элементам текста (стихотворным строкам и строфам поэтического текста и абзацам прозаического), то в дальнейшем ссылки можно позиционировать с точностью до стихотворной строки или абзаца. Фактически все комментируемые сегменты литературного текста связываются за счет этого гиперссылками с соответствующими сегментами комментария, а из комментариев строятся ссылки на конкретные сегменты текстов. Применение классов позволяет при помощи внешних стилевых листов (style sheets) [3] воспроизводить внешний вид печатных изданий, тем самым визуализируя смысловую структуру текста традиционным и интуитивно понятным образом [4].
Применение этого подхода в рамках текущего проекта «Электронная библиотека русской литературы XVIII — начала XIX века» (поддержанного Российским гуманитарным научным фондом) позволяет упростить подготовку указателей стиховых форм публикуемых поэтических текстов, так как стихотворные размеры задаются в разметке соответствующих классов элементов разметки текста.
Аналогично будет построен гипертекст в рамках недавно стартовавшего проекта московского Мандельштамовского общества и Оксфордского университета «Объединение текстов и архивов Осипа Мандельштама в электронной форме» (поддержан Исследовательским советом по искусствам и гуманитарным наукам Великобритании, Arts & Humanities Research Council), в рамках которого предполагается связать в единый гипертекст произведения Мандельштама, комментарии к ним, описание архивных коллекций творческих рукописей поэта и их электронных изображений. Также в рамках этого проекта предполагается создать программное обеспечение для перевода текста, размеченного в формате HTML 4.0, в формат TEI P4 XML и обратно.

Литература:

1. HTML 4.01 Specification. W3C Recommendation. 24 December 1999. http://www.w3.org/TR/html4/
2. The Text Encoding Initiative. http://www.tei-c.org/
3. Cascading Style Sheets, level 2. CSS2 Specification. W3C Recommendation 12-May-1998. http://www.w3.org/TR/REC-CSS2/
4. Russian Virtual Library: EVA 2004 Berlin: Konferenzband. S. 124—126, http://rvb.ru/about/meta/2004_eva_berlin.htm
5. Электронная библиотека русской литературы XVIII — начала XIX века. http://rvb.ru/18vek/

 



В этом разделе:
   
 

                                         121069, г. Москва,
                                         ул.Поварская 25а.
                                         info@imli.ru





© ИМЛИ им. А.М.Горького РАН

Интернет-портал ИМЛИ РАН создан при поддержке Программ фундаментальных исследований Президиума РАН «Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006)

Дизайн и программная поддержка - Компания BINN.
http://www.binn.ru