Ru | Eng
05 декабря 2024
Почта


 
Архив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отделФундаментальная электронная библиотекаФундаментальная электронная библиотекаАрхив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отдел



 

Научная жизнь  | Конференции и семинары  | 2005  | Современные информационные технологии и филология  | А.В. Островская 


А.В. Островская (Санкт-Петербург)

Информационно-поисковая система "Русская словесность" 
и справочно-источниковедческие коллекции ИРЛИ
 


Современные информационные технологии открывают широкие дополнительные возможности для развития одной из базовых дисциплин историко-филологической отрасли гуманитарного знания - источниковедения. В последние годы заметно возросли и потребности исследователей: традиционные формы представления справочной информации уже не могут их удовлетворить. Однако во многих случаях пользователи вынуждены по-прежнему обращаться к старым бумажным каталогам и картотекам, рукописным материалам.

ИРЛИ обладает огромным массивом ценнейших источников по истоpии отечественной литеpатуpы, науки, культуpы и общественной жизни. Прежде всего, это многочисленные справочные коллекции Рукописного отдела. Они концентpиpуют огpомное количество уникальных сведений, в дpугих источниках поpой вовсе не отpаженных. Общий объем - несколько миллионов записей разного характера: библиография, сведения о лицах (биографические, генеалогические, данные о псевдонимах), сведения об организациях, указатели к периодическим изданиям и т.д.

Справочно-источниковедческие коллекции РО ИРЛИ активно используются в работе не только филологов, но и историков, краеведов, в подготовке как научных, так и популярных изданий разного рода. Чаще всего обращаются к коллекциям за отдельными справками, но ведется работа и по изданию целых коллекций, кроме того они служат основным источником для подготовки словников биографических словарей русских писателей и т.д. Однако значительная часть инфоpмации источниковедческих коллекций ИРЛИ не введена в научный обоpот, многие коллекции малоизвестны или малодоступны для исследователей. Проблемой является сохpанность этих по большей части уникальных pукописных матеpиалов, существующих на бумажных носителях не лучшего качества. Были попытки частичной публикации материалов наиболее используемых коллекций. Прежде всего, это общеизвестные словари Венгерова начала XX в. (незавершенные). В наше время сотрудниками Отдела источниковедения и библиографии ИРЛИ была подготовлена к печати часть библиографического комплекса А.Д. Алексеева - указатель "Алексеев А.Д. Литература русского зарубежья: Книги 1917-1940. Материалы к библиографии" (СПб., 1993), готовится к печати книга "Русская интеллигенция. Автобиографии и биографические документы в собрании С.А. Венгерова: Аннотир. указ. в 2 т." (т. 1: СПб., 2001). Однако большинство справочных матеpиалов для публикации не пpедназначено. Несомненная научная ценность этих коллекций тpебует шиpокого доступа к ним исследователей pазных специальностей. Обработка подобных материалов и предоставление их пользователю возможна только в электронной форме.

Представление содержания каждого источника полностью - это проблема, решение которой в целом принадлежит будущему. Сейчас возможно частичное решение этой проблемы. В настоящее время пользователь обращается к источнику вслепую, не зная, есть ли там данные, об интересующем его объекте. Предлагается создать реестр объектов, представленных в основных справочных источниках: лица, организации, периодические издания. Выбор коллекций для обработки будет осуществляться по принципу актуальности информации, частоты обращения исследователей к источникам. Основной принцип - охват всех объектов выбранного источника, а не поиск информации о каждом объекте в различных источниках. Запись будет содержать: название объекта, его варианты, идентифицирующие объект дополнительные данные, краткую аннотацию, источниковедческую справку (ссылку на основной источник информации и на дополнительные источники).

В литературном источниковедении на первом месте по важности (и частоте запросов пользователей) стоит персональная информация - информация о лице: биографическая или библиографическая. Большинство коллекций организованы по алфавиту имен лиц, т.е. объектом является персона. Есть несколько наиболее известных подобных собраний, среди них спpавочно-библиогpафический комплекс С.А. Венгеpова и пpимыкающих каpтотек (около 800 коpобок; общее число записей - несколько миллионов) - собpание биобиблиогpафических матеpиалов, связанных с жизнью и деятельностью pусских писателей и ученых, госудаpственных, научных и культуpных учpеждений, общественных оpганизаций и учебных заведений, данные о пеpеводной литеpатуpе, о pусских книгах XVIII - начала ХХ в.

В состав венгеровского комплекса входят материалы к книге Венгерова "Критико-биографический словарь русских писателей и ученых. Предварительный список русских писателей и ученых и первые о них справки" (Пг., 1915-1918), издание которой не было завершено. Основа этих материалов - рукописная картотека "Оригинал списка", содержащая краткие биографические сведения о самом широком круге лиц XVIII- начала XX в., так или иначе появлявшихся в печати. Издание было доведено лишь до буквы "П" (Павлов), тогда как алфавит основной картотеки полный. Общий объем картотеки - около 100 000 карточек, кроме того, еще имеется несколько малоизученных картотек-дополнений (10 коробок). Неизданная часть этой картотеки - примерно 40 000 карточек. Работу над справочными коллекциями целесообразно начать именно с этой части венгеровского собрания - наиболее актуальной.

Для обработки венгеровской картотеки предполагается использоваться возможности нашей информационно-поисковой системы (ИПС) "Русская словесность", работающей в среде СУБД CDS/ISIS for Windows (WINISIS). На данный момент ИПС содержит базы данных 3 типов: библиографические, справочно-нормативные и технологические (библиографические и пр. международные коды, список применяемых в системе сокращений и т.д.). Отдельные этапы работы над ИПС финансировались фондами Дж. Сороса (Интерцентр), РФФИ-РГНФ и СПбНЦ РАН. Консультативная поддержка оказывалась Отделом информатики БАН во главе с В.П. Захаровым.

В основе системы - комплекс библиографических баз данных. Внутренняя структура данных - международный формат для библиографических данных UNIMARC (версия ИРЛИ). Содержанием баз является библиография современных научных работ по истории литературы (отчасти - устному народному творчеству) и публикаций самих текстов. Приоритетная тематика - история русской литературы XIX в. Проводится содержательная обработка данных по результатам просмотра де визу: аннотиpование записей по истоpии pусской литеpатуpы ХIХ вв., индексирование и кодирование. Это осуществляется в рамках работы над библиографическим указателем "История русской литературы. Personalia: Первая половина XIX века". В данный момент работа над БД персональных библиографий поддерживается Программой фундаментальных исследований Президиума РАН "Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора".

Нормативно-справочный комплекс - это базы данных, содержащие информацию о стандарте представления объекта в системе. Используемая технология позволяет описать в структурированном виде практический любой объект. Создано несколько типов нормативно-справочных БД для описания разных объектов: лица, организации, географического названия, периодического издания, унифицированного названия произведения, тематических рубрик.
Особенность нормативно-справочных баз данных ИПС "Русская словесность" заключается в использовании их в качестве самостоятельно значимых справочных ресурсов, содержащих информацию из разных источников. Система в этом случае является способом кумуляции и оперативного представления пользователям текущей научной информации, полученной в результате литературоведческих и архивных исследований. В связи с этим международный стандартный формат представления данных UNIMARC-AUTHORITY был расширен в соответствии с нашими задачами.

Ядром нормативно-справочной части ИПС является комплекс персональных БД. При работе с биографической базой "Русские писатели первой половины XIX в.", справочного сопровождения библиографических персоналий, отрабатывалась технология максимально полного представления биографии писателя в виде БД. Затем на основе "Словаря псевдонимов русских писателей, ученых и общественных деятелей" И. Ф. Масанова была создана база с рабочим названием "Псевдонимы". Завершена работа по вводу всех данных словаря в базу (более 70 000 записей). Кроме того эта БД является местом учета информации не только о псевдонимах, но и фактах биографии лица. Помимо словаря использовались иные, в том числе рукописные источники. Эта БД станет основой для работы над картотекой Венгерова. Картотека состоит в основном из стандартных карточек-бланков, расставленных в алфавитном порядке. Карточка-бланк содержит следующие графы: фамилия, имя, отчество, род деятельности, дата и место рождения, сословие, вероисповедание, национальность, образование или служебное звание, дата смерти. Большая часть карточек содержит краткие записи, графы чаще всего заполнены неполностью. Количество имен в картотеке значительно, но пробная обработка записей показала, что некоторая часть имен имеется в БД "Псевдонимы".

При создании ИПС "Русская словесность" предусматривалась возможность использовать систему для создания электронных ресурсов на основе источниковедческих коллекций РО ИРЛИ. Поэтому технология представления данных в нормативно-справочных БД создавалась нами с учетом этих целей. Основной метод: учет информации основного печатного источника, затем работа с архивными. Работа с ИПС "Русская словесность", объединяющей в себе библиографическую, фактографическую и источниковедческую информацию, показала большую эффективность этого метода представления справочной информации по сравнению с традиционными. Освоение рукописных справочных материалов РО ИРЛИ даст толчок развитию литературного источниковедения в целом. Предоставление результатов проекта планируется через Интернет. 
 



В этом разделе:
   
 

                                         121069, г. Москва,
                                         ул.Поварская 25а.
                                         info@imli.ru





© ИМЛИ им. А.М.Горького РАН

Интернет-портал ИМЛИ РАН создан при поддержке Программ фундаментальных исследований Президиума РАН «Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006)

Дизайн и программная поддержка - Компания BINN.
http://www.binn.ru