Ru | Eng
20 09 2020
Почта


 
Архив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отделФундаментальная электронная библиотекаФундаментальная электронная библиотекаАрхив А.М. ГорькогоВиртуальный музей-квартира А.М. ГорькогоРукописный отдел



 

Научная жизнь  | Конференции и семинары  | 2005  | Современные информационные технологии и филология  | Н.В. Дранникова, А.А. Меньшиков, С.А. Меньшиков 


Дранникова Н.В., Меньшиков А.А., Меньшиков С.А. (Архангельск)

Информационно-справочная система архива Лаборатории-фольклора
Поморского Государственного Университета им. М.В. Ломоносова

Лаборатория фольклора занимается собиранием и классификацией фольклорного материала. Ежегодно на территории Архангельской области Лабораторией проводятся несколько фольклорных экспедиции, архив регулярно пополняется материалами, которые собирают студенты во время фольклорной практики. В результате был создан уникальный фольклорный архив, содержащий записи различных жанров. В настоящее время накопилось архивных папок около 1000, в каждой их них в среднем по 150 записей. Для систематизации архива потребовалась разработка специальной системы. В 1999 году, а затем 2001 Лабораторией фольклора Поморского государственного университета был получен грант РФФИ «Развитие мультимедийной базы данных архива лаборатории фольклора Поморского университета, создание индексированного каталога и поисковой машины для научных исследований» . В ее разработке приняли участие программисты отдела информационных технологий ПГУ, а студенты, проходящие фольклорную практику в заполнении. База данных работает на основе СУБД PostgreeSQL.
Система состояла из двух больших независимых блоков: управления базой данных (занесение, изменение, удаление записей) и отдельно поисковая система. База данных состояла из 6-ти основных таблиц, отдельно были вынесены такие характеристики как: тип носителя информации-(аудиокассета, видеокассета, CD-ROM, ресурс web-сервера) и указание самого носителя, т.е. номер кассеты по каталогу и т.д., «Населенный пункт» (где была произведена запись), «Экспедиция или фольклорная практика», «Исполнитель», «Архивная папка, где хранились расшифровки». Тексты хранились в виде файлов в отдельной папке на сервере. Название файла определялось по уникальному идентификатору соответствующей записи в базе данных.
Созданная в 2001 году база данных для ведения электронного тематического каталога архивных материалов лаборатории, в 2002 году была расширена более подробным систематическим каталогом. Он описывает каждую единицу фольклорного материала по заданному для каждого жанра набору показателей, что позволяет отбирать записи, не только используя возможности контекстного поиска, но и поиска по значению множественных классификаций. [1] С целью жанровой атрибуции было решено ввести понятие «независимое (или) формализованное описание», предложенное директором ИВЦ ПГУ А.Е. Гильдебрантом. В таком случае, любой фольклорный текст может быть охарактеризован определенным набором характеристик или независимых между собой описаний. База данных функционирует под управлением СУБД Postgree. В 2002 году рабочая версия базы данных перенесена с центрального сервера ПГУ на сервер Лаборатории фольклора, что позволило упростить доступ к рабочей базе для операторов, работающих в лаборатории. На сервере ПГУ создано зеркало базы данных лаборатории, это упрощает доступ к данным для всех остальных пользователей сети университета и глобальной сети-Интернет. Для доступа к базам данных созданы интерфейсы для web-клиента. Интерфейс каталогизатора, созданный в 2001 году и размещенный по адресу http://folk.pomorsu.ru/db, дополнен интерфейсом систематизатора, размещенным по адресу http://folcklab.pomorsu.ru. Интерфейс систематизатора позволяет создавать (описывать) множественные классификации, определённые для каждого жанра и группы жанров и, в соответствии с описанными для жанра правилами классификации, детально заполнять структурированное формальное описание каждой фольклорной единицы.
В ходе разработки структуры базы данных каталога, был применён метод описания большей части характеристик каталожных единиц в единой структуре атрибутов объектов. Что позволило унифицировать интерфейс для работы с базой данных и найти устраивающий компромисс между требованиями наибольшей функциональности и необходимостью упрощения запросов к базе данных. [1]
Для полной реализации этой идеи было решено переработать существующую схему базы данных и применить такую, которая позволила бы создавать собственные описания. В июле 2005 года началась работа по созданию новой базы данных с усовершенствованным систематизатором. Во-первых, было решено объединить отдельные таблицы, такие как «Носитель информации», «Населенный пункт», «Экспедиция или фольклорная практика», «Исполнитель», «Архивная папка» и др. в одну общую таблицу, что позволяет уменьшить число таблиц.
Для разрабатываемой системы были выбраны в качестве web-сервера, полнофункциональный свободно-распространяемый сервер Apache, база данных построена под управлением СУБД MySQL, оба эти программных продукта пользуются заслуженным уважением и широко используются в практике разработки баз данных с доступом через web-сервер. Дополнительные возможности СУБД PostgreeSQL оказались невостребованными в нашем проекте, поэтому было решено использовать более простую базу данных MySQL, программа систематизатора выполнена на языке web-программирования PHP. Все характеристики, кроме жанров, стали независимыми описаниям, а добавление новых описаний стало возможным без вмешательства программиста, пользователь добавляет новое описание, а программа добавляет всего лишь новую запись в таблицу описаний. На данном этапе разработки БД имеет следующие возможности: выборка текстов по любому описанию, возможность быстрого перехода ко всем связанным описаниям с использованием которых сохранен данный текст, возможность добавления описаний для отдельных жанров, создание нового описания, сопоставление его с конкретным жанром, занесение новых записей этого жанра с использованием этого описания, поиск по новому описанию.
Система в первую очередь предназначена для студентов, с целью написания курсовых и дипломных работ, с полным доступом к текстам, студентам не придется сидеть в архиве и в ручную искать материал, это сократит время на поиск материалов.
Исследователи фольклористы из других регионов смогут работать с архивом ПГУ непосредственно на местах. Доступ будет открыт только конкретному пользователю на определенный срок или представлена возможность работать только с отдельными жанрами.
Особенностью также является то, что информационная система может быть использована универсально, как жанровой, так и по территориальной систематике, в справочник «населенный пункт» можно внести любую область, район, поселок, в справочник жанры может быть добавлен любой жанр по желанию пользователя.
В настоящий момент система находится на стадии разработки, требуется разделение пользователей – создание системы авторизации.
Следующим этапом станет разработка системы поиска одновременно по нескольким параметрам отбора или нескольких описаний одновременно, и поиск по тексту.
Пополнение аудио-видео информации на FTP-сервер и подключение их к текстовым записям. Начало разработки БД июль 2005 г.
1. «Развитие мультимедийной базы данных архива лаборатории фольклора Поморского университета, создание индексированного каталога и поисковой машины для научных исследований». Н. В. Дранникова, А. Е Гильдебрант
 



В этом разделе:
   
 

                                         121069, г. Москва,
                                         ул.Поварская 25а.
                                         info@imli.ru





© ИМЛИ им. А.М.Горького РАН

Интернет-портал ИМЛИ РАН создан при поддержке Программ фундаментальных исследований Президиума РАН «Филология и информатика: создание систем электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006)

Дизайн и программная поддержка - Компания BINN.
http://www.binn.ru