Введение

За годы существования Института этнологии и антропологии РАН его сотрудниками собрана огромная коллекция массовых источников, содержащих сведения этнодемографического характера. Это, например, копии ревизских сказок XVIII—XIX веков, посемейно-имущественных списков первой трети XX века, похозяйственных книг с середины прошлого столетия до наших дней, а также сведения о численности и этническом составе населения различных регионов.

Значительная часть этих источников содержит сведения, пригодные для реконструкции генеалогий, что, в свою очередь, позволяет на массовом материале анализировать брачные предпочтения (например, наличие браков между определенными категориями родственников), выявлять брачные ареалы, прослеживать миграции, не отражающиеся в сводных отчетах органов государственной статистики.

С появлением мощной и одновременно доступной вычислительной техники необходимость поиска путей объединения разрозненных массивов типологически сходных материалов становится все более очевидной. Избыток вычислительной мощности и объема дисковой памяти современных ПК позволяет проектировать реляционные базы данных для нужд гуманитарных исследований с минимальным учетом «потребностей машины», т.е. преобразуя исходные данные источников лишь в той мере, в которой это обусловлено спецификой табличного представления. При обработке массовых источников такой подход означает осознанный отказ исследователя от предварительной формализации, унификации и кодирования вводимых данных в пользу идентификации «элементарных» (непосредственных) отношений между описываемыми объектами. В результате создаваемая база данных является более адекватным и гибким представлением информации источника и позволяет строить выборки по критериям, неизвестным во время проектирования, хотя это и достигается за счет некоторого усложнения структуры базы данных и возможной потери производительности в случае некоторых «простых» запросов.

Этнодемографическая база данных задумана как средство обеспечения этнологических и демографических исследований на произвольном масштабном уровне: от целой страны или ее части до отдельной семьи (семейной группы). В этом качестве ЭДБД ориентирована на формирование выборок объектов учета (регионов, населенных пунктов, семей, персон) по определяемым пользователем критериям. На текущем этапе развития проекта предполагается, что дальнейший статистический анализ будет производиться исследователем с использованием соответствующего программного обеспечения. Возможность формирования выборок по конкретным регионам зависит от наличия и полноты источников, введенных в базу данных.

Об авторах

В работе над проектом в разное время принимали участие:

  • В.В. Горлов (разработка пользовательского интерфейса, программирование);
  • М.Г. Кучинский, к.и.н. (разработка концепции, ввод данных);
  • Л.И. Миссонова, к.и.н., научный сотрудник КМЦ ИЭА РАН (ввод данных);
  • Е.А. Пивнева, к.и.н., ученый секретарь ИЭА РАН (ввод данных);
  • Д.А. Функ, д.и.н., заведующий отделом Севера и Сибири ИЭА РАН (руководство проектом, разработка концепции, ввод данных);
  • К.Г. Шаховцов, к.и.н., научный сотрудник отдела Севера и Сибири ИЭА РАН (разработка концепции, проектирование базы данных, ввод данных).

Программное обеспечение

Для создания ЭДБД использовалось только свободное программное обеспечение: СУБД PostgreSQL, языки программирования PHP (пользовательский интерфейс и модули, работающие вне СУБД) и Perl (часть хранимых процедур), веб-сервер Apache, операционная система GNU/Linux.