О пользе методических погрешностей для совершения открытий (2004)

Информационный бюллетень Ассоциации "История и компьютер". 2004. № 32: Материалы ІХ конференции АИК. Апрель 2004. - Москва; Томск, 2004. С. 181-184

Общеизвестно, что при использовании количественных методов историки должны быть особо бдительными в вопросах методики. Вывод, сделанный при анализе нерепрезентативной выборки или при частичном перекрывании доверительных интервалов, будет не только поспешным, но может оказаться и прямо ошибочным.

Можно было бы привести немало примеров такого рода. Но я собираюсь продемонстрировать случай, когда некорректность в определении выборки оказалась неожиданно плодотворной и даже позволила мне совершить небольшое открытие. Разумеется, это стало возможным только потому, что я сам вовремя осознал допущенную некорректность и затем все время помнил о ней. Даже в этом случае риск совершить непростительный промах был достаточно велик. Поэтому пример можно рассматривать как то исключение, которое только подтверждает правило.

При сравнительном исследовании структуры крестьянского дворохозяйства я разработал модель жизненного цикла, основанную на идее А. Чаянова о постоянном изменении пропорции едоков и работников по мере демографической эволюции крестьянской семьи. Суть этой модели была продемонстрирована мной на предыдущей конференции АИК [1]. Я применил ее для анализа жизненного цикла реальных дворохозяйств, история которых была реконструирована мной с помощью перекрестного анализа метрических книг, инвентарей и ревизских сказок второй половины XVIII - первой половины XIX в. Все эти хозяйства принадлежали к одной микропопуляции, избранной мной для углубленного исследования. Характер сохранившихся источников [2] позволил проследить изменения в персональном составе каждого из дворохозяйств этой выборки в интервале с 1762 г. (начало сохранившихся метрических книг) до 1858 г. (дата последней ревизии).

На исследуемой территории в 1760-е гг. было порядка 130 дворохозяйств, к 1850-м гг. их число возросло до 160-170. При этом многие хозяйства делились, некоторые - вымирали или их члены покидали популяцию, взамен прибывали новые. Всего в разное время существовали около 450 дворов. Естественно, что наилучшим образом прослеживались и были наиболее удобны для анализа те хозяйства, которые существовали непрерывно в течение всего периода наблюдений или его большей части.

Из числа таких долговечных хозяйств для детальной реконструкции жизненного цикла были отобраны 50. Для каждого из них был восстановлен персональный состав в каждый год наблюдения, что в итоге дало 4314 условных "хозяйство-лет". За каждый год по каждому хозяйству подсчитывались соотношение едоков/работников, число членов (мужчин, женщин и суммарно), количество брачных пар, неполных семей и одиночек. Подсчитанные цифры усреднялись по всем хозяйствам для трех хронологических периодов: 1762-1793 гг. (в период Речи Посполитой), 1794-1825 и 1826-1858 гг. (в период Российской империи, разделенный для удобства на две примерно равные части).

Первое, что бросилось в глаза при анализе статистики - средний размер дворохозяйства (особенно в отношении мужского населения) в первый период оказался заметно выше, чем давали прямые подсчеты по сохранившимся инвентарям. Так, инвентари фиксируют в среднем чуть более 3,1 мужчин на хозяйство, тогда как в отобранных для реконструкции дворах среднее число мужчин оказалось равным 4, при 3 женщинах. Зато для двух оставшихся периодов результаты были более близки к данным ревизий, да и соотношение полов выравнивалось: в среднем 4,17 мужчины и 4,26 женщины на хозяйство, или всего 8,35, тогда как в разных ревизиях фиксировалось от 7,9 до 8,2 душ обоего пола.

Причину резкой диспропорции полов в первом хронологическом периоде мне удалось выяснить достаточно легко: она объяснялась несовершенством источников, прежде всего - огромным числом пропусков при регистрации смертей (36% случаев) и браков (22%), при том, что часть инвентарей XVIII в. учитывала только мужское население. В результате многие девочки, благополучно доживавшие до брака, оставались незамеченными до смены фамилии, после чего выяснить их происхождение оказывалось невозможно. Не всегда удавалось установить и существование вдов, переживших своих мужей. По этим причинам реконструкция состава хозяйств в XVIII в. неизбежно приводила к занижению числа лиц женского пола. Реально их число было близко к числу мужчин, а значит - и средний размер хозяйства был примерно таким же, как в последующие периоды - около 8 человек.

Но оставалось второе противоречие: судя по инвентарям, средний размер хозяйства в XVIII в. находился в пределах 6-6,5 человек, а никак не 8! Получалось, что одна и та же выборка из 50 наиболее долговечных хозяйств для XIX в. оказывалась вполне представительной, но для более раннего периода демонстрировала систематическую погрешность.

Выборка действительно формировалась некорректно. Хозяйства генеральной совокупности (в данном случае она составляла все 450 существовавших в разные периоды дворов) отбирались для анализа не случайно, а по вполне определенному критерию: продолжительности их существования. Между тем сам факт такой устойчивости говорит о том, что эти хозяйства были нетипичными - они придерживались какой-то специфической модели поведения, позволявшей им избегать коллапса на протяжении почти 100 лет, в отличие от большинства соседей. Более того, на протяжении всего периода наблюдений эта модель практически не менялась (об этом говорит устойчивость большинства статистических параметров, не выходящих за рамки доверительных интервалов). Между тем генеральная совокупность испытывала какую-то эволюцию, отражением чего было заметное возрастание среднего размера дворохозяйства.

Таким обрназом, результаты, подсчитанные по 50 хозяйствам, нельзя было распространять на популяцию в целом. На этом можно было и закончить, но мне не давало покоя то обстоятельство, что для XIX в. эти результаты демонстрировали такое удивительное совпадение со статистиками всей популяции. Каким путем, исходя их неверной посылки, удалось прийти к верному результату? И каковы, в таком случае, были свойства той части совокупности, которая не вошла в выборку?

Это беспокойство подвигло меня к дополнительным исследованиям. Объяснение оказалось неожиданным для меня и совсем не очевидным: крестьянские хозяйства на самом деле придерживались двух разных моделей поведения, которые я в итоге назвал малосемейной и общежительской. Первая из них предполагала хозяйство, основанное на труде одной брачной пары (как это было в большинстве стран Западной Европы), при среднем размере около 5 человек. Вторая модель, нетипичная для Запада, но преобладающая в Восточной Европе в первой половине XIX в., базировалась на совместном труде двух и более нуклеарных семей (как правило, родственников). При господстве барщинной формы эксплуатации и жестком социальном контроле со стороны помещика, как это наблюдалось в исследованной мной популяции после присоединения к Российской империи, такая модель становилась единственно возможной - на нее вольно или невольно переходили все хозяйства. Но в более ранний период ее придерживались лишь экономически успешные хозяйства, для которых главной ценностью была именно стабильность, возможность сохранения из поколения в поколение. Ради этого они мирились с неудобствами, неизбежными при совместном проживании нескольких взрослых мужчин и женщин.

Что касается малосемейной модели, то ее в условиях Восточной Европы придерживались только те хозяева, для которых индивидуализм и психологический комфорт были важнее, чем экономическая стабильность. Поэтому такие хозяйства часто оказывались недолговечными, а их члены формировали прослойку захожих людей, периодически менявших место жительства (в условиях Речи Посполитой, в отличие от Российской империи, это было возможным).

Самое интересное, что на востоке Европы эта поведенческая модель почти никогда не встречалась в чистом виде - лишь в качестве примеси к хозяйствам, придерживавшимся общежительской модели. Поэтому суммарные подсчеты по деревням, включающим дворы обоих типов, давали смешанную статистику, при которой средний размер хозяйства составлял от 6 до 7 человек. Чтобы заметить существование малосемейной модели, нужно было сначала выделить в чистом виде альтернативную, общежительскую, что я и сделал благодаря методической погрешности при формировании выборки.

  1. Носевич В.Л. Модель жизненного цикла крестьянского дворохозяйства // Информационный бюллетень Ассоциации "История и компьютер". 2002. № 30. С. 202-205. Электронный вариант с таблицами выставлен здесь.
  2. Носевич В. Л. Комплекс документов по истории одной белорусской микропопуляции // Беларускі археаграфічны штогоднік. Вып. 2. Мінск, 2001. С. 124-146. Электронный вариант здесь.