Архив электронных документов: белорусский опыт (2002)

Отечественные архивы. № 1. 2002. С. 44 - 52

Проблема сохранения информации в электронной (цифровой) форме - это вызов, с которым столкнулись архивисты во всем мире. Главная сложность заключается в том, что такая информация недоступна непосредственному человеческому восприятию, требует особых типов носителей, а ее воспроизведение - специальных программно-технических средств. Если в нужный момент мы не сможем считать данные с носителя, то пользы от записанной на нем информации не будет. Это может случиться как по причине неисправности носителя, так и вследствие его несовместимости с теми средствами воспроизведения, которые окажутся в нашем распоряжении.

Надежность современных машинных носителей оценивается не очень высоко. Предположительный срок их гарантированной сохранности исчисляется лишь несколькими десятилетиями. Но еще хуже, что средства воспроизведения имеют свойство устаревать гораздо быстрее, чем приходят в негодность сами носители. Рынок компьютерной техники обновляется примерно каждые три года, а в течение 10 - 15 лет устаревшие компьютеры практически полностью исчезают. Форматы, в которых закодирована информация, и программное обеспечение, которое поддерживает данный формат, столь же быстро устаревают. Поэтому даже прекрасно сохранившийся диск через несколько десятилетий просто негде будет воспроизвести.

В результате документы на машинных носителях, предоставленные сами себе на сравнительно короткий срок (порядка нескольких лет), могут оказаться недоступными. Это уже случилось с первым поколением информационных ресурсов, созданных в вычислительных центрах 1970-х - 80-х годов. По мере выхода из эксплуатации компьютеров, применявшихся в те годы, оказались утраченными практически все данные, не переведенные сразу же в новые форматы и на носители последующих поколений. Например, Министерству статистики Республики Беларусь не удалось несколько лет назад воспроизвести данные переписи населения СССР 1989 года, присланные из Москвы на магнитных лентах.

Дело даже не в том, что информацию технически невозможно конвертировать в современные форматы и технологии. В большинстве конкретных случаев (при некотором минимуме физической сохранности самих носителей) эта задача разрешима. Проблему недолговечности носителей также можно обойти за счет регулярной перезаписи данных на новые поколения носителей, при этом качество записи не ухудшается. Но по мере создания новых информационных систем (и устаревания прежних) масса данных, требующих конвертации, будет неуклонно нарастать. Объем несовместимых данных может оказаться весьма велик, а в нужный момент для их конвертации не окажется необходимых финансовых и трудовых ресурсов. Стоит лишь однажды промедлить с необходимыми мерами, и наверстать упущенное будет гораздо сложнее (и дороже).

Не сможет решить проблему и превращение электронного архива в своеобразный музей компьютерной техники, с помощью которой можно запускать устаревшие программы и воспроизводить данные с устаревших носителей. С каждой сменой поколений компьютерной техники такой "музей" будет пополняться все новыми "экспонатами", а поддержание их работоспособности потребует не меньше сил и средств, чем конвертация данных. Достаточно представить, в какие суммы выльется ремонт такого антикварного оборудования, запасные части для которого давно не выпускаются промышленностью и должны изготавливаться по индивидуальным заказам.

Специалистами предлагаются два подхода, способные в какой-то мере решить проблему. Один из них - выработка международных стандартов для форматов, в которых данные визуализируются или обмениваются между системами. Многообещающими в этом плане считаются форматы PDF и SGML. Первый из них позволяет зафиксировать внешнее представление электронного документа (в таком виде, в котором он отображается на экране монитора или распечатывается на принтере). Формат SGML позволяет однозначно задавать логическую структуру текстового документа или базы данных (размещение и способ выделения заголовков, разбиение на абзацы, столбы и строки, расположение иллюстраций, таблиц, ссылок и т.п.) таким образом, чтобы любая поддерживающая этот формат программа отображала сам текст и его структуру без искажений (этот принцип уже фактически реализуется во всемирной сети Интернет на основе форматов HTML и XML, использующих аналогичный принцип [1].

Относительным недостатком этого подхода является то, что он предполагает установление полного единообразия. Этот путь будет эффективным только в том случае, если программы, обеспечивающие преобразование данных в один из стандартных форматов, будут установлены буквально на всех компьютерах, а затем станут синхронно обновляться, поспевая за развитием технологий. Достижение подобной унификации во всемирном масштабе сегодня выглядит не слишком реальным.

Второй возможный подход - разработка детальных технических описаний (спецификаций) на все наиболее распространенные операционные системы, приложения и поддерживаемые ими форматы таким образом, чтобы программисты будущего смогли воссоздать (эмулировать) принцип действия этих программ на своих компьютерах и просмотреть с их помощью сегодняшние документы [2]. Техническая возможность эмулировать но новых компьютерах работу старых программ не вызывает сомнений. Но и в этом случае предполагается, что множество разработчиков по всему миру добровольно возьмет на себя труд создавать спецификации на все выпускаемые ими продукты, или же кто-то возьмется за еще более тяжелый труд - создавать спецификации для чужих программ.

Из вышесказанного можно сделать вывод - сегодня никто в мире, по-видимому, не имеет полного представления, каким образом в будущем будет обеспечиваться доступ к создаваемым сейчас электронным документам. Но это не значит, что их можно оставить на произвол судьбы до прояснения ситуации. Наоборот, именно в такой ситуации роль архивистов становится исключительно важной, поскольку с их точки зрения проблема видна наилучшим образом. Их долг заключается в том, чтобы принять все меры, возможные в сегодняшних условиях, для предотвращения утраты этих документов. На первом этапе, пока информации накопилось не слишком много, "гонка за прогрессом" будет поддерживаться путем миграции данных, т. е. их преобразования под требования новых программно-аппаратных платформ.

Какими будут информационные технологии будущего - предвидеть сложно. Пока не найден путь к полной долгосрочной сохранности цифровой информации во всем ее многообразии, со всеми удобствами поиска и внешнего представления, но уже сейчас можно гарантировать доступность для будущих поколений линейной последовательности букв и цифр, т. е. неформатированных текстов, а также графики в растровых форматах (в виде такой же последовательности точек разных цветов). Это лучше, чем утратить все, но даже для реализации этой программы-минимума нужно принимать определенные меры уже сейчас. Очевидно, что базы данных нужно хранить не только в их исходных программно-зависимых форматах, но одновременно создавать их архивные копии в текстовой форме. Для геоинформационных и иных подобных систем, использующих векторную графику, следует обеспечить вывод в текстовой форме координат векторных объектов или преобразование этих объектов в растровые изображения в одном из распространенных программно-независимых форматов (tif, jpg).

Существует риск утраты не только самих данных, но и их описаний и поисковых характеристик, вносимых в информационно-поисковую систему архива, или превращения ее в архаичный массив информации, несовместимый с более современными технологиями. Уже сегодня очевидно, что информационные системы будущего будут полностью интегрированы в глобальную систему телекоммуникаций. Исходя из этого, можно оценить степень доступности создаваемых сегодня информационных ресурсов: те из них, для которых сложно обеспечить онлайновый доступ через Интернет, наверняка будут труднодоступны для наших потомков (а возможно, и для нас самих спустя всего 10 - 15 лет). Исходя из этого, наиболее перспективно достижение "открытости" автоматизированной системы архива на базе современных интернет-технологий. Но конкретные пути к этой цели еще предстоит найти.

Для архивного хранения цифровой информации специалисты предлагают разные варианты. Первый из них - хранение электронных документов по месту их создания, в тех организациях, которым эти документы принадлежат. Предполагается, что при периодическом усовершенствовании своих информационных технологий такие организации смогут преобразовывать в соответствии с новыми требованиями и архивную информацию. При этом государственные архивы должны обеспечивать только учет документов и контроль за их хранением. Этот подход взят на вооружение архивистами Австралии, его принципы подробно изложены на их сайте в разделе "Электронные документы" [3].

Второй возможный подход - это создание в обычных государственных архивах подразделений по хранению электронной документации. По такому пути пошли в Соединенных Штатах Америки и некоторых других странах. В США при Национальном архиве (NARA) создан Центр электронных документов (Center for Electronic Records). Другие американские архивы тоже принимают на хранение как традиционные, так и электронные документы.

Третьим вариантом является создание специализированного архива, который хранил бы только электронные документы, подобно тому, как существуют архивы для кинофильмов, фотодокументов, аудио- и видеозаписей. Такие архивы, первоначально называемые "Архивами данных" (Data archives), были созданы на частной основе в некоторых западноевропейских странах (Дании, Нидерландах) еще в 1960-е годы для хранения материалов переписей населения и научно-исследовательских баз данных. В последние годы наметилась тенденция превращать их в государственные архивы, которые должны хранить не только базы данных, но и материалы делопроизводства государственных учреждений, если они существуют в электронном виде.

Каждый из этих подходов имеет свои достоинства и свои недостатки, которые могут по-разному проявляться в странах с разным уровнем экономического развития и разными культурными традициями. По моему мнению, австралийский опыт применим только в странах с сильными традициями законопослушания и исполнительности, где большинство членов общества ясно осознает свою ответственность перед будущими поколениями. Поддержание электронных документов в доступном состоянии требует постоянной заботы: контроля физического состояния носителей, регулярной конвертации (перезаписи на другой тип носителя и/или в файл другого типа) и миграции данных (переноса в другую информационную среду, в том числе под новые операционные системы). Организации, создающие документы, далеко не всегда имеют возможность (да и желание) проявлять такую заботу в отношении документов, непосредственная надобность в которых отпала. В странах, где уровень общественного сознания недостаточен, этот подход неизбежно приведет к массовой гибели документов, и никакой контроль со стороны архивных учреждений не сможет этого предотвратить.

Американский подход оправдан только в богатых странах с сильной экономикой, потому что он очень дорогостоящий. В условиях постоянного изменения информационных технологий, программного обеспечения и носителей информации требуются такие же постоянные затраты на техническое перевооружение архивов и обучение персонала. Между тем архивная отрасль почти в любой стране традиционно является одной из наименее финансируемых. Для нее достаточно сложно поддерживать на необходимом уровне техническое и кадровое обеспечение хотя бы одного архива. Распыление имеющихся средств на несколько объектов в такой ситуации бесперспективно.

Третий подход годится для любой страны, к тому же его можно сочетать с любым из двух остальных. В необходимых случаях можно оставить документы в организации, имеющей достаточный потенциал для их гарантированного сохранения в ведомственном архиве. Для этого можно в индивидуальном порядке продлить для этой организации срок ведомственного хранения или выдать ей лицензию на долгосрочное хранение архивных документов. Кроме того, специализированный центр может постепенно, по мере появления финансовых возможностей, превратиться в базу по подготовке кадров для остальных архивов, что позволит плавно перейти в будущем ко второму варианту. В Беларуси пошли именно по третьему пути. Предполагается, что основная забота о сохранности электронных документов в обозримом будущем должна быть прерогативой специализированного архивного учреждения.

С 1993 года начались работы по созданию архива электронных документов. Из-за проблем с финансированием они затянулись, и архив был введен в промышленную эксплуатацию только в декабре 1999 г., а доработки программного обеспечения для его автоматизированной системы продолжались до конца 2000 г. Проектирование архива по заказу Государственного комитета по архивам и делопроизводству (ныне он преобразован в Национальный центр по архивам и делопроизводству) осуществляло научно-исследовательское предприятие "Агат-Систем", которое до 1991 г. занималось разработкой компьютерных программ для систем противовоздушной обороны стран Варшавского договора. При создании архива учитывались идеи и соображения, которые высказывались в публикациях зарубежных архивистов, а также в рекомендациях Международного совета архивов [4].

В ходе проектных работ стало очевидным, что для долгосрочной сохранности электронных документов недостаточно тех мероприятий, которые осуществляются в обычных архивах. Необходимо постоянно отслеживать тенденции в развитии информационных технологий, периодически решать проблемы, связанные с устареванием форматов файлов и машинных носителей, обеспечивать мероприятия по защите информации и удостоверению ее подлинности, а также поддерживать в рабочем состоянии автоматизированную систему архива. Чтобы выполнять все эти функции, соответствующее учреждение должно иметь статус не архива, а научно-исследовательского центра.

Именно такой принцип был в конце концов реализован. Был создан научно-исследовательский центр электронной документации, а архив электронных документов является лишь одним из его структурных подразделений (на правах отдела). Кроме него, в структуре центра существуют четыре научных отдела: комплектования; информационно-поисковых систем; программного обеспечения и вычислительной техники; научного использования и публикации электронных документов. Архив состоит из заведующего и 6 архивистов, научные отделы - из заведующего и 5 - 6 научных сотрудников. Вместе с администрацией и обслуживающим персоналом штатное расписание центра на сегодняшний день включает 38 единиц.

Документы при передаче в архив конвертируются на носители архива - магнитооптические диски, на которых и будет осуществляться их последующее хранение. Действующая система предполагает раздельное хранение самих документов (помещенных в хранилище) и справочной информации о них, которая находится в базе данных на основе системы управления базами данных (СУБД) MS SQL-Server. Система предусматривает автоматизацию всех функций архива, начиная от учета организаций - источников комплектования и кончая учетом выдачи документов пользователям. Единственным исключением является поиск и доставка из хранилища дисков (автоматизация этой функции на первом этапе, при малом объеме хранимых документов, признана нецелесообразной). Диск с документом, затребованным пользователем, будет вручную доставляться из хранилища. Затем он поступит на автоматизированное рабочее место (АРМ) воспроизведения, который должен преобразовать информацию в человеко-читаемый вид.

Вместе с документами в архив поступает сопроводительная информация, включающая удостоверяющий документ (на бумаге), ведомости машинных носителей и фиксированный набор обязательных реквизитов (информационно-поисковую характеристику, ИПХ) на каждый документ. Перечень реквизитов ИПХ определяется "Правилами учета и передачи электронных (машиночитаемых) документов на государственное хранение", утвержденными приказом председателя Госкомархива 3.04.1997 г., а также СТБ 1221 "Документы электронные. Правила выполнения, обращения и хранения". Обязательными реквизитами являются:

  • обозначение и наименование документа;
  • даты создания, утверждения и последнего изменения;
  • сведения о создателях;
  • сведения о защите документа;
  • сведения о средствах электронной цифровой подписи или средствах хэширования, необходимых для проверки подписи или контрольной характеристики данного документа;
  • сведения о технических и программных средствах, необходимых для воспроизведения документа;
  • сведения о составе документа.

 

На АРМ комплектования эти сведения переносятся в базу данных архива. Для облегчения этой процедуры предприятие "Агат-Систем" разработало программный пакет "Спутник", который позволяет сформировать ИПХ сразу в электронной форме и импортировать ее в базу данных без дополнительной обработки. С помощью этого пакета формируется и ведомость машинных носителей. Он может быть установлен в ведомственном архиве организации, передающей документы на государственное хранение. Практика показала, что это существенно упрощает процедуру передачи.

Дальнейшая обработка документов, принятых на хранение, осуществляется на АРМ учета. Документу присваивается архивный шифр, в базу данных заносятся сведения об архивном носителе, на который он записывается, об условиях доступа к нему и т.п. Условия доступа к содержанию документов определяются в соответствии с законодательством и с учетом интересов фондообразователей. При необходимости АРМ учета позволяет актуализировать учетные сведения (например, если документ перезаписан на новый носитель или истек срок ограничений на доступ к нему).

Доступ пользователей к описаниям документов в базе данных возможен как в локальной вычислительной сети архива, так и удаленно - через Интернет. И в том, и в другом случае для этого служит АРМ читального зала, разработанный в форме интернет-браузера. С его помощью пользователь может найти нужный документ и, при наличии у него требуемых прав доступа, заказать его копию. БелНИЦЭД может обеспечивать доступ к информации различными способами - путем предоставления электронных копий документов в читальном зале архива, выдачи их твердых копий на бумажных носителях, передачи по каналам телекоммуникаций и в виде публикаций на компакт-дисках.

Помимо постоянного хранения электронных документов, БелНИЦЭД в состоянии оказывать широкий спектр дополнительных информационных услуг, включая временное (депозитарное) хранение документов общественных и коммерческих организаций на договорной основе, а также конвертацию данных заказчика на некоторые виды носителей (компакт-диски, магнитооптические диски).

Научные исследования центра проводятся с 1998 г. по двум основным направлениям. Первое из них называется "Нормативно-методическое обеспечение сохранности электронных документов", второе - "Информационные технологии доступа к архивным ресурсам". В рамках первого из этих направлений в 1998 - 2000 гг. был обеспечен ввод в действие государственного стандарта "Документы электронные. Правила выполнения, обращения и хранения", а также подготовлены инструкция о периодичности создания архивных копий информационных ресурсов и порядке их передачи на государственное хранение, различные методические рекомендации. Второе направление призвано использовать научный потенциал центра для нужд архивной отрасли в целом. Одним из наиболее значимых научных результатов центра явилось создание сайта "Архивы Беларуси" [5], который регулярно пополняется и поддерживается сотрудниками центра.

Комплектование архива электронных документов пока осуществляется в ограниченных масштабах. Всего на настоящий день приняты на постоянное хранение 4 фонда, в ближайшее время должны быть приняты еще 5 - 6. Мы умышленно не стремимся форсировать эту работу по ряду причин. Главной из них является нерешенность проблемы удостоверения подлинности документов. Практическое внедрение цифровой подписи в делопроизводстве (и следовательно, появление юридически полноправных электронных документов) пока сдерживается отсутствием сертифицированных программных средств. В настоящее время такие средства внедрены только в сфере межбанковских расчетов, где функционирует полноценная система безбумажного документооборота - автоматизированная система межбанковских расчетов (созданная на базе программных разработок фирмы IBM). Уже сегодня она обеспечивает прохождение платежных поручений между банками в электронной форме, с поддержкой цифровой подписи. Но создаваемые в ней документы имеют срок хранения до 5 лет и не подлежат передаче в государственные архивы. Для их хранения Национальным банком создан Центральный архив межбанковских расчетов.

При отсутствии в других ведомствах настоящих (в юридическом смысле) электронных документов там имеются или создаются большие объемы информационных ресурсов: различные государственные кадастры, регистры, базы данных и геоинформационные системы. Ответственность за ведение каждой системы лежит на определенном ведомстве: например, Министерство архитектуры и строительства создает кадастр территорий, Министерство лесного хозяйства - лесной кадастр, Министерство природных ресурсов и охраны окружающей среды - водный кадастр, кадастр торфяного фонда и др. Как правило, они создаются на основе бумажных документов, но за счет концентрации в одном месте информации из разных источников содержание кадастров приобретает качественно новый состав. Такой компактный и удобный в обращении информационный массив как целое не имеет бумажных аналогов. Поэтому очень важно сохранять для истории информацию, обновляемую при его постоянной актуализации.

Правовую основу для сохранения этой информации содержит статья 19 закона "О национальном архивном фонде и архивах в Республике Беларусь", в которой говорится: "Для постоянно обновляемых информационных ресурсов в электронной форме (баз и банков данных), в том числе поставляемых пользователям посредством информационных сетей, регулярно создаются архивные копии на правах подлинников. Периодичность создания архивных копий информационных ресурсов и порядок их передачи на государственное хранение определяются республиканским органом государственного управления по архивам и делопроизводству".

В развитие этого положения 24 марта 2000 г. Госкомархивом утверждена разработанная БелНИЦЭД "Инструкция о периодичности создания архивных копий информационных ресурсов и порядке их передачи на государственное хранение" [6]. В ней понятия информационного ресурса и архивного документа не смешиваются. Под информационными ресурсами понимается любая совокупность документированной информации, находящаяся в активном использовании и постоянном изменении: банки данных (включая кадастры и реестры), интернет-публикации (информационные сервера и отдельные Web-сайты) и т. п. Если содержащаяся в базе данных информация может быть частично утрачена в процессе обновления ресурса, то формируется поисковый запрос, охватывающий всю требуемую информацию. Отчет, генерируемый базой данных по этому запросу, представляет собой целостный массив информации, который должен соответствовать критериям архивного электронного документа (иметь необходимые реквизиты, контрольные характеристики или цифровые подписи, а также воспроизводимый формат). Именно такой отчет может быть принят на архивное хранение в качестве "мгновенного среза" информационного ресурса.

Сейчас прием копий информационных ресурсов в архив осуществляется в ограниченных масштабах, с целью выработать основные принципы программно-независимого хранения и визуализации этих данных. Пока еще в этом вопросе не все ясно. Например, в 2000 г. в архив передана на хранение копия государственного реестра ценных бумаг за 1992 - 1999 годы, который был создан в Государственной инспекции (позднее - комитете) по ценным бумагам. Программное обеспечение системы, поддерживающей этот реестр, позволяет формировать и распечатывать запросы в специфическом формате prn, не поддерживаемом операционной системой Windows и современными лазерными принтерами. В настоящее время данные доступны для визуализации с помощью стандартной программы просмотра файлов View, работающей под операционной системой DOS. Очевидно, что для долгосрочной доступности этого недостаточно, и в ближайшее время предстоит решить вопрос о конвертации файлов в более универсальный формат.

На сегодняшний день наиболее трудную задачу для программно-независимого отображения представляют автоматизированные системы, использующие векторную графику. В таких системах содержатся не готовые изображения графических объектов, а координаты их значимых точек. При воспроизведении объекта на экране он фактически каждый раз рисуется заново, причем разные системы используют собственные форматы для хранения координат и разные алгоритмы построения изображений. Одним из примеров являются широко используемые в проектных институтах системы автоматизированного проектирования (САПР), где в векторной форме представлены прежде всего чертежи.

В отношении проектных институтов острота проблемы пока сглаживается тем, что действующие нормативы предполагают обязательное оформление проекта в бумажной форме. Именно бумажные распечатки чертежей, изготовленных с помощью САПР, являются оригиналами и подлежат передаче на архивное хранение. Но уже отчетливо просматривается стремление проектировщиков отказаться от громоздких бумажных архивов и хранить более компактные, цифровые версии проектов. Прежде чем узаконить эту практику, необходимо обеспечить воспроизводимость векторных объектов - например, путем фиксации в текстовом формате их координат (как это делается при экспорте данных из одной системы в другую), или посредством преобразования векторных изображений в растровые (т.е. изготовления своеобразных электронных слайдов, предназначенных исключительно для просмотра или распечатывания).

Другой пример - геоинформационные системы (ГИС), в которых в векторной форме задаются карты и планы земной поверхности. Такие системы широко используются в градостроительстве и различных кадастрах. Если текстовую составляющую их содержания сохранить сравнительно просто, то в отношении векторных слоев необходимо избрать тот же путь, что и в отношении САПР - преобразование в растровое изображение. Главной задачей при этом является сохранение связи между изображением объекта на карте и информацией о нем, содержащейся в базе данных. В естественной программной среде ГИС эта связь поддерживается автоматически, но при конвертации в программно-независимые форматы может быть утрачена. Избежать этого можно, если обеспечить фиксацию в текстовой форме координат хотя бы одной точки каждого объекта. В таком случае сохраняется возможность их импорта в любую ГИС, в которой такие объекты можно будет отображать поверх растрового слоя.

Ряд принципиальных вопросов мы рассчитываем решить в 2002 году, в процессе выработки рекомендаций по архивированию обновляемых данных из градостроительного кадастра по городу Минску - довольно мощной геоинформационной системы, в которой одновременно задействованы разные программные средства векторной графики. На ее примере предстоит разработать нормативные документы, которые детально описывали бы методику создания архивных копий такого рода ресурсов (в общем виде эта методика изложена в вышеупомянутой "Инструкции о периодичности создания архивных копий информационных ресурсов и порядке их передачи на государственное хранение", но для данного случая они явно требуют конкретизации). После решения этой задачи можно будет приступать к массовой передаче информации аналогичных систем на архивное хранение.

Архивная отрасль Беларуси, несмотря на сравнительно небольшой опыт применения компьютерных технологий, уже успела столкнуться с собственной проблемой устаревших форматов. В середине 1992 г. в Госкомархиве началось заполнение базы данных жертв политических репрессий. В настоящее время введены данные почти на 74 тыс. реабилитированных - более трети от их общего количества. Программное обеспечение этого проекта (операционная система DOS и СУБД Clipper) и техническая реализация (персональный компьютер с процессором IBM РС-286) морально устарели. Насущной задачей стала конвертация базы данных в современный формат, чтобы продолжить ее заполнение на высокопроизводительных компьютерах, обеспечить надежную сохранность и более эффективный доступ к информации. Решение этой задачи взял на себя БелНИЦЭД. В 2001 г. нашим специалистам удалось конвертировать существующую базу и оптимизировать ее структуру, после чего продолжено ее заполнение уже в среде СУБД MS Access.

Отдельный вопрос - архивирование интернет-публикаций. История развития человеческой цивилизации в конце ХХ - XXI веке будет заведомо неполной без представления о том, какая информация была представлена в Интернете, кто и как ее использовал или контролировал доступ к ней. Но для того, чтобы информационные ресурсы Интернет были зафиксированы и сохранены для истории, кто-то должен взять на себя функции их отбора и хранения. Теоретики архивного дела склонны рассматривать Web-сайты не как документы, а как публикации. Означает ли это, что о сохранении электронных публикаций должны позаботиться библиотеки? Возможно, это оправданно в отношении статей и монографий, выставленных в Интернете в виде текстовых файлов. Но не только тексты, а сайт в целом, включая его внешнее оформление, может представлять историческую ценность, причем не только информативную, но и в определенном смысле музейную. Нашим потомкам, безусловно, будет интересно увидеть первые Web-страницы в том виде, в котором их видим мы на экранах наших компьютеров. Связанные с этим проблемы аналогичны проблемам, возникающим при долгосрочном хранении других видов информационных ресурсов. Логично было бы и решать их в одной организации. Поэтому мы считаем хранение архивных копий сайтов своей перспективной задачей.

Пока наш архив принял на хранение четыре такие копии - разработанного самим БелНИЦЭД сайта "Архивы Беларуси", личного сайта журналиста и литератора Сергея Крапивина, официального сайта Белорусского института проблем культуры и поддерживаемого этой же организацией сайта детского творчества "Оазис". Архивные копии этих документов были сформированы самими фондообразователями, т. е. мы не скачивали их непосредственно из Интернета. Документы хранятся в исходном формате html, их визуализация посредством интернет-браузера пока трудностей не вызывает.

Помимо обеспечения сохранности документов, изначально создаваемых в электронном виде, важным направлением деятельности архивистов является внедрение современных технологий доступа к традиционным бумажным документам. Речь идет о создании электронных факсимильных копий таких документов, которые затем могут публиковаться в сети Интернет или отдельными изданиями на компакт-дисках. В Беларуси уже сделаны первые шаги в этом направлении.

В Национальном архиве Республики Беларусь (НАРБ) с апреля 1997 года началась работа по оцифровке комплекса фондов подпольных партизанских соединений, действовавших на временно оккупированной территории Беларуси в 1941-1945 гг. Выбор объекта оцифровки определялся прежде всего угрожающим физическим состоянием этого комплекса документов - в военных условиях для них использовалась низкокачественная, хрупкая бумага, текст писался карандашом или выцветающими чернилами. Оцифровка преследует две цели. С одной стороны, создается фонд рабочих копий, который позволит исключить из обращения ветхие оригиналы. С другой стороны, эти же копии смогут в какой-то степени заменить сами оригиналы, если процесс их разрушения не удастся остановить. Документы сканируются на планшетном сканере UMAX Mirage D-164 (формата А3) с разрешением в 200 dpi и записываются на магнитооптические диски емкостью 640 Mb в формате JPEG. В год сканируется около 10 тысяч файлов (примерно 4 диска). В итоге за период с апреля 1997 года по июнь 2001 года в Национальном архиве были оцифрованы материалы 10 фондов (18 магнитооптических дисков). Описания документов вносятся в информационно-поисковую систему. Она имеет конвертор, позволяющий затем импортировать эти описания в поисковую систему архива БелНИЦЭД, где предполагается хранить страховую копию оцифрованных документов. Опытная эксплуатация продемонстрировала, что системы обоих архивов обладают необходимым уровнем совместимости.

С июля 2001 года Национальный исторический архив Беларуси также приступил к оцифровке документов. Первым объектом стали ревизские сказки, как основной и наиболее часто используемый источник при составлении ответов на генеалогические запросы. Как и в НАРБ, документы сканируются на планшетном сканере формата А3. Изображения сохраняются в формате JPEG, с разрешением 150 dpi и 10% сжатием. За рабочую смену (4 часа) сканируется порядка 50 изображений. Оцифрованные изображения планируется записывать на компакт-диски, но на сегодняшний день, в виду отсутствия соответствующего оборудования, файлы хранятся на жестком диске компьютера, на котором ведется их обработка. Учитывая, что Генеалогическим обществом Юты уже микрофильмированы ревизские сказки из белорусских архивов и один экземпляр микрофильмов хранится в страховом фонде Белорусского государственного архива кинофотофонодокументов, одной из приоритетных задач является сканирование имеющихся микрофильмов, что позволило бы создать эффективный фонд пользования.

В 2001 г. началось создание цифровых копий редких фотографий, хранящихся в Белорусском государственном архиве-музее литературы и искусства. Фотографии сканируются и сохраняются в формате TIF, после чего каждое изображение представляет из себя отдельный файл. Для оперативного доступа к ним требуется подробное описание, позволяющее сразу найти нужный файл. Сложность в том, что в этом архиве информационно-поисковые системы ведутся на базе распространенной в архивном мире программы ISIS-М, и уже имеющиеся описания нельзя прямо импортировать в систему архива электронных документов БелНИЦЭД. Чтобы избежать повторного ввода описаний, наши специалисты сейчас изучают возможности переноса данных из ISIS-М. Одновременно мы рассматриваем перспективы хранения цифровых копий в формате PDF, который позволяет помещать несколько изображений в общий файл, создавая что-то вроде цифрового фотоальбома. В порядке эксперимента оцифрованы и конвертированы в формат PDF также некоторые нотные партитуры из фондов этого же архива.

В 2001 г. БелНИЦЭД завершил разработку "Концепции цифрового копирования документов Национального архивного фонда Республики Беларусь". Предполагается, что основную работу по созданию электронных копий возьмут на себя архивы, в которых хранятся оригиналы документов, а БелНИЦЭД будет оказывать им методическое содействие и возьмет на себя хранение эталонных экземпляров, а также обеспечение доступа к этим копиям на основе информационных технологий. Очевидно, задача конвертации архивной информации в электронный вид вскоре встанет и перед ведомственными организациями, связанными с обработкой больших информационных массивов. Ближайшей перспективой в деятельности центра является также его участие в процессе перехода государственных учреждений к полноценному электронному документообороту.

Полка нерешенной проблемой остается "закрытость" автоматизированной системы архива, разработанной "Агат-Систем". Жизнь диктует постоянное дополнение ее новыми модулями, необходимость которых еще отсутствовала в момент ее ввода в эксплуатацию. Примером могут послужить средства подсчета контрольной характеристики файла и проверки цифровой подписи, наличие которых стало необходимым после ввода в действие закона "Об электронном документе". Несомненно, что нормативная база будет меняться и дальше, что потребует дальнейших доработок системы. Но каждая такая доработка фактически означает создание новой версии системы, на что нужны значительные затраты. Рано или поздно встанет вопрос совместимости программных средств архива с будущими поколениями операционных систем.

В эпоху электронных документов, для которых можно получить любое количество равнозначных копий, роль архивов неизбежно претерпит изменения. Появляется возможность хранить рабочие экземпляры документов рассредоточенно - там, где в них возникает потребность. Каждый пользователь может с помощью удаленного доступа получить собственную копию, с точки зрения информационной ценности совершенно равнозначную исходному документу. Тем не менее, обеспечение сохранности эталонов электронных документов останется прерогативой архивистов независимо от того, сколько равноценных экземпляров будет находиться в обращении. Более того, централизованное архивохранилище сегодня представляется единственным местом, где такая сохранность может быть гарантирована, ибо только для архивистов забота о документах, вышедших из активного обращения, всегда была и будет важнейшей задачей.

  1. J. Coleman and D. Willis. SGML as a Framework for Digital Preservation and Access. Report from the Commission on Preservation and Access of the Council on Library and Information Resources. July 1997.
  2. Jeff Rothenberg. Avoiding Technological Quicksand. Finding a Viable Technical Foundation for Digital Preservation. Report from the European Commission on Preservation and Access. Amsterdam, 1999.
  3. http://www.aa.gov.au/recordkeeping/er/summary.html
  4. Guide for Managing Electronic Records from an Archival Perspective, in Studies ICA, vol. 8, Feb. 1997.
  5. http://www/president.gov.by/gosarchives/
  6. Национальный реестр правовых актов Республики Беларусь, №8/3280, 05.04.2000. См. также: Архівы і справаводства. 2000. № 4.