Достоверность и доступность цифровой информации - два вызова информационной эры (2001)

Архiвы i справаводства. Минск, 2001. № 2. С. 53 - 60

Количество информации, зафиксированной на машинных носителях, увеличивается взрывообразно. Стремительность происходящих изменений хорошо видна хотя бы в том, как часто меняется терминология. Еще в первой половине 1990-х гг. информацию на машинных носителях обычно определяли как машиночитаемые документы (русскоязычный эквивалент термина machine-readable records, утвердившегося в международной практике с 1970-х гг.). К середине 90-х гг. этот термин повсеместно вытесняется термином электронные документы (англоязычные соответствия - electronic documents, electronic records). Но, не успев утвердиться, это понятие уже устаревает: все чаще его заменяет более точное название цифровые документы (digital documents), или цифровая информация. Как отмечает американский специалист Джефф Ротенберг, новый термин предпочтительнее, так как "цифровая информация может быть в принципе представлена в неэлектронной форме, например, с использованием оптических и квантовых технологий, в то время как электронная информация не обязательно является цифровой" [1]. Терминология попросту не поспевает за прогрессом в сфере информационных технологий, появлением все новых способов фиксации и передачи информации.

Человечество уже имело возможность убедиться, что за безудержный прогресс неизбежно приходится платить, причем цена порой оказывается гораздо большей, чем представлялось вначале. Аналогичные предостережения раздаются и в отношении информационных технологий. При этом характерной особенностью современного процесса информатизации является его глобальность. Новейшие программы и технические решения проникают в удаленные уголки земного шара всего через несколько лет и даже месяцев после их появления на рынке, а закон "Об электронном документе" в Беларуси был введен в действие даже раньше, чем в США. В таких условиях проблемы, связанные с "изнанкой" технического прогресса, также будут проявляться повсюду одновременно (как это уже наблюдалось в отношении "проблемы 2000 года"). А это значит, что и решать их придется всем, не рассчитывая на то, что наиболее развитые страны успеют найти решение до того, как проблема коснется остальных.

На сегодняшний день вполне очевидны два уязвимых места информационных технологий. Во-первых, закачав в компьютерные системы огромные информационные массивы и затратив на это колоссальные финансовые и трудовые ресурсы, мы в один прекрасный момент можем обнаружить, что достоверность информации небесспорна: скажем, у нас появились подозрения, что кто-то изменял ее в корыстных целях. В результате весь затраченный труд может быть частично или полностью обесценен. Во-вторых, вся эта информация может попросту оказаться недоступной по причине несовместимости форматов и разных поколений программно-технического обеспечения.

Первая из этих угроз связана с тем, что цифровая информация может быть изменена таким образом, что на носителе не остается никаких следов. Появление информационных систем, содержимое которых может повлиять на материальное благосостояние граждан, неизбежно порождает и искушение злоупотребить этой возможностью. Отсюда вытекают гораздо более строгие (и дорогостоящие) требования по защите информации. Переход к электронному документообороту невозможен без высокоэффективных средств создания и поддержки цифровой подписи, а также обеспечения возможности их сертификации в соответствии с требованиями закона "Об электронном документе". В этом смысле принятие данного закона в Беларуси на несколько месяцев раньше, чем в США, нисколько не отражает реальную ситуацию. Гораздо более показательно то, что белорусский закон был подписан обычной авторучкой, в то время как оригинал американского был снабжен магнитной вставкой, на которую президент Клинтон собственноручно нанес цифровую подпись (правда, даже в этом случае он продублировал ее традиционной подписью с помощью авторучки).

Помимо отсутствия денег на разработку и внедрение сертифицированных средств цифровой подписи, не менее серьезным сдерживающим фактором остается недостаточное понимание тех правовых и организационных последствий, которые влечет за собой переход к электронному документообороту. Оно проявляется не только среди руководителей организаций, но и среди разработчиков программных средств. Для них средства цифровой подписи - всего лишь еще один модуль, который может быть добавлен в создаваемую ими систему. Между тем наличие такого модуля (при условии его соответствия действующим нормативным актам) означает переход системы в качественно иное состояние: с этого момента именно электронный (цифровой) документ становится оригиналом, а бумажная распечатка - всего лишь его копией. Соответственно перемещается и адресация всех требований по защите информации, а также по архивному хранению.

На практике уже возникает любопытная ситуация: вполне конкретное министерство, не считая себя готовым к внедрению полноценной системы безбумажного документооборота, создает систему, в которой параллельно обращаются обычные бумажные документы (удостоверенные надлежащим образом и имеющие юридическую силу) и их цифровые версии, гораздо более удобные для практической работы. Но при этом фактически бумажный документ не рассылается, подведомственные организации получают по сети лишь цифровую копию. Другими словами, электронный документооборот существует де-факто, но без соблюдения адекватных требований по защите информации. Цифровая копия, на основании которой исполнители принимают решения и осуществляют предписанные мероприятия, защищена от подделки только стандартными системными средствами. Между тем, каких-либо унифицированных требований к таким средствам защиты в нашей стране не существует, в отличие от тех же США, где Департаментом безопасности разработан стандарт DoD 5015.2-STD, определяющий требования к программным средствам по управлению документацией (Records Management Applications, RMA) [2]. Даже в американской ситуации не исключена вероятность того, что недобросовестный системный администратор или злоумышленник-хакер сможет изменять цифровые версии документов по своему усмотрению. В нашем же случае сделать это весьма просто. Остается уповать лишь на то, что уважающий себя хакер побрезгует столь легкой добычей.

По имеющейся у автора информации, цифровые копии фактически берут на себя роль электронных документов не только в нашей стране, но и в других странах с аналогичными правовыми и экономическими условиями - в Российской Федерации, а также в Украине, где по электронной почте осуществляется даже рассылка директив из Совета Министров в министерства. А поскольку сличение с бумажным эталоном обычно не практикуется, это может означать фактический перехват контроля над управлением организацией или ведомством, а в украинском случае - даже на высшем уровне государственного управления. Случись подобное, это надолго дискредитировало бы саму идею безбумажного документооборота, хотя в действительности возможность такой фальсификации определяется лишь неправильным применением этой идеи, а отнюдь не ее фундаментальными изъянами.

Но даже внедрение программных средств поддержки цифровой подписи не снимает проблему полностью, поскольку в системах электронного документооборота (равно как и в автоматизированных системах ведения электронных регистров и банков данных) существует еще одно слабое звено - хранение ключей цифровой подписи и паролей, регулирующих доступ к данным. Надежность такого хранения в состоянии обеспечить только высококвалифицированный (и соответственно оплачиваемый) специалист. Между тем в штатах органов государственного управления и подведомственных им организаций должность системного администратора (специалиста по защите информации) пока не предусматривается. Более того, практически полностью отсутствует понимание необходимости и значимости этой должности в новых условиях, равно как отсутствует и программа их подготовки. Это, увы, не препятствует организациям внедрять у себя информационные системы, хотя без соответствующего кадрового обеспечения никто не может поручиться за достоверность их содержимого.

Вторая угроза, как отмечалось выше, связана с устареванием и взаимной несовместимостью технологий. Общество попадает во все большую зависимость от цифровой информации, не обеспечив ее долгосрочную доступность. Уже сегодня недоступна основная масса информации, созданной до "микрокомпьютерной революции" рубежа 1990-х гг. на так называемых "больших" ЭВМ (mainframe). В качестве примера можно упомянуть, что Министерству статистики не удалось несколько лет назад воспроизвести данные переписи населения СССР 1989 года, частично введенные в компьютеры после ее завершения. Проблема здесь не в том, что информацию технически невозможно конвертировать в современные форматы и технологии. В большинстве конкретных случаев (при некотором минимуме физической сохранности самих носителей) эта задача разрешима. Но объем несовместимых данных может оказаться весьма велик, а в нужный момент для их конвертации не окажется необходимых финансовых и трудовых ресурсов. Между тем по мере создания новых информационных систем (и устаревания прежних) масса данных, требующих конвертации, будет неуклонно нарастать. Под этой тяжестью вся информационная структура общества может однажды рухнуть. Один из аналитических обзоров, посвященный этой проблеме и выставленный в апреле 2000 г. на сервере общественной организации CENSA (the Collaborate Electronic Notebook Systems Association), его авторы снабдили впечатляющим названием: "Титаник-2020" [3]. Имеется в виду, что человечество, подобно пассажирам знаменитого лайнера, беззаботно вверяет свою жизненно важную информацию новейшим компьютерным технологиям, не задумываясь об их уязвимости. По мнению авторов обзора CENSA, опасность глобального обвала информационных систем по причине их взаимной несовместимости станет вполне реальной примерно в 2020 году.

Создатели информационных ресурсов мало задумываются над этим, поскольку для них самих доступ к собственной информации пока не представляет сложностей. Однако уже сегодня эти сложности вполне реальны в сфере информационного взаимодействия между продуктами разных разработчиков. В качестве примера можно привести комплекс государственных кадастров, создаваемых в Беларуси в форме информационно-поисковых или геоинформационных систем. Ответственность за ведение каждой системы лежит на определенном ведомстве: например, Министерство архитектуры и строительства создает кадастр территорий, Министерство лесного хозяйства - лесной кадастр, Министерство природных ресурсов и охраны окружающей среды - водный кадастр, кадастр торфяного фонда и др. Одновременно Институт языкознания Национальной академии наук создает базу данных всех населенных пунктов на территории Беларуси, а Государственный комитет по земельным ресурсам, геодезии и картографии приступает к созданию каталога наименований географических объектов. Очевидно, что все эти кадастры и базы данных тематически увязаны между собой, и в идеале создание каталога географических объектов должно происходить путем импорта данных, уже введенных в другие системы. На практике это весьма проблематично, так как информация в системах по-разному структурирована и представлена в разных форматах. Приходится признать, что меры, предусмотренные постановлением Совета Министров от 12 апреля 1999 г. № 494 "Об утверждении положения о порядке информационного взаимодействия государственных кадастров, регистров и иных информационных систем" оказались не только запоздалыми, но и недостаточными. Интеграция существующих кадастров в единую систему требует дополнительных усилий и финансовых затрат.

Аналогичная ситуация наблюдается в отношении автоматизированной системы "Паспорт", создаваемой Министерством внутренних дел. Содержащиеся в ней анкетные данные оказалась востребованными Фондом социальной защиты населения, который создает реестр индивидуальных лицевых счетов застрахованных лиц. Несмотря на то, что обе организации используют идентичное программное обеспечение (СУБД Oracle), по ряду причин оказалось невозможным организовать удаленный доступ к данным непосредственно в системе "Паспорт". В настоящее время идет дупликация базы данных, т.е. ее перекачка из одной системы в другую по каналам телекоммуникаций. Даже эта сравнительно простая операция потребовала новых программных разработок с привлечением создателей АИС "Паспорт" (а следовательно, и новых расходов). К счастью, у Фонда социальной защиты необходимые деньги нашлись. А вот белорусские архивисты, также заинтересованные в использовании данных АИС "Паспорт" для выполнения социальных и генеалогических запросов, пока лишь изыскивают средства, чтобы скопировать базу данных для собственных нужд. При этом в архивной отрасли нет средств на приобретение пакета Oracle, и данные в лучшем случае придется принимать в текстовом формате. Организация доступа к ним потребует новых программных разработок и новых затрат.

Архивная отрасль Беларуси, несмотря на сравнительно небольшой опыт применения компьютерных технологий, уже успела столкнуться с собственной проблемой того же рода. В середине 1992 г. в Государственном комитете по архивам и делопроизводству началось заполнение базы данных жертв политических репрессий. В настоящее время введены данные почти на 74 тыс. реабилитированных - более трети от их общего количества. Эти данные пока еще доступны, хотя и программное (операционная система DOS и СУБД "Клипер"), и техническое обеспечение (персональный компьютер с процессором IBM РС-286) морально устарело. Насущной задачей становится конвертация базы данных в современный формат, что позволит продолжить ее заполнение на высокопроизводительных компьютерах, обеспечить надежную сохранность и более эффективный доступ к информации. Решение этой задачи опять-таки потребует значительных трудозатрат.

Приведенные примеры показывают, что затронутая тема вполне актуальна и в нашей стране, хотя массивы жизненно важной цифровой информации здесь в основном находятся в процессе создания или проектирования. Ситуация может существенно обостриться именно после принятия закона "Об электронном документе", поскольку он открывает возможность для появления юридически полноправных документов, существующих исключительно в цифровой форме. До этого во всех жизненно важных случаях обязательно сохранялся бумажный аналог если не самой информационной системы, то исходных данных, на основании которых она создавалась. Возможность избавиться от этих бумажных завалов означает большой шаг вперед, но одновременно увеличивает нашу зависимость от информационного "Титаника", на палубу которого мы вполне добровольно вступаем.

Пока еще информационные ресурсы в большинстве случаев так или иначе продублированы на бумаге, да и сами технологии их создания не успели устареть. Но уже сейчас информация, вносимая в вышеупомянутые государственные кадастры, имеет долгосрочную ценность, причем параллельное хранение исходных данных на бумаге явно нецелесообразно. Это же относится к системам регистрации и учета населения, таким, как база данных Фонда социальной защиты. В ней предполагается централизованно хранить информацию об отчислениях в пенсионный фонд, необходимую для последующей выплаты пенсий всем гражданам Беларуси. Рано или поздно наличие такой системы может привести к отмиранию привычных трудовых книжек, и после этого от ее жизнеспособность будет напрямую зависеть жизнеспособность каждого жителя страны.

Требования, заложенные в СТБ 1221-2000 "Документы электронные. Правила выполнения, обращения и хранения", позволяют гарантировать, что при их соблюдении электронные документы всегда можно будет идентифицировать и воспроизвести - до той поры, пока сама организация испытывает в них потребность. Этот срок для основной массы документов не превышает 10 - 20 лет, и за это время технология не успеет устареть безнадежно. Но среди этих документов неизбежно окажутся те, что должны храниться постоянно, и рано или поздно придет пора передавать их в государственный архив. Это значит, что дальнейший груз ответственности за их доступность ложится на плечи архивистов. Не секрет, что эта категория работников - далеко не самая высокооплачиваемая в обществе, и рассчитывать на привлечение высококлассных специалистов в области компьютерных технологий ей не приходится. Тем не менее, этим людям предстоит столкнуться с проблемой, которая пока нигде в мире не нашла адекватного решения.

Эти проблемы неизбежно обострятся при следующей смене поколений в компьютерном мире. Какими будут информационные технологии будущего - предвидеть сложно, хотя некоторые их черты уже просматриваются довольно отчетливо. Так, можно полагать, что они будут полностью интегрированы в глобальную систему телекоммуникаций. Исходя из этого, можно оценить степень доступности создаваемых сегодня информационных ресурсов: те из них, для которых уже сейчас сложно обеспечить онлайновый доступ через Интернет, наверняка будут труднодоступны для наших потомков (а возможно, и для нас самих спустя всего 10 - 15 лет). Увы, нельзя столь же уверенно утверждать обратное: что современные ресурсы, изначально ориентированные на Интернет, наверняка останутся доступными.

Пока в мире не найден путь к полной долгосрочной сохранности цифровой информации во всем ее многообразии, со всеми удобствами поиска и внешнего представления, и уповать на то, что такой путь будет обязательно найден, слишком рискованно. В то же время уже сейчас можно гарантировать доступность для будущих поколений линейной последовательности букв и цифр, т. е. неформатированных текстов, а также графики в растровых форматах (в виде такой же последовательности точек разных цветов). Это лучше, чем утратить все, но даже для реализации этой программы-минимума нужно принимать определенные меры уже сейчас.

Очевидно, что базы данных нужно хранить не только в их исходных программно-зависимых форматах, но одновременно создавать их архивные копии в текстовой форме. Именно такой подход предусматривает "Инструкция о периодичности создания архивных копий информационных ресурсов и порядке их передачи на государственное хранение", утвержденная Госкомархивом 24 марта 2000 г. [4]. Действие этой инструкции распространяется на постоянно обновляемые информационные ресурсы (т.е. такие, в которых новая информация может безвозвратно заменять предыдущую), имеющие постоянный срок хранения. Но, возможно, этого же подхода стоит придерживаться и в отношении ресурсов, в которых новая информация пополняется без удаления прежней. Наличие регулярно обновляемой текстовой версии таких ресурсов (банков и баз данных, кадастров и т.п.) позволит не только предотвратить утрату информации в случае нештатной ситуации, но и существенно облегчить прием таких ресурсов на архивное хранение после их выхода из эксплуатации. Для геоинформационных систем следует позаботиться о хранении в одном из распространенных программно-независимых форматов (tif, jpg) растровых картографических слоев, используемых в таких системах, а также обеспечить вывод в текстовой форме координат векторных объектов.

В отношении систем документационного обеспечения управления рекомендации аналогичны. Как правило, в них документ и его реквизиты фактически представляют собой совокупность записей в базе данных, часто в специфическом формате. Их хранение в так называемом "интеллектуальном архиве" обеспечивается исключительно внутри системы. Разработчикам и пользователям таких систем важно не забывать, что часть циркулирующих в них документов рано или поздно должна быть экспортирована в другую систему, а именно в информационную систему государственного архива. При этом целостная совокупность содержания и реквизитов документа должна выгружаться в программно-независимом формате. Целесообразно создавать такую архивную копию уже на стадии хранения документов во внутрисистемном "интеллектуальном архиве".

Более общая рекомендация для информационных систем всех видов сводится к обязательной их открытости. Это значит, что любая внедряемая система должна предусматривать возможность экспорта содержащейся в ней информации как минимум в одну из аналогичных систем, использующих другие форматы и способы представления данных. Чем более гибкими являются такие возможности экспорта, тем лучше. В идеале нужно стремиться к тому, чтобы содержимое системы было потенциально доступным посредством любого Интернет-браузера в онлайновом режиме (это не значит, что непременно нужно в действительности организовывать онлайновый доступ). Это пожелание нельзя рассматривать как панацею, но в сегодняшних условиях оно содержит в себе максимум того, что мы можем предпринять для предотвращения фатальной зависимости наших информационных ресурсов от капризов непредсказуемого технического прогресса.

Отрадно, что в деле обеспечения архивного хранения электронных документов Беларусь сегодня занимает лидирующие позиции, опережая другие страны Восточной и даже Центральной Европы. Но это лидерство можно очень быстро утратить, если в нужный момент у государства не окажется средств для решения будущих проблем. К тому же в архивы электронных документов будет попросту нечего передавать, если в тех организациях, где эти документы создаются, не будут приняты должные меры по обеспечению их достоверности и долгосрочной доступности. Как отмечалось выше, перспективы кадрового обеспечения систем документооборота в этих организациях внушают серьезные опасения. Очевидно, назрела необходимость создать на государственном уровне систему аттестации рабочих мест в сфере документационного обеспечения управления, а также систему аттестации специалистов, претендующих на занятие этих мест. Организации должны получить право по результатам такой аттестации устанавливать значительные надбавки к должностным окладам соответствующих работников, что позволило бы привлечь специалистов необходимого уровня. На пороге нового тысячелетия этот вопрос представляется ключевым. Только решив его, мы сможем адекватно ответить на вызов времени.

  1. Jeff Rothenberg. Avoiding Technological Quicksand^ Finding a Viable Technical Foundation for Digital Preservation. - European Commission on Preservation and Access. Amsterdam, 1999. P.3.
  2. Текст стандарта доступен в Интернет: http://Jitc.fhu.disa.mil/recmgt/.
  3. Rich Lysakowski and Zahava Leibowitz. Titanic-2020 - a Call to Action.// www.censa.org/html/Press-Releases/Titanic2020.htm.
  4. Национальный реестр правовых актов Республики Беларусь, № 8/3280, 05.04.2000. См. также: Архівы і справаводства. 2000. № 4.