Актуальность применения информационных технологий в архивном хранении документов. Современные технологии хранения электронных документов

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Исследование проблемы управления документацией в условиях новых информационных технологий. Понятие документированной информации: анализ, свойства; материальная составляющая. Документы на различных современных носителях информации: типы, характеристика.

    курсовая работа , добавлен 22.08.2011

    Учет и обеспечение сохранности документов Архивного Фонда Российской Федерации. Система научно-справочного аппарата к архивным документам. Классификация архивной документации. Архивные путеводители. Обзоры документов и другие архивные справочники.

    курсовая работа , добавлен 12.10.2008

    Краткая история архивоведения, законодательство об архивном деле. Состав Архивного фонда Российской Федерации и включение в него документов, защита права собственности на архивные документы. Правила комплектования, хранения и учета архивных документов.

    методичка , добавлен 17.12.2009

    Общие понятия об архивах и Архивном фонде. Состав и структура Архивного фонда РФ. Классификация, порядок комплектования, хранения, учёта и использования документов архива. Понятие архива электронных документов и проблемы обеспечения их сохранности.

    курсовая работа , добавлен 01.09.2008

    Задачи, функции, права, ответственность архивов. Организация документов, учет документов, использование документов в архиве. Требования к составлению номенклатур дел и формированию дел. Экспертиза ценности документов. Обеспечение сохранности документов.

    курсовая работа , добавлен 19.07.2008

    Понятия информационных технологий, их виды, специфика и способы внедрения с целью совершенствования документационного обеспечения управления. Классификация, сравнение и общая характеристика программных продуктов электронного управления документацией.

    дипломная работа , добавлен 17.05.2010

    Изучение системы учета и обеспечение сохранности документов в государственном (ведомственном) архиве Российской Федерации. Размещение документов в хранилище, топографирование. Проверки наличия и состояния дел. Старение и факторы разрушения документов.

    курсовая работа , добавлен 20.09.2016

информация архив документ делопроизводство

В архивном деле в основном применяется технология баз данных (БД), а также другие информационные технологии (сканирование документов, сетевые технологии и т.д.).

Среди автоматизированных архивных технологий количественно преобладают базы данных простейшей структуры на большие однородные массивы данных. Однако ААТ позволяют значительно усовершенствовать работу архивиста в области каталогизации, учета и использования архивных документов. Кроме того, в целом, можно заметить, что по каждому направлению существует несколько программных продуктов, выполненных различными разработчиками на разных оболочках. Так, например, БД "Архивный фонд", "Фондовый каталог" (Росархив), а также разработанные ВНИИДАД базы данных "Паспорт архива", "Учет фондов", "Аннотация фондов", "Учреждения - источники комплектования", "Учет исполнения запросов", "Читальный зал", "Физическое состояние документов" и др.

При этом можно заметить, что типовые БД, разработанные ВНИИДАД ориентированы на фонды и дела, архивы же более активны в создании тематических БД на уровне документа.

Все базы данных, создаваемые в архиве, условно разделяются на учетные и информационно-поисковые. Эти две категории баз данных различаются структурой, методикой создания, применяемым программным обеспечением.

Учетные базы данных служат для обработки статистических массивов - учета документов и дел в архиве, учета использования, контроля за обеспечением сохранности и т.д.

Учетные базы данных в архиве учреждений предназначена для определения количества документов в единицах учета (единица хранения) и обеспечения сохранности документов при выдаче их во временное пользование в структурные подразделения. Учетные БД могут создаваться по функциональному или интеграционному (многофункциональному) принципу.

Информационную основу БД составляют сведения о составе и объеме документов, составе и объеме страхового фонда копий документов, государственном учете и научно-справочном аппарате к документам, составе и объеме научно-справочной библиотеки, зданиях. При разработке БД "Учет фондов" в качестве объекта автоматизации выступали функции, выполняемые госархивами по учету документов как государственной, так и негосударственной части Архивного фонда Российской Федерации. Типовые решения ведения государственного учета для архивов Российской Федерации разного уровня вырабатывались с условием последующей адаптации к специфике каждого отдельного архива. БД способствует совершенствованию деятельности архивов по обеспечению сохранности, организации рационального хранения, оперативного адресного поиска фондов и описей, фиксации объема хранящихся дел, его изменений и подготовке статистических данных как по архиву в целом, так и по отдельным хранилищам. БД "Учет фондов" отражает и отслеживает информацию о движении документов, об учете и внесении изменений по описи, об учете и внесении изменений по фонду. Логическим продолжением компьютерной поддержки архивной деятельности в области учета документов является БД "Аннотация фонда", которая обеспечивает оперативность и качественный уровень тематического поиска и подготовки межфондовых и внутрифондовых справочников (путеводителей, кратких справочников, тематических путеводителей, указателей и др.).

По функциональному принципу создаются базы данных для учета документов и дел, контроля за наличием и состоянием дел, учета использования, учета источников комплектования и т.д.

Интеграционный принцип предполагает создание единой системы, реализующей функции учета и информационного поиска документов. Такие информационные системы существуют в государственных архивах.

Государственный архив ведет учет всех созданных БД в виде базы данных их описаний (например, "Архивный фонд", "Фондовый каталог субъекта Федерации").

Информационно-поисковые базы данных служат для создания и ведения таких архивных справочников, как архивные описи, сводные номенклатуры дел, каталоги, картотеки, а также для совершенствования процессов информационного поиска в архиве.

Создание автоматизированной информационно-поисковой системы архива является наиболее сложной задачей.

Уважаемые коллеги!

Тема настоящего доклада впервые поднимается на заседаниях Совета. Между тем, создание информационных ресурсов на основе научно-справочного аппарата и электронных копий архивных документов, а также организация доступа к ним - одно из основных направлений деятельности отечественных архивов. Сегодня излишне говорить о том, что архивные информационные ресурсы позволяют расширять границы читальных залов архивов до размеров всемирной паутины. С одной стороны, это обеспечивает сохранность подлинников архивных документов, с другой - делает информацию, заключенную в архивных документах, - достоянием всего человечества.

Нам в архивном сообществе нужно наметить стратегические подходы к практической реализации этих задач.

Задача формирования архивных информационных ресурсов обозначена в государственной программе «Информационное общество 2011-2020 гг.» Этой же теме посвящен отдельный пункт ФЦП «Культура России (2012-2018 годы)».

Общие объемы финансирования, предусмотренные в ФЦП для реализации пункта, составляют 569,07 млн. рублей.

В целях реализации задач информатизации в 2011 г. Росархив разработал и принял Программу информатизации на 2011-2020 гг. Программа стала моделью для многих органов управления архивным делом субъектов Федерации, которые на её основе разработали собственные программы информатизации или добились включения архивных учреждений в региональные программы информатизации.

Среди мероприятий, предусмотренных этими программами, прежде всего, необходимо отметить обеспечение архивов специализированной оцифровывающей техникой, без наличия которой создание информационных ресурсов невозможно.

За последние 3 года материально-техническая база федеральных архивов пополнилась 9 профессиональными сканерами для оцифровки документов на бумажных носителях и двумя сканерами микроформ.

Значительно возросло количество специализированного оцифровывающего оборудования, приобретенного для нужд региональных архивов. По данным компании CNewsAnalytics, за 4 года в архивы поступило 79 профессиональных сканеров, предназначенных для оцифровки архивных документов.

В этой связи хочется отметить возросший уровень технической грамотности специалистов архивов, которые все чаще заказывают высококачественную оригинальную брендовую технику крупнейший производителей, поставляющих свое оборудование таким авторитетным и требовательным фондодержателям, как например Национальные Архивы Ватикана, Испании, Великобритании, Германии, США, Библиотека Конгресса США и другие.

Одновременно с поставкой оборудования и финансированием проектов создания информационных ресурсов по заказу Росархива ВНИИ документоведения и архивного дела провел научно-исследовательскую работу на тему «Изучение опыта оцифровки (сканирования) документов Архивного фонда в архивных учреждениях Российской Федерации». В представленном по итогам выполнения работы отчете обобщен опыт 93 региональных архивов по переводу описей дел и документов, а также подлинников архивных документов в цифровой вид и получен определенный срез информации, характеризующий общую ситуацию в вопросах создания информационных ресурсов.

Вывод, сделанный в исследовании, неутешителен: в Российской Федерации вообще и в архивной сфере в частности отсутствуют единые подходы к процессу оцифровки архивных документов, а объемы создания и качество электронных копий архивных документов оценить невозможно в силу несопоставимости результатов этой деятельности.

Этот вывод стал основанием для разработки в 2011-2012 гг. комплекса нормативно-методических документов, регулирующих процессы оцифровки подлинников архивных документов. В его состав входят 5 нормативных документов, предназначенных для регламентации процессов создания электронных копий архивных документов, а также организации и технологического оснащения хранилищ электронных документов и электронных копий архивных документов.

Разработка подобного комплекса нормативно-методических документов первая в Российской Федерации попытка осмысления на системном уровне проблем, связанных с оцифровкой историко-культурного наследия. Сформулированные в документах рекомендации основаны на изучении мирового опыта реализации проектов оцифровки, анализе зарубежной нормативной базы, в частности, широко известных стандартов и рекомендаций, разработанных и применяемых архивистами Австралии и Новой Зеландии, США, Великобритании, Испании и других стран.

Вместе с тем необходимо признать, что Росархив не может выполнять в Российской Федерации функции единого органа по разработке нормативной документации по оцифровке для всех видов объектов историко-культурного наследия, которые, например, в США выполняет специально созданное для этих целей агентство (FADGI). Но определить общую политику унификации и требования к сканированию документов Архивного фонда - посильная задача, которую мы стараемся решить.

Одно из ключевых направлений создания информационных архивных ресурсов - перевод в электронную форму и представление в электронной среде (в том числе Интернет) системы научно-справочного аппарата (НСА) архивов.

Предполагается, что одной из главных форм представления НСА архивов станет полностью индексированная общеотраслевая государственная информационная система «Центральный фондовый каталог», которая рассматривается как информационная модель Архивного фонда Российской Федерации.

На сегодняшний день в эту автоматизированную систему введено 588 тыс. описаний документов на уровне фондов, что составляет более 60 % от общего объема описаний документов на уровне фонда и около 20 % описаний на уровне дела, хранящихся в федеральных, региональных и муниципальных архивах. Бóльшая часть этой информации доступна в бесплатном доступе в режиме онлайн.

Федеральное архивное агентство будет и в дальнейшем развивать и поддерживать программный комплекс (ПК) «Центральный фондовый каталог» и связанные с ним ПК «Фондовый каталог» и «Архивный фонд». Новые версии этих программ будут создаваться в рамках федерального бюджетного финансирования и бесплатно инсталлироваться в регионах и органах местного самоуправления. А задача наполнения этих программных комплексов и представления внесенной в них информации в сети Интернет - общая для Росархива и всех архивных учреждений страны.

Иное дело - представление на сайтах архивов таких элементов НСА, как списки фондов, реестры описей дел, сами описи, включающие заголовки единиц хранения. Эта задача целиком ложится на плечи конкретных архивов и имеет разные варианты решения.

Так, наиболее распространенной формой представления описей в сети Интернет являются различные виды информационных систем, создаваемых архивами в инициативном порядке и размещаемых ими на собственных сайтах.

К примеру, разделы «Описи» («Каталоги») на своих сайтах имеют 8 федеральных архивов из 16. При этом на сайте РГАЛИ представлены два каталога (Каталог фондов и Каталог печатных изданий); на сайте РГАКФД - три, организованные в соответствии с видами хранимых документов (Каталог фотодокументов, Каталог кинодокументов и Каталог видеодокументов).

Ситуация с размещением описей на сайтах государственных архивов субъектов Российской Федерации выглядит следующим образом. При анализе сайтов выявлено 42 информационных ресурса, на которых представлены описи 55 государственных архивов (27%) 31 субъекта Федерации (36%).

Это несоответствие в цифрах объясняется тем, что в некоторых регионах принято решение о создании объединенных информационных систем или ресурсов, в которых отражается информация о НСА государственных архивов данного региона. Эти информационные ресурсы, как правило, размещаются на сайтах органов управления архивным делом конкретного субъекта Российской Федерации или на сайтах «уполномоченного» для ведения информационного ресурса регионального архива.

В этой связи необходимо отметить, что Росархив не будет диктовать, какую форму представления информации о НСА следует выбрать конкретному региону или архиву. Однако представляется целесообразным стремиться к унифицированному подходу и созданию объединенных информационных систем, функционирующих на единых принципах, понятных как пользователям, так и самим архивистам.

Такой подход успешно реализован в Псковской области, где в рамках одного ресурса представлена информация о научно-справочном аппарате 5 государственных архивов. Можно также назвать раздел «Архивный фонд» Интернет-портала архивной службы Ярославской области, который аккумулирует информацию о НСА областного архива и его 5 филиалов, а также 26 муниципальных архивов области. В объединенной базе данных «Архивы Урала», создаваемой в Свердловской области, объединена информация 7 государственных архивов.

В результате анализа информационных ресурсов, созданных на основе описей и размещенных на сайтах архивов в Интернете, выявлены три наиболее типичные формы представления описей.

    Информация описей представлена в виде полностью индексированных информационно-поисковых систем. В результате информация описей в этих АИС может быть систематизирована либо по архивным шифрам, либо по тематике собрания архива (так, например, информационные ресурсы, представлены на сайтах ГА РФ, ЦГА Самарской области, РГАЭ). Реализация этой формы представления описей является наиболее дорогостоящей, но при этом - максимально эффективной и перспективной. К тому же, она может быть реализована в качестве выгрузки информации из ПК «Архивный фонд», который является в настоящее время отраслевой системой по учету документов Архивного фонда. Поэтому именно к этой форме представления информации описей всем стоит стремиться.

    Описи, представленные в виде электронных текстов в формате doc, rtf, размещенные на сайтах архивов или органов управления архивным делом: например, Государственного архива Тульской области или Агентства по делам архивов Астраханской области.

    Электронные копии (изображения) страниц описей в форматах pdf, jpeg (например, разделы на сайтах РГИА, РГАДА, Государственного архива Калининградской области).

Мотивация выбора формы электронного представления информации описей обусловлена несколькими причинами. Основные - это качество самих «бумажных» описей, наличие специализированных знаний в области информатики у архивистов и объемы финансирования, выделяемые для реализации этой работы.

Вместе с тем в этом вопросе нельзя обойти вниманием тему качества представленной информации, которая тесно связана с процессом усовершенствования описей. Включение в состав электронных ресурсов описей, не прошедших процедуру усовершенствования, резко снижает ценность информационных систем и наносит объективный вред авторитету архивов и архивному сообществу в целом, а представление названий фондов и описей, заголовков единиц хранения, аннотаций, предисловий и других текстовых фрагментов с грамматическими ошибками - к сожалению, распространенное явление для многих информационных ресурсов - просто позорит архивистов!

Разнообразие форм и видов представления однотипных элементов системы НСА и низкое качество представляемой информации не может удовлетворить потребителя. Поэтому представляется целесообразным провести изучение требований пользовательской аудитории к форме представления НСА в Интернете, создать типологию подобных форм и выработать рекомендации по их унификации. Хотя как я уже сказал - первая форма - наилучшая.

При этом очевидно, что какая бы электронная форма представления описей не была избрана конкретным архивом, где бы ни был размещен созданный на основе описей информационный ресурс (в читальном зале, на сайте архива, на сайте органа управления архивным делом субъекта Федерации или на портале «Архивы России») доступ к данной информационной системе должен предоставляться бесплатно .

Отрадно, что такой подход среди архивистов не вызывает никаких возражений, что было подтверждено в ходе анкетирования, которое проводилось при подготовке доклада.

В анкетировании приняли участие 14 федеральных архивов из 16 и 189 архивов из 203 региональных архивов, 78 из 85 субъектов Федерации, что составляет соответственно 92% и 89% от общего числа. В этом отношении анкетирование репрезентативно и отражает реальную ситуацию.

Так, в частности, удалось установить, что в 156 региональных архивах имеются планы перевода архивных описей дел и/или архивных документов в электронный вид. Полностью завершена эта работа в 41 архиве, а в целом по стране эти работы предполагается завершить в основном к 2018 году.

В рамках рассмотрения проблемы перевода в электронный вид НСА особого внимания заслуживает перевод в электронный вид и предоставление доступа к такой форме как каталоги и картотеки.

Следует помнить, что каталоги и картотеки являются объектами творческой деятельности архивов. Многие из них создавались в служебных целях и содержат закрытую или конфиденциальную информацию. Кроме того, их перевод в электронную форму и представление в сети Интернет требуют значительных финансовых затрат, а также серьезной адаптации к специфике представления в информационной среде, без которой невозможно их эффективное использование. Поэтому создание информационных ресурсов на основе каталогов и картотек каждый раз требует индивидуального подхода . А представление созданных ресурсов такого типа в сети Интернет, вероятно, целесообразно организовывать на условиях платного доступа.

Исключением из этого правила должна быть картотека о местах хранения документов по личному составу. Ее перевод в электронный вид, создание на ее основе отраслевой Справочно-информационной базы данных о местах хранения архивных документов по личному составу с последующим размещением в сети Интернет рассматривается Росархивом как решение задачи оптимизации оказания государственных услуг гражданам и организациям в выполнении запросов социально-правового характера, которые, как всем известно, исполняются бесплатно.

Этот информационный ресурс должен создаваться и поддерживаться в актуальном состоянии Справочно-информационным центром федеральных государственных архивов, который начал свою деятельность в июне текущего года.

Наиболее дискуссионными вопросами в теме создания архивных информационных ресурсов представляются вопросы об объемах оцифровки архивных документов, приоритетах отбора документальных комплексов для создания электронных копий архивных документов, о методах создания и типологии информационных ресурсов, формируемых на их основе, о подходах к определению условий доступа к ним.

Начнем рассмотрение этих проблем с вопроса об объемах оцифровки подлинников архивных документов.

Впервые в Российской Федерации объемы перевода архивных документов в электронный вид были определены в государственной программе «Информационное общество 2011-2020 гг.», а затем повторены в проекте Концепции развития архивного дела до 2020 г., широкое обсуждение которой проходило осенью - зимой 2012-2013 гг. Кстати, проект Концепции сейчас находится в аппарате Правительства Российской Федерации. Идет подготовка к его рассмотрению на заседании Правительства Российской Федерации.

Проект Концепции предусматривает «довести долю переведенных в электронную форму архивных фондов, коллекций, документов по актуальной исторической тематике, а также документальных комплексов, содержащих генеалогическую информацию, к которым существует устойчивый и широкий общественный интерес, до 20%, предоставив к ним онлайн-доступ, в том числе на платной основе, в удобных для пользователей форматах». В абсолютных цифрах это должно составить более 100 млн. единиц хранения.

Что сказать в этой связи? Это, конечно, колоссальная цифра, огромный объем, достичь которого можно лишь при условии наличия больших финансовых средств. А это напрямую зависит от успехов социально-экономического развития страны.

Как показали результаты мониторинга оцифровки документов Архивного фонда, который по заказу Росархива проводил ВНИИДАД, в этом вопросе за два последних года произошли существенные подвижки.

Так, можно констатировать значительное увеличение числа архивов, осуществляющих проекты оцифровки.

Такие работы ведутся в 115 архивах 73 субъектов Федерации (ответы были получены из всех 85 субъектов Российской Федерации). Для сравнения: в 2011 г. были получены ответы из 67 субъектов, проекты оцифровки осуществлялись в 93 архивах 57 субъектов Федерации.

Таким образом, за полтора года (с 2011 по 2013) общий объем оцифрованной в государственных архивах субъектов Федерации информации вырос практически в 2,2 раза - с 10 Тб до 22,23 Тб и составил более 400 тыс. дел или почти 9 млн. листов.

Наращивание объемов создания электронных копий приводит архивы к мысли о разработке собственных локальных нормативных актов, регулирующих данные процессы. Так, Программы или перспективные планы создания цифровых копий имеют 112 государственных архивов (60%) субъектов Федерации, а внутренние регламенты, инструкции и правила, регламентирующие этот процесс, - 29.

В качестве примера такой программы можно назвать «Программу информатизации Государственного архивного учреждения Тульской области «Государственный архив» на 2012-2014 гг.», в которой подробно и поэтапно описаны шаги по развитию цифрового контента и созданию фонда пользования, включая обозначение количества создаваемых ежегодно электронных копий документов.

Нужно сказать, что планирование работ по оцифровке не является исключительно российским ноу-хау. В качестве примера можно привести документ Международного Совета архивов, известный как «Стратегический курс на 2008-2018 гг.», в котором обозначена необходимость формирования перспективных планов оцифровки архивных документов. Или широко известный План оцифровки архивных материалов, предназначенных для публичного доступа, разработанный в Национальном архиве США (NARA), опубликованный на сайте этой организации и прошедший процедуру общественного обсуждения.

При этом необходимо подчеркнуть, что, несмотря на активно ведущиеся архивами крупнейших стран проекты оцифровки, в сети Интернет на условиях бесплатного и платного доступа представлено чрезвычайно мало архивных ресурсов. Причин такого положения мы коснемся ниже, здесь лишь отмечу сам этот факт.

Одновременно обратим внимание на то, что одной из ключевых проблем при создании и обсуждении планов оцифровки документов в разных странах была и остается проблема критериев отбора и ранжирования документов для создания электронных копий.

Эта проблема остро стоит и перед нами. Как показывают результаты мониторингов и анкетирования, наиболее очевидными критериями отбора документов для оцифровки являются критерии, связанные с необходимостью обеспечения сохранности подлинников архивных документов.

Архивы стараются в первую очередь оцифровать уникальные и особо ценные или находящиеся в ветхом (плохом физическом) состоянии документы, создавая электронный фонд пользования. Оцифровке подвергаются также наиболее востребованные фонды.

Вместе с тем, четко обозначились две новые тенденции в создании электронных копий архивных документов.

Первая - оцифровка распорядительной документации местных органов власти для формирования информационно-поисковых систем. Подобная работа активно ведется во многих региональных архивах и в архивах муниципального уровня. А созданные информационные ресурсы пользуются большим спросом у органов власти субъектов Федерации и органов местного самоуправления, «работают» на повышение авторитета архивов.

В этой связи представляется целесообразным расширить сложившуюся практику за счет комплексов документов органов власти Российской империи, РСФСР и СССР, т.е. документов, содержащих ключевые публичные акты по истории нашей страны и отложившихся в фондах Сената, Кабинета министров, Совнаркома, Совмина, Политбюро ЦК КПСС, Приказов, Коллегий, Министерств и наркоматов, а на региональном уровне -документов губернских управлений, крайкомов, обкомов партии и исполкомов.

Доступ к информационным системам, содержащим подобную информацию, как представляется, должен быть бесплатным, независимо от того, где будут инсталлированы эти системы - в читальных залах архивов или в сети Интернет. Эту позицию активно поддерживали многие архивы, участвовавшие в анкетировании.

Вторая тенденция - это оцифровка дел по личному составу. Ее появление связано с поиском путей оптимизации выполнения социально-правовых запросов и обеспечением взаимодействия с Пенсионным фондом Российской Федерации.

Плановая оцифровка этого вида документации представляется спорной и может рассматриваться как временная мера, призванная в современных условиях помочь решению вопросов обслуживания социально-правовых запросов. Очевидно, что создаваемые на основе этой документации информационные ресурсы носят служебный характер и далеко не всегда могут быть представлены в режиме публичного доступа.

На формирование планов оцифровки влияют, конечно, состав пользователей архивной информации и их интересы.

В этой связи стоит обратить внимание на результаты обследования пользовательской аудитории, которые опубликовали финские архивисты полтора года назад.

Выводы представлены на диаграмме. Обобщая цифры, можно сказать, что почти 98% наших пользователей - это профессиональные ученые-историки.

Безусловно, эти результаты не могут быть в полном объеме экстраполированы на российскую пользовательскую аудиторию, которая имеет собственную специфику. Здесь нам необходимо самостоятельное изучение аудитории, нужна методика постоянного мониторинга информационной среды и изменений круга пользователей, с тем, чтобы иметь возможность предвидеть изменения в общественном интересе.

Однако выводы финских коллег примечательны, и их необходимо учитывать при рассмотрении круга интересов и типологии потребителей, для которых создаются архивные информационные ресурсы, а также при установлении способов организации и условий доступа к ним.

Можно ли спрогнозировать востребованность документов и исследовательский интерес? Представляется, что с определенной степенью вероятности можно. В качестве механизмов такого прогнозирования целесообразна комбинация достаточно простых методов.

Первый - это регулярный мониторинг общественного интереса и тех дискуссионных тем, которые поднимаются и обсуждаются в обществе. Применение этого метода уже дало свои результаты. Яркий пример его действенности - размещение в сети Интернет ресурса по «проблеме Катыни» («Пакет №1»), к которому было более 1 млн. запросов. Второй пример - все возрастающий интерес пользовательской аудитории к сайту «Документы Советской эпохи» на портале «Архивы России», где в настоящий момент представлены два больших комплекса документов из фонда Политбюро (1919-1932) и фонда И.В. Сталина (1866-1996), и который в ближайшее время планируется дополнить документами ГКО и Коминтерна.

Второй метод - изучение и анализ перспективного календаря памятных дат и событий, причем как мирового и общероссийского масштаба, так и регионального уровня. Этот метод уже активно используется для создания виртуальных выставок электронных копий архивных документов.

Третий - развитие сервисов программных комплексов «Центральный фондовый каталог» и «Фондовый каталог», в которых (при условии их максимально быстрого и качественного заполнения) можно осуществлять подсчет частоты обращений к фондам той или иной тематики.

Четвертый - традиционен и хорошо знаком архивистам. Он основывается на изучении исследовательских научных интересов, отраженных в карточках читателей в читальных залах архивов, или в их регистрационных записях автоматизированных систем типа «Читальный зал».

Пятый - заключается в анализе учета использования каталогов. Причем на сегодняшний день он может быть реализован как в виде учета обращений к традиционным каталогам, так и в виде сервиса учета обращений к записям автоматизированных тематических Баз данных, созданных в архивах.

Шестой - анализ превалирующей научной проблематики на профессиональных научных конференциях (в том числе и краеведческих), в монографических изданиях и публикациях в профессиональной периодике. Определенную помощь в этом вопросе может оказать работа с электронной библиотекой Российского индекса научного цитирования (РИНЦ), Электронной библиотекой диссертаций РГБ, Интеллектуальной системой тематического исследования (ИСТИНА) МГУ и других научных аналитических центров.

Безусловно, использование всех этих методов не даёт стопроцентно гарантированного результата на длительную перспективу, но окажет значительную помощь при выявлении перспективных с точки зрения использования комплексов документов и позволит оперативно реагировать на изменение общественного и профессионального интереса, а также осуществлять среднесрочное планирование создания информационных ресурсов.

Даже не прибегая к проведению специальных обследований пользовательской аудитории, можно назвать несколько тем, которые давно пользуются повышенным спросом у пользователей.

Прежде всего - генеалогия.

Российские архивы накопили богатый опыт создания информационных ресурсов по данной теме. Достаточно назвать Объединенную систему данных о населении «Поколения Пермского края», представленную он-лайн.

Базы данных на основе метрических книг и ревизских сказок созданы в Государственных архивах Республики Башкортостан, Республики Татарстан, Чувашской Республики, Хабаровского края, Сахалинской, Самарской, Пензенской, Ярославской, Еврейской автономной и других областей.

Часть упомянутых баз данных также доступна в режиме он-лайн.

Вместе с тем, необходимо сказать, что создание подобных баз данных - процесс чрезвычайно трудоемкий, длительный и затратный. И тут уместно задаться вопросом об условиях доступа к этим ресурсам.

Представляется, что к подобным уже созданным ресурсам следует организовывать доступ на платной основе . Судя по результатам проведенного анкетирования, эта позиция не вызывает особых возражений у архивного сообщества: ее поддерживают более 60% респондентов.

Анализируя мировой опыт представления информационных ресурсов по генеалогии, следует отметить, что крупнейшие генеалогические общества развитых стран не публикуют в открытом бесплатном доступе свои базы данных, а те ресурсы, которые представлены в сети, не являются собственно генеалогическими. Эти базы данных позволяют осуществлять поиск только по фамилии, имени персоналии и датам жизни. При этом перечень результатов, как правило, не содержит ссылок на архивы и архивные материалы, из которых почерпнута данная информация. Да и построить полноценное генеалогическое древо эти информационные ресурсы возможности не дают.

Существенно отличается от упомянутых ресурсов проект Национального архива Великобритании Find my past («Найди свое прошлое»), реализованный с помощью технологии краудсорсинга, т.е. привлечения «волонтеров» из Общества «друзей Национального архива Великобритании». Этот ресурс позволяет любому жителю Соединенного королевства построить собственное генеалогическое древо, либо в режиме он-лайн присоединиться к процессу обработки электронных копий архивных документов с целью пополнения содержания баз данных.

Аналогичный подход используется сейчас и в архивах Финляндии, где предполагают представить в свободном доступе в сети Интернет оцифрованные копии метрических книг, разработав специальный сервис, позволяющий волонтерам в режиме удаленного доступа описывать прочитанные записи и вносить эту информацию в базу данных архива.

Этот уникальный и единичный опыт, конечно, заслуживает пристального внимания и в перспективе может быть перенесен на отечественную почву.

Другой пример можно привести в связи с деятельностью прибалтийских коллег: Национальных архивов Латвии и Эстонии, которые с помощью европейских грантовых средств создали и ведут генеалогические базы данных «Радураксти» («Родословная» в Латвии) и «Сага» (в Эстонии). Эти ресурсы представляют собой коллекцию оцифрованных церковных книг (по конфессиональному и географическому принципу), материалов переписи населения и прочих номинативных документов. Для получения доступа к базам данных необходимо пройти регистрацию, после которой доступ к образам самих документов будет бесплатным.

Любопытный опыт представления генеалогической информации на условиях абонентской повременной платы имеет Национальный архив Швеции, который предлагает доступ к базе данных оцифрованных документов по цене 50 крон за 3 часа, или годовую подписку за 995 крон (примерно 5000 руб.)

К тематике генеалогии примыкает тема создания информационных ресурсов на основе документов личного происхождения и документации, содержащей персональные данные. Эти документы вызывали и вызывают повышенный интерес у читателей и пользователей.

Активные работы по составлению тематических «персональных» БД проводятся во многих федеральных и региональных архивах России. Например, в Российском государственном военном архиве созданы БД по военным и интернированным в годы Великой Отечественной войны гражданам Италии, Франции, Люксембурга, Швеции, Венгрии, Германии, Польши, Японии; в Филиале Российского государственного архива научно-технической документации в Самаре - несколько аналогичных баз данных, в том числе и база данных «Выдающиеся деятели науки и техники». Летом 2014 г. Федеральное архивное агентство и Российский государственный военно-исторический архив представили интернет-проект «Георгиевские кавалеры Великой войны».

Зарубежные архивы также активно занимаются созданием подобных тематических ресурсов.

Однако создание и представление тематических баз данных в Интернете, а также публикация архивных документов, содержащих сведения личного характера, становятся все более проблематичными в связи с принятым 25 января 2012 г. в Европейском союзе (ЕС) пакетом законодательных актов «О защите персональных данных», который получил название «Право быть забытым». Основное содержание этих документов сводится к тому, что в современном информационном обществе персональная информация приобрела статус своеобразной валюты единого цифрового рынка, и, как любая валюта, она должна быть стабильной, защищенной и заслуживающей доверия. Только если потребитель будет уверен в том, что его персональные данные надежно защищены, он будет доверять компаниям и государственным учреждениям и пользоваться предлагаемыми ими интернет-сервисами.

Формально инициатива ЕС касается защиты персональных данных ныне живущих людей, информация о личной жизни которых не может быть доступна без их ведома как в сети, так и путем публикации давно забытых источников информации (в том числе архивных документов, газет и журналов).

Дело в том, что Интернет обладает своеобразным «эффектом вечности» (eternity effect), при котором «сеть помнит все», что зачастую забывает или хочет забыть человек: прошлые ошибки, компрометирующие письма, фотографии и видео, иными словами - всё, что может негативно сказаться в будущем, создает массу конфликтных ситуаций, которые уже стали реальностью наших дней.

Учитывая это, Комиссия ЕС предложила дать возможность пользователям самостоятельно уничтожать в электронных ресурсах информацию личного происхождения.

Это предложение заставило крупнейшие интернет-компании взяться за реализацию специальных сервисов, которые с мая текущего года уже функционируют в сети, позволяя пользователям самим удалять информацию о себе.

В России пока этот сервис недоступен, но поскольку европейская Конвенция о защите прав человека ратифицирована нашей страной, то решение Европейского союза в перспективе может быть введено и в российское законодательство.

Вероятно, в связи с этим весной этого года Общественная палата Российской Федерации уже предложила законодателям разрешить удалять персональные данные из русскоязычных поисковых систем.

Учитывая вышесказанное, вопрос о создании информационных ресурсов на основе документов личного происхождения или документов, содержащих персональные данные ныне живущих или недавно ушедших людей, становится проблематичным, а размещение их в сети на условиях открытого бесплатного доступа - фактически невозможным.

Беспроигрышной тематикой электронных ресурсов в современном информационном пространстве является тематика так называемых «служебных» баз данных, представляющих собой своеобразные электронные справочники по предметным областям вспомогательных исторических дисциплин. В качестве примера можно привести базу данных по идентификации бумаги и информационно-поисковую систему по геральдике Северной Европы, разработанные и представленные на сайте Национального архива Финляндии; только что созданный австрийскими специалистами сводный портал по филиграням; публикацию известного каталога филиграней Пикара на сайте Штутгартского архива; электронную коллекцию картографических материалов, созданную архивистами Испании, объединенный европейский ресурс по палеографии.

Все эти ресурсы пока находятся в открытом доступе, однако, очевидно, что в перспективе бесплатный доступ к ним будет ограничен.

Еще одна популярная тематика информационных ресурсов -представление архивных фотоматериалов. В качестве наиболее ярких примеров здесь можно привести Федеральный архив Германии, на сайте которого размещен «Цифровой фотоархив Федерального архива» объемом около 200 тысяч фотографий. (Кстати, сайт РГАКФД предоставляет бесплатный доступ к 280 тысячам фотодокументов). Доступ к ресурсу свободный, просмотр бесплатный, есть возможность скопировать изображение в «облегченном» формате. (У нас по этому же принципу действуют сайты РГАКФД и «Победа» на портале «Архивы России»). За возможность получения качественных изображений для публикаций нужно заплатить в зависимости от ее будущего тиража (например, до 3000 экз. - 15 евро за копию).

Аналогичный подход реализован в ресурсе Архива Сил обороны Финляндии, где представлено 160 тысяч оцифрованных цветных (!) фотографий периода советско-финской «Зимней войны» 1939-1940 гг.

Вместе с тем, необходимо отметить, что последние приведенные примеры представления больших объемов электронных копий архивных документов в сети Интернет являются исключениями из общего правила . Как уже говорилось выше, мировая архивная практика создания и представления в сети Интернет информационных ресурсов ограничивается представлением отдельных тематических коллекций, что не может не удивлять при огромных объемах оцифровки архивных документов.

Объяснение этого факта довольно простое: для создания качественного архивного информационного ресурса не достаточно оцифровать документы и представить их в простой программе просмотра изображений. Необходимо создать археографически полное и точное описание подлинника архивного документа и его электронной копии, найти максимально адекватный документу способ визуализации его цифровой копии в электронной среде, а также разработать и реализовать сервисы, воспроизводящие в электронной среде инструментарий исследователя, позволяющие ему максимально эффективно в условиях удаленного доступа использовать электронные копии документов для решения своих профессиональных задач.

Примером таких ресурсов может служить Цифровой архив Сталина, размещенный на сайте Йельского университета в США по соглашению с РГАСПИ. Другой пример - база данных электронных копий архивных документов Electronic Enlightenment («Электронное Просвещение»), которая включает свыше 64 тысяч писем и прочих материалов переписки 6,4 тысячи корреспондентов - выдающихся ученых эпохи Просвещения (Вольтера, Лейбница, Руссо, Дидро, Ньютона, Франклина и др.).

Доступы к обоим ресурсам платные (для граждан России и Беларуси «Архив Сталина» бесплатен), но качество содержания и сервисы, предлагаемые создателями этих ресурсов пользователям, таковы, что удовлетворяют требования самого взыскательного исследователя.

Безусловно, могут быть предложены и иные формы платного ресурса: например, бесплатный просмотр записей о документах в базах данных и платный доступ к самой электронной копии документа; ознакомление с уменьшенными электронными копиями и платный заказ копий высокого качества и т.п. Все эти варианты уже апробированы нашими зарубежными коллегами.

Анализируя эти примеры, следует обратить внимание на несколько обстоятельств, которые зачастую ускользают от внимания отечественных создателей тематических архивных информационных ресурсов. Они заключаются в том, что авторы тематических ресурсов, адресованных конкретной целевой аудитории (например, школам) должны в деталях знать не только архивные документы и музейные артефакты, которые предполагается представить в информационной среде, но и специфику той предметной области, куда они адресуют свой продукт (т.е. в данном примере: состав школьной программы по истории, методику преподавания истории в школе с использованием компьютерных технологий, и даже способы организации экранного пространства, цветовых и шрифтовых решений, адаптированных к восприятию определенной возрастной школьной аудитории и т.п.)

Только учет всех этих, далеких от архивных реалий и будней, вопросов позволит создать действительно востребованные архивные информационные ресурсы, которые будут пользоваться спросом у пользователей.

Перехожу к заключению. Мировая практика и отечественный опыт создания архивных информационных ресурсов, результаты анкетирования позволяют сделать некоторые выводы.

Во-первых, для архивов всех уровней представляется необходимым:

    создание перспективных планов оцифровки архивных документов и проведение постоянного мониторинга их выполнения;

    осуществление работ по оцифровке и переводу НСА в электронный вид на основе унифицированных подходов и требований;

    повышение квалификации архивистов в области информационных технологий вообще и в части изучения опыта создания архивных информационных ресурсов в частности.

При этом необходимо помнить, что при планировании финансового обеспечения работ по оцифровке архивных документов и созданию информационных ресурсов на основе НСА и электронных копий архивных документов необходимо обязательно предусматривать отдельное и весьма существенное финансирование на поддержание и обслуживание этих ресурсов. В противном случае первичные расходы на их создание могут быть затрачены зря.

Во-вторых, самостоятельной проработки требуют вопросы организации платного доступа к архивным информационным ресурсам, включая определение тематической направленности ресурсов, предназначаемых для представления в условиях платного доступа, их функциональности, централизованного или децентрализованного размещения и информационной безопасности, технической и технологической организации платного доступа, механизмов оплаты, принципов ценообразования, возможности осуществления доступа на льготных условиях и т.п.

В ответах архивистов на эти поставленные в анкетах вопросы нет единомыслия, а, следовательно, эти проблемы нуждаются в серьезном дополнительном осмыслении и выработке общих подходов.

В-третьих, представляется целесообразным в течение ближайших лет осуществить комплекс научно-исследовательских работ, темами которых должно стать:

    изучение отечественной пользовательской аудитории архивных информационных ресурсов и выявление ее тематической сегментации;

    разработка методики прогнозирования создания архивных информационных ресурсов;

    изучение опыта представления НСА в электронной среде и разработка унифицированных требований к такому представлению НСА;

    определение критериев отбора документов для оцифровки и последующего создания архивных информационных ресурсов и методов археографического описания и представления электронных копий архивных документов в цифровой среде;

    создание типологии архивных информационных ресурсов и описание основных требований к каждому типу (включая определение функциональности и пользовательских сервисов, а также приемов визуализации исторической, вообще, и архивной, в частности, информации).

Подводя итог, повторю то, что говорил неоднократно: внедрение цифровых технологий и бурное развитие информационного общества кардинально меняет облик профессии историка-архивиста, выдвигая на первый план необходимость решения насущных задач представления архивной информации в электронной среде. Сможем ли мы преодолеть возникающие трудности и найти новые пути развития архивного дела, зависит от того, насколько профессиональное сообщество архивистов способно адекватно реагировать на вызовы цифровой эпохи.

МИНИСТЕРСТВО КУЛЬТУРЫ И ТУРИЗМА УКРАИНЫ

ХАРЬКОВСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ КУЛЬТУРЫ

Кафедра информационных технологий

Электронные архивы: отечественный опыт в оцифровке документов

Выполнила

студентка ф-та ДИД

Голик Ольга Валерьевна

Харьков-2009

Введение

1. Понятие «электронный архив»

2. Проблема сохранения цифрового наследия

3. Проекты по оцифровке документов

Заключение

Перечень ссылок

Введение

Проблема возрастания объёмов документов сегодня актуальна для всех. Все чаще из-за сложности доступа к архивам увеличивается время поиска документов и, как следствие, вынужденных простоев. Наиболее эффективным решением данной проблемы является сканирование документов, организация и создание электронного архива.

Отдельные организации и учреждения культуры, науки, средств массовой информации, промышленности и др., создающие и хранящие значительные массивы цифровых информационных ресурсов и предоставляющие к ним доступ, уже неоднократно сталкивались с необходимостью специальных усилий по сохранению цифровых информационных ресурсов и предоставления долговременного доступа к ним.

Именно электронные архивы стали необходимым условием эффективной работы современной организации.

1. Понятие «электронный архив»

В последнее время, говоря об автоматизации работы архивной службы, часто употребляют термин «электронный архив».

Под электронным архивом понимаются база документов на электронных носителях и программные средства, позволяющие осуществлять поиск необходимой информации.

Основные задачи и проблемы, возникающие при разработке программного обеспечения - хранение и обработка огромных информационных ресурсов, хранение документов в определенных форматах, их реквизитов и удостоверений, разграничение прав и защита доступа к базам. Следовательно, главным условием создания электронных архивов является существование документа в электронном виде.

Архивы предприятий накапливаются годами, некоторые - десятилетиями. Естественно, за все это время собраны колоссальные объемы архивных документов. В целях оперативного учета и розыска документов создаются системы научно-справочного аппарата (НСА). Организация учета дел и документов представляет собой создание базы данных с информацией о составе и содержании фонда. В традиционной ручной организации системы НСА существует целый ряд перекрестных архивных справочников, играющих первостепенную роль в поиске.

В 1996 году была утверждена Программа информатизации архивного дела России (1997-2000), в соответствии с которой планировалось создать правовые, нормативные и методические документы, регулирующие вопросы применения автоматизированных технологий, статуса машиночитаемых документов, стандарты и нормативы описания документов, типовые решения (автоматизированные архивные технологии, общеотраслевые базы данных) и обеспечение их совместимости и преемственности.

В настоящее время в архивном деле процесс внедрения автоматизированных архивных технологий (ААТ) развивается по двум направлениям:

1. Централизованная разработка и внедрение типовых баз данных по основным направлениям работы государственных архивов (от комплектования до использования). Эта работа осуществляется под руководством Росархива согласно программе информатизации отрасли, планов НИР и техническими заданиями на конкретные комплексы баз данных. Главной организацией и разработчиком баз данных является Всероссийский научно-исследовательский институт документоведения и архивного дела (ВНИИДАД). Цель работы - развитие перспективных архивных технологий компьютерной поддержки основных функций архивных учреждений.

2. "Стихийная" компьютеризация, осуществляемая самими архивами и находящая свое выражение в разработке баз данных, исходя из нужд архивов, требований потребителей информации, программ компьютеризации, принятых архивом, экономических и кадровых ресурсов, а также других факторов. Перспективные программы компьютеризации архива разработаны в Московском городском объединении архивов (МГОА), Российском государственном архиве научно-технической документации (РГАНТД), Государственном архиве Российской Федерации (ГАРФ), Российском государственном военном архиве (РГВА) и др.

Основные преимущества электронных архивов:

· связь электронного документа с бумажным источником, которая позволяет в подавляющем большинстве случаев обойтись без доступа к бумажному документу, а в случае необходимости работы с бумажным документом быстро его найти;

· реализация концепции ILM (Information lifecycle management), позволяющей переносить информацию из оперативного хранения в архивное с соответствующей сменой носителя информации для удешевления хранения и повышения надежности хранения;

· распределение прав и процедур доступа согласно корпоративным регламентам.

Электронные архивы позволяют:

· снизить затраты на хранение: большая часть справочных запросов может быть удовлетворена с помощью электронных образов документов, благодаря чему снижаются требования к помещениям, персоналу и другим ресурсам для работы архива;

· значительно сократить потери и повреждения архивных документов за счёт уменьшения потребности в подлинниках;

· снизить объём копировальных работ благодаря доступу к электронным образам документов;

· значительно упростить перенос документов из оперативного хранения в архивное;

· контролировать цепочку запросов и получения информации, предотвращая несанкционированный доступ и копирование документов.

2. Проблема сохранения цифрового наследия

Задача сохранения цифрового наследия не ставится ни в федеральной государственной программе «Электронная Россия (2002-2010 годы)», ни в программе «Развитие единой образовательной информационной среды (2001-2005 годы)», ни в федеральной программе «Культура России (2001 – 2005)».

В России нет единого государственного органа, занимающегося вопросами сохранения цифрового культурного и научного наследия, хотя эта проблема широко обсуждается в последние годы в рамках профессиональных сообществ.

Учет и инвентаризация цифровых информационных ресурсов, лежащая в основе деятельности по сохранению цифрового наследия, является предметом целого ряда российских и международных проектов.

В 1999 году на рынке появилось ПО, разработанное ВНИИДАД. Ведущему институту отрасли эта задача была поставлена в рамках правительственной программы «Электронная Россия». Естественно, такое ПО ориентировано на государственные, муниципальные архивы - учреждения государственной архивной службы. На взгляд автора, эта система для архива организации не очень подходит.

Корпорация «Электронный архив» известна своими решениями по созданию электронных архивов документов и переводу «бумажных» архивов в электронный вид с применением технологии поточного сканирования.

Отмечен опыт работы Российского государственного архива научно-технической документации (РГАНТД) по созданию полнотекстовых страховых копий на оптическом диске, выбору формата архивной информации на оптическом диске, принципам построения системы поиска в массиве оцифрованных документов.

Практика работы РГАНТД, длительный опыт эксплуатации автоматизированных архивных систем и технологий, создание полнотекстовых баз данных, свидетельствуют о том, что действующие в архиве основные подходы по вопросам взаимодействия и влияния задач использования на структуру НСА обеспечивают быстрое и эффективное обеспечение доступа пользователей к документной информации архива.

Огромная часть возникающей в современном обществе информации сосредотачивается в архивах, образуя социальный информационный потенциал.

При колоссальном потенциале ретроспективной информации традиционные методы хранения и распространения архивной информации теряют свою эффективность.

Кардинальное решение проблемы заключается в применение современных информационных технологий, в частности, технологий оцифровки различного вида документов.

3. Проекты по оцифровке документов

Потребности общества в ретроспективной информации имеют межгосударственное значение, так как в архивах России хранится информация интересная для целого ряда стран. Например, в фондах РГАНТД представлены материалы международного сотрудничества в области освоения космического пространства и космической техники, в частности по программе “ЭПАС”.

ЭПАС [от Э (кспериментальный) П (олёт) «А (поллон)» - «С (оюз)»], совместный экспериментальный полет американского и советского космических кораблей (КК) типа «Аполлон» и «Союз». Программа ЭПАС была утверждена Соглашением между СССР и США о сотрудничестве в исследовании и использовании космического пространства в мирных целях (24 мая 1972).

Определенный опыт получен в РГАНТД (до 1996 г. Российский научно-исследовательский центр космической документации). Представляют интерес два проекта:

· электронный архив “Вирт Йозеф - канцлер Германии”,

· электронный архив “Фотографии Ю.А. Гагарина”.

В 1992 г. РГАНТД совместно с Российским центром хранения историко-документальных коллекций осуществил проект оцифровки документов из фонда “Вирт Йозеф - государственный канцлер Германии”.

Особенности этого проекта:

1. Разноформатность документов (от ресторанных счетов и бумажных квитанций до газетных полос и плакатов).

2. Тексты машинописные и рукописные.

3. Бумага разных оттенков от серого до желтого; папки с делами при сканировании не расшивались, кроме дел, в которых подшивка затронула текст.

Всего было отсканировано 14362 документа, в том числе 455 фотографий, рисунков и гравюр.

Для сканирования текстовых документов использовались планшетные сканеры DataCopy-830 и Relisys с разрешением 200-400 точек. Для сканирования полутоновых изображений фотодокументов и документов большого формата использовался проекционный сканер DataCopy-920, выполненный в виде камеры на штативе, имеющий большую разрешающую способность и позволяющий сканировать документы в формате серой шкалы, что обеспечивает последующее воспроизведение без потери качества. Фотографии сканировались с различным (в зависимости от размера и содержания) разрешением от 200 до 1000 точек.

В 1996 г. была разработана системы хранения и поиска факсимильных копий фотодокументов Ю.А. Гагарина на оптических дисках с включением фрагментов соответствующих текстовых документов.

Было отсканировано 850 фотографий (цветных и серно-белых). Сканирование проводилось с “контролек”, т.е. фотоотпечатков небольших размеров, применяемых в отделе использования в качестве элемента НСА. В качестве носителя был выбран оптический диск WORM фирмы “Plasman” (как и в первом проекте), в 1997 г. массив оцифрованных фотографий был записан на CD-R.

В качестве инструмента для разработки программного обеспечения баз данных была использована программная система ISIS версии 3.2 разработанная UNESCO и язык программирования Pascal ISIS.

В результате реализации рассмотренных проектов были разработаны технологии создания полнотекстовых страховых копий на оптическом диске, решены вопросы выбора формата записи архивной информации на оптическом диске, разработаны принципы построения системы поиска в массиве оцифрованных документов.

Автоматизированная информационно-поисковая система в проектах содержит следующие блоки:

1. База данных описаний отсканированных документов, которая являлась поисковым аппаратом.

2. Массив цифровых копий документов, записанный на оптический диск.

Связь между базой данных и массивом отсканированных документов организовывалась специальными программно-технологическими средствами:

· программа воспроизведения оцифрованных документов или их частей (фрагментов);

· имена оцифрованных документов (как часть рабочего листа ввода);

· программа организации доступа к оцифрованным документам;

· файл информации для программы организации доступа к оцифрованным документам.


Заключение

В заключение можно отметить, что ведение архива, с одной стороны, важно для деятельности компании, но, с другой стороны, требует значительных ресурсов, которые не приносят немедленной отдачи. Современный уровень развития информационных технологий позволяет реализовать электронные архивы. По сравнению с традиционным архивом электронный архив позволяет минимизировать затраты времени на управление архивом, снизить потребность в доступе к бумажным документам за счёт предоставления доступа к электронным образам документов, а также значительно снизить требования к помещению для архива, персоналу и другим ресурсам, используемым для его работы. При этом электронный архив не заменяет обычный, но дополняет его и резко снижает потребность в доступе к бумажным оригиналам документов. Кроме того, электронный архив позволяет организовать архивное хранение материалов, которые не существуют в бумажном виде.


Перечень ссылок

1. Залаев, Г.З. Современные принципы хранения и распространения архивной информации [Электронный ресурс]. - Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec2b/Doc12.HTML

2. Зверева, Н. Автоматизация архивной службы предприятия [Электронный ресурс]. - Режим доступа:

http://www.e-rus.ru/site.shtml?id=7&n_id=3631

3. Левчук, Л.И. Ткаченко, Н.А. Ходаковский, Н.И. Проблемы внедрения автоматизированных архивных технологий [Электронный ресурс]. - Режим доступа: http://www.artinfo.ru/eva/EVA2000M/eva-papers/200007/Khodakovsky-R.html

4. Медведева, Г.А. Из опыта РГАНТД по вопросам влияния использования на структуру НСА: конференция по вопросам совершенствования НСА (ВНИИДАД, март 2003 г.) [Электронный ресурс]. - Режим доступа: http://rgantd.ru/n_tr.php?link=tr_nsa_struct

5. Электронные архивы. Создание электронных архивов документов и организация хранилищ корпоративной информации [Электронный ресурс]. - Режим доступа: http://www.korusecm.ru/solutions/elib/

13 июля 2009 г. 11:38

Игорь Николаевич Киселев, заместитель начальника отдела обеспечения сохранности, государственного учета и автоматизированных архивных технологий Росархива.

Доклад был представлен на заседании Совета по архивному делу при Федеральном архивном агентстве по теме "Информационные технологии в архивном деле: актуальные проблемы и пути их решения" 4 июня 2008 года.

В современных условиях нет необходимости говорить о месте и значимости автоматизированных информационных технологий для архивного дела. Отошли в прошлое дискуссии о направлениях и допустимых границах использования компьютеров, на повестке дня - обсуждение приоритетов в этой сфере, особенностей конкретных технологических решений, наиболее эффективных способах их использования.

Информационные технологии сегодня применяются во всех без исключения направлениях архивной деятельности, хотя и в разной степени. Наиболее полно и результативно технологии используются в сфере научно-справочного аппарата и государственного учета, началось продвижение в области комплектования. Определенные шаги сделаны также в той части сферы обеспечения сохранности архивных документов, которая связана с информацией о состоянии документов. Что касается использования, то сделано и делается немало, но впереди - необозримое поле деятельности.

Никакая информатизация невозможна без технической инфраструктуры. Согласно отчетным данным, оснащенность отрасли компьютерами последних поколений заметно увеличилась. В федеральных архивах имеется 845 таких компьютеров, в государственных архивах регионов - 5 068, в муниципальных архивах - 3 652 компьютера. Много это или мало? Ответ может дать отчетный показатель, недавно введенный Росархивом, согласно которому по состоянию на 01.01.2008 г. на один современный компьютер приходится от полутора до трех штатных сотрудников архива, то есть оснащенность техникой остается недостаточной.

Наблюдается значительный рост локальных вычислительных сетей: в федеральных архивах развернуты 10 ЛВС, 187 - в госархивах субъектов Российской Федерации. В муниципальных архивах имеется 25 сетей, однако очевидно, что потребность этих архивов в ЛВС невелика.

Для четкого «разграничения полномочий» в сфере информационных технологий между центром и регионами, для устранения дублирования работ сразу обозначим функции, которые Росархив принял на себя:

● разработка и предоставление архивным учреждениям отрасли унифицированного общеотраслевого программного обеспечения;

● ведение общеотраслевых БД и представление в сети Интернет объединенных архивных информационных ресурсов;

● содействие льготному приобретению стандартного программного обеспечения.

Приведем иллюстрацию к последнему пункту. Как известно, благодаря усилиям Росархива федеральные архивы, госархивы субъектов РФ и муниципальные архивы включены в Программу академического лицензирования компании Microsoft. В прошлом году только федеральные архивы закупили 439 лицензий и лицензионных продуктов этой компании на общую сумму 672,6 тыс. рублей. При рыночной стоимости этих лицензий и продуктов в 2974,2 тыс. руб. реальная экономия составила 2301,6 тыс. руб. или 77%.

Для оценки пройденного пути в архивной информатизации и определения дальнейших шагов сопоставим ее цели и имеющиеся результаты, а затем сформулируем ближайшие задачи. Подчеркнем, что речь идет об усредненных тенденциях в общероссийском масштабе.

С самого начала процесса автоматизации архивной работы в центре внимания Росархива находилось построение автоматизированной системы централизованного государственного учета архивных документов. Основных причин для этого было две. Первая: в первой половине 90-х годов в ряде региональных государственных архивов появились разные компьютерные программы по учету со своим форматами данных. Было совершенно ясно, что если не ввести этот процесс в единое русло, то мы никогда не построим общую систему, поскольку главное условие ее существования - унифицированные структура и форматы описания архивных документов. Вторая причина состоит в том, что именно в процессе государственного учета накапливается информация, необходимая для всех остальных направлений архивной деятельности - прежде всего НСА, а также обеспечения сохранности, комплектования и использования. Так возник программный комплекс (ПК) «Архивный фонд», выполняющий функции базового программного обеспечения в системе госучета.

Важно подчеркнуть, что система изначально планировалась не как точная копия «карточной» системы централизованного госучета, а с более широкими информационными и функциональными возможностями.

Стратегическими целями автоматизированной системы централизованного госучета были определены следующие:

● полный охват архивов всех уровней и органов управления архивным делом;

● учет всех видов документации;

● полный учет архивных документов на уровнях фонд - опись - единица хранения;

● автоматизированное формирование архивных учетных документов.

По состоянию на 01.01.2008 г. в системе работают все 14 федеральных архивов с фондовой организацией документов. Число региональных государственных архивов, включенных в систему, достигло 211, т.е. 91% (оставшиеся 19 госархивов, как предполагается, войдут в систему в течение одного - двух лет); количество участвующих в работе системы муниципальных архивов составило 1246 (51,9%), эти архивы демонстрируют стабильно высокие темпы прироста, что позволяет прогнозировать их полное вхождение в систему в ближайшие годы; ПК «Фондовый каталог» ведут 53 субъекта РФ. Система в целом включает 1452 архива в 82 субъектах Федерации.

Традиционно основным показателем с точки зрения полноты государственного учета является количество описаний фондов, введенных в систему. По федеральным архивам этот показатель на 01.01.2008 г. составил 55,4 тыс. фондов, или 81,6% от паспортных данных. Государственные архивы субъектов РФ ввели в систему 398,3 тыс. описаний фондов (84,3% от паспорта). Вклад муниципальных архивов составил 166,3 тыс. описаний (48,5%). В целом введено 620,0 тыс. описаний, или 70,2% от всех фондов, хранящихся в государственных и муниципальных архивах страны.

Увеличение информационного потенциала системы госучета предусматривает ввод в БД «Архивный фонд» сведений об описях (как частей фонда). В целом по отрасли в архивах введены данные о 913,2 тыс. описей, что составляет 58% от их количества по паспорту. Наилучших результатов здесь достигли государственные архивы регионов - 67,1% или 627,8 тыс. описаний. Ниже средних по отрасли показатели у федеральных (45,3%) и муниципальных архивов (44,3%). Значимость информации об описях заключается прежде всего в том, что она является необходимым элементом для точного подсчета объемных показателей госучета в архиве; во-вторых, эту ступень нельзя миновать при вводе информации о единицах хранения. Наиболее же важное обстоятельство - именно на этом уровне фиксируется с достаточной определенностью наличие в архивных документах сведений по личному составу, относящихся к конкретному фондообразователю.

В развитии системы, наряду с ее количественным ростом, в настоящее время на первый план выходит задача наращивания ее информационной полноты. Имеется в виду ввод информации по всем полям, обязательным к заполнению в соответствии с «Временным порядком автоматизированного государственного учета документов Архивного фонда Российской Федерации» (этот Порядок скоро перестанет быть «временным», став частью Порядка государственного учета документов Архивного фонда Российской Федерации, разрабатываемого Росархивом взамен существующего Регламента государственного учета документов АФ РФ).

В заполнении БД «Архивный фонд» есть свои лидеры - регионы, в которых государственные и муниципальные архивы ввели основную информацию обо всех фондах и описях: Удмуртская Республика, Алтайский край, Краснодарский край, Калининградская, Нижегородская, Свердловская, Тюменская и Челябинская области, Ямало-Ненецкий автономный округ. В 17 субъектах РФ 100% таких данных введены только госархивами. Наконец, в 4-х регионах только муниципальные архивы ввели все основные сведения на уровнях фонда и описи. Пять федеральных архивов (ГА РФ, РГАДА, РГАЛИ, РГАНТД, РГАСПИ) ввели основную информацию по всем фондам; РГАНИ, филиал РГАНТД и РГВИА ввели более 96% описаний фондов; процент введенной информации об описях в перечисленных федеральных архивах - от 85 до 100.

Вся приведенная статистика означает, что во многих архивов закончился или заканчивается важный и трудный этап длительной монотонной работы по вводу данных без немедленной отдачи, и наступило время пользоваться результатами работы - вести полноценный автоматизированный учет, получать сводные данные, автоматически формировать архивные учетные документы.

Процесс накопления информации в электронном формате об архивных документах подошел к моменту, когда на повестку дня выдвигается задача массового ввода в систему сведений на уровне единицы хранения (единицы учета). Эта работа в ряде архивов ведется. Государственные архивы регионов ввели в БД «Архивный фонд» 1 417,5 тыс. заголовков дел, муниципальные архивы - 1 291,9 тыс. заголовков. Эти цифры превышают общее количество записей на уровне фонда, однако они составляют соответственно лишь 1,0 и 2,3 процента от объема хранящихся дел. По федеральным же архивам в системе содержатся только 0,2% заголовков дел.

Задача ввода этих данных в архивах решается двумя путями. Архивы с небольшими объемами документов самостоятельно осуществляют ручной ввод. В других случаях используется так называемая массовая (или поточная) оцифровка описей - выбранная на конкурсной основе фирма вводит структурированные описания дел в стандартном формате (например, в формате MS Access) в базу данных, из которой информация легко может быть конвертирована в БД «Архивный фонд». Так, в ГА РФ и РГАЭ создан массив объемом около 2,5 млн. описаний единиц хранения, который может быть использован как самостоятельный информационный ресурс, а также как сведения для включения в БД «Архивный фонд».

Сформулированная выше цель по охвату автоматизированным учетом всех видов документации будет полностью достигнута в рамках 4-й версии ПК «Архивный фонд», разработка которой в настоящее время завершается. В новой версии программы добавляется возможность учета кино-, фоно-, видеодокументов, а также документов на электронных носителях. Можно будет распечатывать опись и, заверив ее надлежащим образом, получать полноценный традиционный документ госучета. Более полной автоматизации учета архивных документов будет способствовать и функция пересчета объемных показателей при движении документов. В программе будут также автоматически создаваться паспорт архива и практически все учетные формы, являющиеся приложениями к новым «Правилам организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации...».

Новая версия ПК «Архивный фонд» реализуется на современной программной платформе со своими внутренними форматами представления данных, что влечет за собой необходимость соответствующей модернизации ПО «Фондовый каталог» и «Центральный фондовый каталог». Разработка этих программ запланирована на 2009 год. Предполагается ежегодная передача из БД «Архивный фонд» в эти базы данных не только информации на уровне фонда, как это происходило в «карточной» системе централизованного госучета, но и сведений на уровнях описи и единицы хранения. Передача такого состава информации об архивных документах диктуется не столько потребностями госучета, сколько необходимостью формирования межархивного НСА регионального и отраслевого масштаба.

Продолжается работа по автоматизации процессов комплектования архивов. Прошла опытную эксплуатацию первая пробная версия ПО «Источники комплектования», главная цель которой (как и 1-й версии ПК «Архивный фонд») - сбор замечаний и предложений для уточнения структуры и функций программы. Сейчас ведется анализ присланных предложений и формируются технические требования к промышленной версии программного обеспечения.

Важнейшим шагом в деле обеспечения сохранности станет реализуемая в 4-й версии «Архивного фонда» возможность создания и хранения фонда пользования. В ней (как и в 3-ей версии) предусматривается ввод описаний на уровне отдельного документа, но при этом к описанию можно будет присоединять файлы любых форматов. Таким образом, можно будет сканировать и предоставлять пользователям не только тексты документов, но и их изображения, цифровые копии фотоотпечатков и негативов, фоно-, кино- и видеозаписей.

В сфере НСА автоматизированные архивные технологии оказывают сильное влияние на способы создания и ведения научно-справочного аппарата к архивным документам, а также принципиально изменяют характер доступа пользователя к НСА и способы поиска информации.

В действующей версии ПК «Архивный фонд» архивист имеет возможность создавать электронный аналог описи, автоматически формировать структурированные тексты путеводителей по фондам архива с необходимыми видами указателей к путеводителю, краткие справочники, различного рода тематические перечни фондов и дел, вести любого вида каталоги. В 4-й версии программы можно будет также создать реестр описей как отдельный справочник. «Фондовый каталог» позволяет автоматически формировать тексты межархивных справочников, вести каталоги. Главное в указанных в этих программах заключается не столько в подготовке печатных изданий, сколько в их способности непосредственно выполнять функции электронного НСА.

Все более значительную роль информационные интернет-технологии играют в сфере использования архивных документов. Если говорить о внутриархивном сегменте использования, то, как представляется, на общеотраслевом уровне логично разработать и предоставить архивам типовое решение по автоматизации работы читального зала. Росархив приступил к этой работе. Близка к завершению разработка действующей модели ПО под условным названием «Контроль и учет движения дел и документов в архиве», в функции которого входит учет пользователей читального зала, автоматизированное формирование требований (с помощью электронных описей), передача требований по локальной сети в хранилище и т.д.. Системой фиксируется, где фактически находится дело в каждый момент времени, формируются статистические отчеты по использованию архивных документов, выполняются некоторые другие функции. Ясно, что система должна сопрягаться с информацией, накопленной в БД «Архивный фонд». ПО ориентировано на крупные архивы, в дальнейшем будет решаться вопрос о подготовке его упрощенного варианта для муниципальных архивов.

Как известно, в использовании архивных документов есть функции факультативные и строго обязательные. Можно не подготовить виртуальную выставку, не опубликовать отчет о мероприятии, но нельзя проигнорировать миллионы социально-правовых запросов. Современные информационные технологии могут, по крайней мере, сократить сроки их исполнения, ощутимо компенсировать хроническую нехватку архивных кадров на этом направлении. Росархив в течение последних лет не прекращает попыток получить необходимые финансовые средства для создания и ведения единой базы данных по местам хранения документов по личному составу (сначала - по федеральным архивам, затем по архивам отрасли, архивам организаций). В настоящее время появились перспективы получения государственной поддержки этого нужного и для архивов и для граждан проекта.

● Определены конкретные методики построения и функции специализированных архивных технологий.

● Определены составы и структуры формируемых информационных массивов баз данных.

● Внедрено или находится в процессе разработки общеотраслевое программное обеспечение по основным направлениям архивной деятельности.

● Введены в базы данных и практически используются значительные архивные информационные ресурсы.

Результаты свидетельствуют, в частности, о том, что общими усилиями создана основа для построения интегрированной информационной системы государственного (муниципального) архива, и эта задача, сформулированная как стратегическая более 10 лет назад, переходит теперь в практическую плоскость.

Необходимость такой интегрированной информационной системы архива очевидна, ибо она позволит оптимизировать информационные массивы и потоки, устранить дублирование функций и данных при информатизации различных направлений архивной деятельности.

Модель (логическая схема) этой системы, как представляется, состоит из ряда связанных между собой информационных и функциональных блоков. Информационным ядром ее является хранилище описаний документов на всех уровнях, а также массив оцифрованных образов документов (фонд пользования), «прикрепленных» к описаниям документов. Блок «Учет» формирует и хранит паспорта, результаты проверок наличия, другие архивные учетные документы. В блоке «Сохранность» регулярно формируются и хранятся сведения о состоянии документов, соответствующие отчетные формы, паспорта архивохранилищ, и т.п. Блок «НСА» ответствен за формирование справочников, ведение каталогов и указателей. В блоке «Комплектование» сосредоточены данные об организациях-источниках комплектования архива и о хранящихся в них документах, о работе с источниками комплектования, формируется статистическая отчетность. Из этого же блока информация о принятых документах после обработки поступает в основное хранилище. В блоке «Читальный зал» сконцентрирована информация о пользователях, о выдаче дел, формируются сведения о степени востребованности архивных документов, и др. Частью системы является блок «Запросы и услуги» с очевидными функциями.

Во внедрении автоматизированных архивных технологий остро стоит проблема нехватки квалифицированных кадров. В этой связи хотелось бы отметить, что для отдельных видов информационных работ архиву не обязательно содержать в штате высококвалифицированных программистов. Сейчас в стране активно развивается рынок информационных услуг, в том числе и для архивов. Появились коммерческие организации, готовые создавать архивное программное обеспечение, проводить массовую оцифровку документов и описей, разрабатывать архивные сайты, обслуживать технику и стандартное ПО. Практика федеральных и региональных архивов свидетельствует о том, что услуги таких фирм - зачастую более реалистичный путь решения задачи, нежели попытки выполнить работу собственными силами.

Важной и далеко еще не полностью освоенной и оцененной архивистами сферой применения информационных технологий в архивном деле является сеть Интернет. Перед архивными сайтами открыты огромные возможности, которые неуклонно расширяются вместе с технологическим прогрессом.

Основные цели присутствия архивов в Интернете в самой сжатой форме выглядят следующим образом:

● предоставление общей справочной информации об архивных документах и архивах;

● постоянное информирование об архивной деятельности;

● содействие поиску архивных документов и получению архивных услуг;

● взаимное информирование архивистов и обсуждение профессиональных архивных вопросов;

● популяризация архивного дела, формирование позитивного имиджа архивов у граждан и общества.

За последние годы на архивных сайтах размещен огромный и разнообразный материал, в целом соответствующий сформулированным целям, растет интерактивное взаимодействие архивов с пользователями сайтов. В этой статье нет возможности для детального анализа всех достоинств, недостатков, особенностей архивных сайтов по каждому из перечисленных направлений. Однако для обсуждения этой проблематики недавно появилась своя площадка - научно-практический семинар-совещание «Российские архивные сайты: опыт, проблемы, перспективы развития» (май 2007 г., Чебоксары; май 2008 г., Московская область).

В соответствии с рекомендациями первого из этих семинаров проведен мониторинг сайтов федеральных архивов, органов управления архивным делом и государственных архивов субъектов РФ (экспертную оценку по 53-м критериям осуществляла Е.В.Боброва, контент-девелопер портала «Архивы России»). Первые пять мест заняли сайты ГА Пермской области, Главархив Москвы, Архивная службы Республики Татарстан, ГАС Удмуртской Республики, РГАНТД и «Архивы Карелии» (поделили пятое место). В итоговой таблице (будет опубликована на портале «Архивы России» вместе с методикой мониторинга) обращает на себя внимание огромный разброс в качественном уровне архивных сайтов - первые пять позиций занимают сайты, получившие от 89 до 115 баллов, в то время как 28 сайтов (из 66) набрали менее 30 баллов.

Процесс архивного сайтостроения только разворачивается, причем в трудных кадровых и финансовых условиях. В настоящее время представительство отрасли в сети выглядит так: отраслевой портал «Архивы России »; 6 сайтов федеральных архивов; всего лишь 34 сайта органов управления архивным делом и 26 сайтов региональных государственных архивов. Здесь учтены только самостоятельные сайты, количество кратких страничек на сайтах вышестоящих и сторонних организаций как минимум удвоило бы приведенные цифры. Однако все эти странички никак нельзя признать сколько-нибудь полноценным архивным представительством в Сети, они содержат лишь краткую справочную информацию, дополненную иногда текстом Положения об архиве или органе управления, в редких случаях также общим перечнем архивных услуг.

Можно ожидать, что в ближайшее время число архивных сайтов существенно возрастет. Стимулом должна послужить одобренная Распоряжением Правительства РФ от 6 мая 2008 г. № 632-р «Концепция формирования в Российской Федерации электронного правительства до 2010 г.». В документе под термином «электронным правительство» подразумевается «новая форма организации деятельности органов государственной власти, обеспечивающая за счет широкого применения информационно-коммуникационных технологий качественно новый уровень оперативности и удобства получения организациями и гражданами государственных услуг и информации о результатах деятельности государственных органов». Среди приоритетов Концепции - создание всеми органами власти самостоятельных сайтов и обеспечение через них доступ к ведомственным информационным системам. Применительно к архивной отрасли речь пойдет, несомненно, о широком открытом доступе к научно-справочному аппарату.

В этом направлении архивы ведут постоянную работу. На портале «Архивы России» размещены 115 справочников, на других архивных сайтах представлены еще 196 справочников различных типов и видов. Эти цифры, конечно, впечатляют, доступность НСА для пользователя расширяется - по сравнению с традиционными формами представления справочников. Однако в современных условиях этого результата уже недостаточно. Проблема в том, что архивные справочники размещены на 42-х сайтах, то есть пользователь должен разыскать каждый сайт, на нем - НСА, и затем начать поиск документов. В то же время современные интернет-технологии позволяют создать единый ресурс (физически находящийся на одном или на нескольких связанных сайтах) в унифицированном формате, с едиными правилами представления и поиска информации. Прототипом такого ресурса является база данных «Путеводители по российским архивам », размещенная на портале «Архивы России». Она содержит структурированную информацию 60 путеводителей по федеральным и региональным архивам общим объемом в 103 тыс. описаний фондов. Еще одним чрезвычайно важным и перспективным технологическим свойством этого ресурса является то, что информационное наполнение этой базы данных доступно для поисковых машин Интернета. Отсюда и высокая востребованность ресурса пользователями - в среднем 1400 посещений в сутки.

В применении информационных технологий имеются две составляющие - создание информационных ресурсов и способы работы с этими ресурсами. Можно констатировать, что по обеим составляющим архивами пройдены критические точки в наращивании информационного потенциала, приобретения опыта, разработки специальных технологий, и наступило время решать задачи расширения и повышения эффективности использования накопленных ресурсов, разностороннего применения наработанных технологий.

Использование информационных технологий в архивном деле становится все более разнообразным, они постепенно проникают во все направления архивных работ, превращаясь из экзотики в привычную, неотъемлемую и все менее выделяющуюся часть архивной повседневности. И в этом третий и, быть может, самый воодушевляющий итог современного этапа внедрения в практику автоматизированных архивных технологий.



Просмотров