Сохранение или потеря цифровых новостей?

Еще совсем недавно печатные газеты подшивали в огромные папки, складывали в металлические ящики и хранили в подвалах редакций. Газеты собирали пыль и были пожароопасными, однако других способов хранить их было мало. В цифровую эру методы архивирования газет могли бы стать более изощренными, однако они до сих пор несовершенны. Как показывает новое исследование, важные онлайн-данные теряются.

Ключевые вопросы о том, как хранить и архивировать цифровой контент начали ставить лишь недавно, хотя хранить газеты в цифровом формате начали несколько десятилетий назад.

Кэтлин Хансен (Kathleen A. Hansen) и Нора Пол (Nora Paul) из Университета Миннесоты (University of Minnesota) исследовали 10 медиа и их процессы архивации. Девять из них первично были традиционными газетами, и одно издание - от начала только онлайновым. Их отчет «Газетные архивы свидетельствуют о главных пробелах цифровой эры» («Newspaper archives reveal major gaps in digital age») свидетельствует о ряде проблем с тем, как онлайн-документация хранится с тех пор, как в 1990-х была начата цифровая архивация.

Традиционный метод хранения газетных архивов в папках, библиографических указателях или на микрофильмах был неудовлетворительным. Ведь контент, хранящийся таким образом, в конце концов теряет качество, его также могут потерять или перепутать, особенно когда медиа закрываются, сливаются или переходят из рук в руки.

Однако, большое цифровое хранилище кажется таким же проблематичным: ни традиционные издания, ни те, что сразу возникли как цифровые и публикуют новости дня в мире, не имеют понятных стратегий, как архивировать и хранить свои онлайн-ресурсы, свидетельствует исследование ученых из Университета Миннесоты. Становится известно о потере данных, например, 34-частная серия журналистских расследований попала в финал Пулитцеровской премии. «Цифровая информация сама по себе имеет разнообразные преимущества, кроме того, что когда она теряется, то теряется по-настоящему», - говорит Джейсон Скотт (Jason Scott), архивариус и историк Интернет-архива (Internet Archive). - Она исчезает. Кусок бумаги может сгореть, а вам все-таки что-то от него еще может остаться. С жестким диском или URL иначе - если они исчезают, то это уже пустой ресурс».

Исследование Университета Миннесоты выявило следующие основные выводы.

Положительные.

- Традиционные издания имеют доступ к печатным газетам во многих форматах, доступных для редакции и общества.

- С начала до середины двухтысячных хранятся PDF-версии газет. Как правило, это делает внешний продавец. Проблема заключается в том, что эти файлы часто недоступны для поиска.

Отрицательные.

- Исследователи обнаруживали пробелы в архивах, независимо от того, является ли газета частью сети, владеет ею семья, один владелец в течение десятилетий или ее перепродавали много раз.

- Если раньше в редакции было от 10 до 15 библиотекарей, то теперь в среднем лишь один или два человека, которые упорядочивают цифровую базу печатного продукта.

- Внутренний архив отличается от того, что может видеть аудитория. Только внутренне редакционные архивы содержат полную форму того, что было опубликовано.

- Хотя цифровые фото-файлы в большинстве начали накапливаться в середине 1990-х, тогда делалась только отметка, что фото было частью определенной истории. В более поздних архивных системах уже пытались сохранить фото вместе с метаданными к нему.

- В семи из девяти традиционных медиа аналоговые снимки являются бесплатными и размещены в свободном доступе. Но только две из девяти традиционных СМИ предоставляют аудитории доступ к их цифровым фото- архивам.

- Графические файлы - еще одна проблема. Они хранятся на внутренних серверах или у отдельных художников. Изменения в программном обеспечении или проблемы совместимости делают доступ к старой графике невозможным.

- Проблемы с системами управления контентом и серверами иногда делают невозможным доступ к более ранним версиям веб-сайтов. Результатом этого является потеря данных.

- Ни первично цифровые издания, ни веб-сайты газет не имеют полного архива своих веб-сайтов. Обратная совместимость с новыми системами управления контента или изменения в веб-хостинге являются проблематичными.

- Архивирование мультимедийных элементов является единичным, если не вообще отсутствующим.

- Комментарии читателей к статьям не архивируются, кроме редких исключений, когда это делает внешний агент с определенной целью.

- Контент социальных медиа тоже не архивируется. Речь идет о сообщения для Facebook, Pinterest, Instagram и Twitter.

- Традиционные медиа не архивируют мобильный контент. Среди 10 исследуемых только первично цифровое медиа сохраняют такие материалы.

Нужно осознать важность хранения цифрового контента, поскольку газеты играют важную роль в нашем обществе - с политической и деловой точки зрения. Они документируют историю с самого основания государства. Эта богатая история - под угрозой, учитывая нынешнее положение с хранением цифровых новостей. Ведь со временем цифровые данные теряться.