Цифра все стерпит

01 октября 2011 года, 00:00

Носители информации становятся все совершеннее. Но чем больше их емкость, тем меньше надежность и срок службы. Как не утратить знания, накопленные человечеством, и сохранить личный архив?

В 2008 году, когда в Национальном агентстве США по аэронавтике и исследованию космического пространства (NASA) обсуждались планы новых экспедиций к Луне, потребовались данные о свойствах лунной пыли, собранные в конце 1960-х в рамках программы «Аполлон». Они были записаны на 173 магнитных лентах, оригиналы которых NASA утратило. В Сиднейском университете сохранились копии, но для их чтения нужен был специальный накопитель IBM 729 Mark V, давно снятый с производства, и некогда распространенные магнитные ленты (с многодорожечным параллельным форматом представления данных) прочесть было просто не на чем. К счастью, работоспособный экземпляр накопителя (последний в мире) сыскался в Австралийском компьютерном музее.

1 - Камень. Долговечность: нет ограничений.
2 - Глиняная табличка. Шумер. Емкость: 10-1000 символов. Долговечность: практически нет ограничений.
3 - Папирус. Древний Египет. Емкость: 10-1000 символов. Долговечность (хранение без использования: 200 лет.
4 - Пергамент. Пергам, Греция. Емкость: 100-3000 символов. Долговечность: 1000-2000 лет.

Похожая история произошла в 1990-е с американскими архивистами. Они вознамерились ознакомиться с данными переписи населения 1960 года, хранившимися на магнитных носителях. И нашлось всего два компьютера, способных прочесть эти данные: один в Соединенных Штатах, другой — в Японии.

Наученная этим опытом, крупнейшая в мире Библиотека Конгресса (США) создала специальное подразделение, в котором хранятся устройства для чтения информации с устаревших электронных носителей. Однако нет никакой уверенности, что коллекция библиотеки полна и что в каком-нибудь ведомственном или провинциальном архиве не отыщется носитель, для чтения которого не осталось уже ни устройств, ни программного обеспечения.

Обременительное наследство

В какой-то момент каждой семье приходится решать, что делать с доставшимися от родителей коллекциями виниловых пластинок или магнитофонных пленок, с кассетами и бобинами фото- и кинопленки. Слушать или смотреть их сейчас почти невозможно. Трижды на памяти представителей старшего поколения менялись принципы звукозаписи, а звуковые носители и устройства для их воспроизведения — шесть раз. Сначала это были шеллаковые пластинки (78 оборотов в минуту), затем виниловые «долгоиграющие» диски (33,3 оборота), впервые выпущенные в свет в 1948 году фирмой Columbia records. Почти одновременно с этим новшеством появились катушечные магнитофоны, затем кассетные. В середине 1980-х на смену старым аналоговым носителям пришли цифровые оптические компакт-диски. Пять — десять лет назад и они стали вытесняться универсальными устройствами флеш-памяти. Распространители звукозаписей вообще постепенно отказываются от носителей в пользу нематериальных файлов, скачиваемых через Интернет.

1 - Бумага из растительных волокон. Цай Лунь, Китай. Емкость листа: до 3000 символов. Долговечность: около 1000 лет.
2 - Бумага из древесины. Шумер. Емкость листа: до 3000 символов. Долговечность: 50-200 лет.
3 - Ч/Б фотобумага. Уильям Тальбот, Англия. Емкость: ~1 Мб/см2. Долговечность: более 100 лет.
4 - Ч/Б фотопластинка (стекло, желатин). Ньепс де Сен-Виктор, Франция. Емкость: ~1 Мб/см2. Долговечность: практически нет ограничений.

Смены поколений в области домашней кино- и видеопродукции совершались еще быстрее. Узкопленочные кинокамеры (8 и 16 мм), ставшие общедоступными в конце 1950-х — начале 1960-х годов, в 1980-х были вытеснены бытовым видео формата VHS. Не прошло и 10 лет, как появились DVD, аналогичные по устройству звуковому компакт-диску. Теперь, подобно звукозаписи, любительская видеозапись переходит к компьютерным форматам файлов, которые легко распространять через Сеть.

Как ни странно, чем более продвинут носитель с технической точки зрения, тем меньше срок его службы. У этого правила почти нет исключений. Книги и рукописи на пергаменте могут храниться тысячелетиями, не говоря уже о глиняных табличках и надписях на камне. Бумажные издания, выпущенные до XIX века, если их беречь от влаги, света, грызунов и насекомых, хранятся сотни лет. Но в конце XVIII века, к огорчению архивистов, был изобретен способ изготовления дешевой бумаги из древесины. Она желтеет и становится ломкой за несколько десятилетий, синтетические красители на ней выцветают, причем независимо от тщательности хранения, по «внутренним» причинам (на свету это происходит еще быстрее). В Советском Союзе, между прочим, действовала правительственная программа по выпуску долговечных бумаг для важных документов. И к 1990-м годам СССР начал выпуск бумаги для делопроизводства, рассчитанной на хранение до 850 и 1000 лет. Однако компьютерная революция сделала реализацию этой программы ненужной: документы стали хранить на электронных носителях.

Бледнеющая «пленница»

Единственный носитель, появившийся в ходе технологической революции конца XIX — начала ХХ века и по долговечности сравнимый с бумагой, это черно-белая фотопленка на полиэфирной основе. Что касается целлулоидной пленки, выпускавшейся до 1960-х годов, то у нее век был короче, чем у газетной бумаги: целлулоид содержит вещества, которые испаряются за несколько десятилетий. Пленка коробится и теряет прозрачность.

1 - Валик для фонографа (оловянная фольга). Томас Эдисон, США. Емкость: 2-5 минут (звук). Число воспроизведений: 5-20. Долговечность: практически нет ограничений.
2 - Валик для фонографа (воск). Томас Эдисон, США. Емкость: 2-5 минут (звук). Число воспроизведений: 10-30. Долговечность: практически нет ограничений.
3 - Фотопленка Ч/Б. Джордж Истмен, США. Емкость кадра: ~1 Мб/см2. Долговечность: более 100 лет.
4 - Шеллаковая пластинка. Эмиль Берлинер, США. Емкость: 3-5 минут (звук). Число воспроизведений: 20-50. Долговечность: практически нет ограничений.

Цветная пленка, особенно произведенная до 1970-х годов, тоже хранится не более нескольких десятилетий. Если ее использовать, она приходит в негодность еще быстрее: этот непрочный материал выцветает и царапается частицами пыли даже при аккуратном обращении. Недавно по телевидению показали нереставрированную копию «Кавказской пленницы», которая за 40 лет выцвела почти полностью, особенно это было заметно в эпизодах с преобладанием светлых тонов.

Виниловые диски, подобно черно-белой пленке, теоретически могут храниться в архивах вечно, но быстро изнашиваются при проигрывании. Шеллаковые пластинки первой половины ХХ века вообще выдерживают всего несколько десятков циклов воспроизведения, даже если после каждого проигрывания на граммофоне менять стальную иглу.

1 - Стальная проволока для магнитной записи. Вальдемар Поульсен, Дания. Емкость: до 15 минут (звук). Число воспроизведений: 1000. Долговечность: десятки лет.
2 - Цветная фотопленка. Луи и Огюст Люмьеры, Франция. Емкость: ~1 Мб/см2. Долговечность: 10-20 лет.
3 - Лента с полимерной основой для магнитной записи. BASF, Германия. Емкость: до 60 минут (звук). Число воспроизведений: 100-1000. Долговечность: десятки лет.
4 - Цветная фотобумага. Eastman Kodak, США. Емкость: ~1 Мб/см2. Долговечность: 30 лет.

Цифровые носители выходят из строя просто при хранении. Особенно недолговечны дискеты. Магнитный слой на них осыпается, намагниченные участки слоя, домены, со временем размагничиваются под влиянием теплового движения узлов кристаллической решетки. Даже если вы найдете считывающий привод для пятидюймовых дискет (которые вышли из обихода в начале 1990-х), они, скорее всего, уже не прочитаются — или вовсе, или частично. Правда, автору этой статьи не так давно понадобилось прочесть пятидюймовую дискету «Изот» болгарского производства, записанную на компьютере «Правец-16» в конце 1980-х, и, представьте себе, данные на ней оказались целехоньки! Не зря в советскую эпоху все компьютерные компоненты проходили военную приемку. Трехдюймовые дискеты более стойки при эксплуатации, чем пятидюймовые, однако они менее долговечны при хранении, поскольку информация на них записана с более высокой плотностью и магнитные домены имеют меньший размер.

Жесткий диск-винчестер (кстати, самый дешевый накопитель в расчете на мегабайт данных) служит около пяти лет. Но нередко он выходит из строя быстрее, особенно когда нагревается, а при работе он неизбежно греется. Исследователи из Университета Карнеги — Меллона в 2007 году обследовали 100 000 дисков и обнаружили, что основной показатель надежности (среднее время наработки на отказ) завышается производителями примерно в 15 раз. Ежегодно, по данным исследователей, выходит из строя не 1% дисков, а 2–4%, и пики отказов наблюдаются не только после пятого — седьмого года эксплуатации, но и в первый! Причем, как оказалось, надежность у жестких дисков для массового потребителя примерно такая же, как и у высокопроизводительных накопителей, «обладающих повышенной надежностью» (и, разумеется, более дорогих), предназначенных для профессионалов.

Из оптических дисков (CD и DVD) самые стойкие — штампованные, изготовленные с предварительной записью. Они, как заявляют изготовители, при хранении в надлежащих условиях могут работать без сбоев более 30 лет. А записываемые и особенно перезаписываемые CD и DVD (в которых информация записывается не впадинами-возвышенностями, а прозрачными-непрозрачными зонами) могут потерять информацию уже в течение первого десятилетия. Причем для дисков с данными, у которых меньше резервных битов для восстановления информации, этот порог ниже, чем для звуковых компакт-дисков (Audio CD и редко встречающихся Audio DVD).

Флеш-накопители по долговечности примерно равны штампованным оптическим дискам. Надежность хранения информации на флешках значительно увеличивается, если периодически, хотя бы раз в несколько лет, перезаписывать ее. Наперезаписываемом компакт-диске несущий слой со временем деградирует, перезаписывай диск или нет. На флешке же информация хранится в виде зарядов, которые постепенно рассасываются за счет тепловых факторов или, например, повреждаются космическими частицами, но с самой основой ничего не происходит. При перезаписи можно продлить и срок жизни носителя, и время хранения информации. (Подобный процесс происходит и в оперативной памяти компьютера, только информация в микросхемах DRAM, составляющих эту память, возобновляется — регенерируется — несколько раз в секунду.)

Вообще же, цифровые данные на современных носителях имеют огромное преимущество перед старинными аналоговыми — они просто и быстро копируются без потерь, причем копия идентична оригиналу. Долговечность таких носителей даже не столь важна: своевременное копирование информации позволяет хранить ее практически вечно.

1. Виниловый диск. Columbia, США. Емкость: 30–45 мин. (звук). Число воспроизведений: 100–1000. Долговечность: практически нет ограничений
2. Жесткий диск. IBM, США. Емкость: 250–3000 Гбайт (в настоящее время). Время эксплуатации: 5–7 лет 
3. Магнитофонная кассета. Philips, Голландия. Емкость: 30–90 мин. (звук) .Число воспроизведений: более 1000. Долговечность: десятки лет
4. Видеокассета VHS. JVC, Япония. Емкость: до 3 ч. (видео) .Долговечность: 7–10 лет

Что можно «юпитеру», то нельзя компьютеру

Каждый новый аналоговый формат записи звука или видео всегда предполагал и новое устройство для его воспроизведения. Сейчас при необходимости приходится это устройство искать, а также предусматривать возможность сопряжения старых и новых устройств чтения. Скажем, на задней панели бытового видеомагнитофона (записывающего или простоплеера) можно увидеть множество разъемов. Каждый видеомагнитофон должен сейчас поддерживать не менее пяти стандартов цифровых интерфейсов — компонентный, композитный, S-video, SCART и HDMI. Компьютерные видеоплаты добавляют к этому перечню аналоговый VGA и цифровой DVI, а есть еще стандарты DisplayPort и UDI. К счастью, многие из этих интерфейсов совместимы между собой на уровне переходников. Так можно превратить цифровой DVI в цифровой же HDMI или аналоговый VGA в аналоговый S-video. Однако столь простым способом нельзя превратить аналоговый интерфейс в цифровой. Поэтому приходится сохранять в составе видеоустройств множество интерфейсов, обеспечивающих их совместимость с имеющимся оборудованием, включая телеприемники начала 1980-х годов.

Но такие же трудности могут возникнуть и с компьютерными цифровыми данными. За последние 20 лет успели уйти в прошлое не только дискеты, но и стримеры, и магнитооптические диски (Iomega Zip и другие), некогда популярные у ученых и биржевиков. Для воспроизведения устаревших носителей информации существует только одно решение — то самое, которое применили в Библиотеке Конгресса, а именно: сберегать устройства для чтения всех возможных носителей и поддерживать их в рабочем состоянии. Но это решение практически недоступно частному лицу — стоит ли хранить катушечный магнитофон «Юпитер» или кинопроектор «Русь» только для того, чтобы раз в несколько лет, под настроение, послушать старые записи или посмотреть семейную кинохронику?

Единственный способ обойти это препятствие — не пожалеть времени и денег и оцифровать все архивы. В масштабах семейного хозяйства это вполне выполнимая задача, хотя усилий, возможно, придется приложить много. Сканирование и вычитка текстов, например, могут занять не один день. Зато оцифровать домашний фотоархив, включая негативы, сравнительно просто — можно воспользоваться недорогим бытовым сканером с вкладышем для негативов. Можно отдать такие оригиналы в оцифровку — сейчас эту услугу предоставляет почти любая фотолаборатория по вполне доступным ценам. Сложнее оцифровать киноленты — подобные услуги предлагают лишь немногие и дорого, а простому любителю, не имеющему опыта и оборудования, это не по силам.

Таким же способом крупные архивы могут поступать со старыми оригиналами, хранящимися в аналоговых форматах. Преобразование в «цифру» делает информацию доступнее, появляется возможность ее пересылать и копировать без ущерба для оригинала (кинопленки и магнитные записи, например, при аналоговом копировании деградируют). Объем работы в этой области предстоит грандиозный. Но ее выполнению мешают проблемы с законодательством об интеллектуальной собственности.

Пока во всем мире оцифрована лишь малая часть старых данных. А значительная доля новой информации продолжает производиться в традиционной форме. В России ежегодно выпускается 50 000– 60 000 наименований печатной книжной продукции, в то время как крупнейшие русскоязычные электронные библиотеки — и легальные и пиратские — содержат не больше 60 000–80 000 оцифрованных книг. Если так будет продолжаться, то, когда в недалеком будущем состоится массовый переход к электронным носителям, огромная часть существующего информационного массива окажется малодоступной и выпадет из оборота.

1. Дискета 3 ½.¨ Sony, Япония. Емкость: 1,44 Мбайт. Время эксплуатации: 1–5 лет. Долговечность: 5–10 лет
2. Компакт-диск (CD). Sony, Япония. Емкость: 74–80 мин. (звук) 650–700 Мбайт (данные). Число перезаписей: около 1000. Долговечность: десятки лет
3. Флеш-карта Toshiba. (Фудзио Масуока), Япония. Емкость: до 128 Гбайт. Число перезаписей: до 1 млн. Долговечность: 20–100 лет
4. Магнитооптический диск.  Sony, Япония. Емкость: 2,6 Гбайт. Число перезаписей: до 10 млн. Долговечность: более 30 лет

 

Этот неформатный мир

При переводе информации на «цифру» возникает новая проблема: компьютерные файлы существуют во множестве форматов. Только архиваторов, помимо общеизвестных ZIP и RAR, есть несколько десятков, и некоторые используются лишь в ограниченной области. Но если для чтения аналоговых носителей требуется специальное устройство (подобно магнитофонам или кинопроекторам, основанное на неиспользующихся ныне физических принципах), то для чтения цифрового файла старого формата нужна лишь соответствующая программа. Если ее не оказалось под рукой, ее несложно разыскать, в крайнем случае написать заново, что дешевле создания целого устройства воспроизведения.

Существует всего пара десятков форматов текстовых данных, из них общеупотребительны полдюжины — «чистый текст», пара-тройка форматов Microsoft (DOC, DOCX и RTF), OpenDocument Format (ODF), а также веб-формат HTML и формат иллюстрированного текста PDF. Остальные полтора десятка наплодили производители электронных ридеров для конкретных устройств. Сравнительно немного форматов употребляется и для представления статических изображений — список практически исчерпывается пятью: TIFF, JPEG, GIF, BMP и PNG. Остальные в основном привязаны к конкретным областям применения или графическим программам.

Для звука разнообразие форматов существенно больше, для видео — еще больше. Это связано с тем, что звук и видео-файлы значительно объемнее, чем тексты или статические изображения, так что для удобства использования их приходится сжимать. В Интернете видео и звук надо представить максимально компактно, жертвуя даже качеством, а при записи на DVD и тем более Blu-Ray можно особенно не «экономить».

При этом распространенные типы видео-файлов вроде AVI, OGG или MPEG-4 — это еще не форматы, а так называемые контейнеры. Контейнер представляет собой оболочку для содержимого, которое может быть представлено в разных форматах (то есть записано разными кодеками). Контейнерами являются не только популярные разновидности видео-файлов, но и многие привычные типы текстовых, звуковых файлов или изображений (скажем, PDF, WAV или BMP — тоже контейнеры). В области видеопродукции проблема форматов стоит наиболее остро. Скажем, разработчики стандарта MPEG-4 оставили частным компаниям определенную свободу в определении способов и приемов сжатия видеоряда. Потому не следует удивляться, если видеодиск, записанный на одном компьютере, не воспроизводится на другом, где отсутствует подходящая программа кодек.

Вообще, преобразование данных из одного формата в другой — полностью автоматизируемая процедура, и этот процесс может протекать без потерь. Потери возникают лишь при преобразовании сжатых форматов, но они в общем случае (все, конечно, зависит от степени сжатия) не так существенны, как при копировании аналоговой информации. Поэтому данные лучше хранить в цифровом виде на современных носителях и менять последние, когда есть опасность их устаревания и исчезновения. Это требует времени и средств, но намного меньших, чем создание условий для хранения уникальной информации, записанной на аналоговых носителях в предыдущие века.

1. Диск IOMEGA ZIP. Iomega, США. Емкость: 100–750 Мбайт. Время эксплуатации: 1–3 года. Долговечность: 5–10 лет
2. DVD VIDEO. DVD Consortium. Емкость: 4 Гбайт или 1–3 ч. (для изображения PAL/NTSC, сжатого по стандарту MPEG-2). Долговечность: 30 лет
3. DVD AUDIO. DVD Consortium. Емкость: 4 Гбайт. Долговечность: 30 лет
4. BLU-RAY (диск). BDA Consortium. Емкость: 25 Гбайт (однослойный). Долговечность: 15–20 лет

Архивисты решают проблему просто и дешево: они хранят информацию в машинонезависимых стандартизированных форматах. Базовым форматом стал, естественно, текстовый — то, что в компьютерных программах называется «чистый текст». Цифровые таблицы очищаются от дополнительных данных, которыми они сопровождаются при создании в программах вроде Excel, и представляются в виде последовательности текстовых знаков. Но в архивах не исключается и использование собственных форматов. Тогда на входе вся документация преобразуется в формат, оптимальный для хранения, а на выходе, при передаче конкретному пользователю, производится обратная процедура — конвертирование данных в тот формат, который наиболее удобен заказчику.

Что ожидает нас в ближайшем будущем? Мир постепенно движется к информации без носителей, то есть для пользователя носители становятся виртуальными. Это дисковые массивы «где-то там». Многие компании уже предлагают хранение данных в Сети (в «облаке», то есть в распределенном хранилище без определенного местонахождения). Точно так же, по мнению правообладателей, должно происходить и распространение музыки и фильмов: захотел посмотреть-послушать, подключился к Интернету и за небольшую плату зашел в один из глобальных каталогов медиапродукции.

Но хранилище, управляемое из единого центра, не намного надежнее, чем хранение локальное, на компьютерах пользователей. На массовых электронных почтовых службах или таких сервисах, как Google Docs, постоянно случаются сбои доступа. Глобальный сбой подобных служб с безвозвратной утерей данных — сценарий гипотетический, но отнюдь не фантастический. Кроме того, доступ пользователей к централизованному хранилищу в любой момент можно закрыть, и это уже политическая проблема. А вопрос безопасности в таких хранилищах в принципе нерешаем: любую компьютерную защиту можно взломать. Так что идеальный способ хранения информации по-прежнему предмет поисков.

Рубрика: Технологии
Просмотров: 9126