Что необходимо для хранения информации

Выбираем способ хранения данных и важной информации: руководство Overclockers.ru

Оглавление

Вступление

реклама

Выбор устройства для хранения информации в 2017 году – это очень и очень спорная тема. Прошли уж те времена, когда можно было выбирать только из жестких дисков небольшого объема или компакт-дисков (для мажоров, ага): сегодня спектр решений для хранения данных велик, как никогда.

Для начала определимся с тем, а зачем нам, собственно, что-то хранить – в эпоху интернета? Когда все «в небесах» – в облаках?

В первую очередь сегодня мы погребены под обилием информации. Петабайты нужных и ненужных (чаще) данных обрушиваются на нас снежной лавиной, и здесь речь идет даже не о новостях, а о данных физических: фотографиях, гигантском количестве пиратской и не очень музыки и фильмов. Сюда же отнесем и приложения, «которые когда-нибудь пригодятся»; фильмы, которые посмотрели один раз, «может быть, посмотрю во второй»… Не все же все удаляют, верно? Встает вопрос о том, где все это хранить.

Потом – «бэкапы». Опять же, ни для кого не секрет, что современные и самые дешевые с точки зрения фактора «цена за мегабайт» жесткие диски (традиционные, «блинные») страдают от низкого качества. К примеру, у меня настроено почти полное ежедневное зеркалирование системного жесткого диска и диска с данными на идентичные по объему модели. Почему? Именно потому, что «полететь в голубые небеса» может любой «винчестер» в любое время и в любом месте.

Увы, но сегодняшнее общество потребления признает только то, что стоит дешево, служит недолго и умирает быстро. Поэтому надежные жесткие диски конца 1990-х годов (а у меня до сих пор жив HDD IBM 1998 года выпуска – как раритет!) остались легендами, в которые современные 128-битные люди уже не верят. С другой стороны, на рубеже веков лично у меня померло два «винчестера» Quantum, поэтому надежность зависела и от производителя. Кстати, наследники Quantum в энном поколении ныне известны под именем Seagate. Информация просто для размышления.

Одним словом, хранение данных все равно актуально, и интернет этого не заменит.

Источник

Обработка и хранение данных: от древности до ЦОДов

Наше время часто называют информационным веком. Однако информация была критически важна для рода человеческого на протяжении всего его существования. Человек никогда не был самым быстрым, самым сильным и выносливым животным. Своим положением в пищевой цепи мы обязаны двум вещам: социальности и способности передавать информацию более чем через одно поколение.

Что необходимо для хранения информации

То, как информация хранилась и распространялась сквозь века, продолжает оставаться буквально вопросом жизни и смерти: от выживания племени и сохранения рецептов традиционной медицины до выживания вида и обработки сложных климатических моделей.

Посмотрите на инфографику (кликабельна для просмотра в полной версии). Она отображает эволюцию устройств хранения данных, и масштабы действительно впечатляют. Однако эта картинка далека от совершенства — она охватывает каких-то несколько десятилетий истории человечества, уже живущего в информационном обществе. А между тем данные накапливались, транслировались и хранились с того момента, откуда нам известна история человечества. Сперва это была обычная человеческая память, а в недалёком будущем мы уже ждём хранения данных в голографических слоях и квантовых системах. На Хабре уже неоднократно писали про историю магнитных накопителей, перфокарты и диски размером с дом. Но ещё ни разу не было проделано путешествие в самое начало, когда не было железных технологий и понятия данных, но были биологические и социальные системы, которые научились накапливать, сохранять, транслировать информацию. Попробуем сегодня прокрутить всю историю в рамках одного поста.

Что необходимо для хранения информации
Источник изображения: Flickr

До изобретения письменности

До того, как появилось то, что можно без сомнения назвать письменностью, основным способом сохранить важные факты была устная традиция. В такой форме передавались социальные обычаи, важные исторические события, личный опыт или творчество рассказчика. Эту форму сложно переоценить, она продолжала процветать вплоть до средних веков, далеко после появления письменности. Несмотря на неоспоримую культурную ценность, устная форма — эталон неточности и искажений. Представьте себе игру в «испорченный телефон», в которую люди играют на протяжении нескольких столетий. Ящерицы превращаются в драконов, люди обретают песьи головы, а достоверную информацию о быте и нравах целых народностей невозможно отличить от мифов и легенд.

Что необходимо для хранения информации
Боян

От клинописи до печатного станка

Для большинства историков рождении цивилизации с большой буквы неотрывно связано с появлением письменности. Согласно распространенным теориям, цивилизация в современном ее понимании появляется в результате создания излишков пищи, разделения труда и появления торговли. В долине Тигра и Евфрата произошло именно это: плодородные поля дали почву торговле, а коммерция, в отличии от эпоса, требует точности. Было это примерно в 2700 г. до нашей эры, то есть 4700 лет назад. Львиная доля шумерских табличек с клинописью заполнены бесконечным рядом торговых транзакций. Не все, конечно, так банально, например, расшифровка шумерской клинописи сохранила для нас старейшую на данный момент литературную работу — «Эпос о Гильгамеше».

Что необходимо для хранения информации
Глиняная табличка с клинописью

Клинопись, определенно, была отличным изобретением. Глиняные таблички неплохо сохранились, что уж говорить о клинописи, выбитой на камне. Но у клинописи есть однозначный минус — скорость, и физический (не в мегабайтах) вес итоговых «документов». Представьте, что вам нужно срочно написать и доставить несколько счетов в соседний город. С глиняными табличками такая работа может стать в буквальном смысле неподъемной.

Во многих странах, от Египта до Греции, человечество искало способы быстро, удобно и надежно фиксировать информацию. Все больше люди приходили к той или иной вариации тонких листов органического происхождения и контрастных «чернил». Это решало проблему с со скоростью и, так сказать, «емкостью» на килограмм веса. Благодаря пергаменту, папирусу и, в конечном счете, бумаге человечество получило свою первую информационную сеть: почту.

Однако, с новыми преимуществами пришли новые проблемы: все, что написано на материалах органического происхождения имеет свойство разлагаться, выцветать, да и просто гореть. В эпоху от темных веков вплоть до изобретения печатного пресса большим и важным делом было копирование книг: буквальное переписывание набело, буква за буквой. Если представить сложность и трудоемкость этого процесса, легко понять, почему чтение и письмо оставались привилегией очень узкой прослойки монашества и знатных людей. Однако в середине пятнадцатого века произошло то, что можно назвать Первой Информационной Революцией.

От Гутенберга до лампы

Попытки упростить и ускорить набор текста с помощью комплектов заранее отлитых словоформ или букв и ручного пресса предпринимали еще в Китае в 11 веке. Почему же мы мало знаем об этом и привыкли считать родиной печати Европу? Распространению наборной печати в Китае помешала их собственная сложная письменность. Производство литер для полноценной печати на китайском было слишком трудоемким.

Благодаря Гутенбергу же, у книг появилось понятие экземпляра. Библия Гутенберга была отпечатана 180 раз. 180 копий текста, и каждая копия повышает вероятность, что пожары, наводнения, ленивые переписчики, голодные грызуны не будут помехой для будущих поколений читателей.

Что необходимо для хранения информации
Печатный станок Гутенберга

Ручной пресс и ручной подбор литер, однако, не являются, конечно, оптимальным по скорости и трудозатратам процессом. С каждым столетием человеческое общество стремилось не только найти способ сохранить информацию, но и распространить ее как можно более широкому кругу лиц. С развитием технологий, эволюционировала как печать, так и производство копий.

Ротационная печатная машина была изобретена в конце девятнадцатого века, и ее вариации используются вплоть до сегодняшнего дня. Эти махины, с непрерывно вращающимися валами, на которых закреплены печатные формы, были квинтэссенцией индустриального подхода и символизировали очень важный этап в информационном развитии человечества: информация стала массовой, благодаря газетам, листовкам и подешевевшим книгам.

Массовость, однако, не всегда идет на пользу конкретному кусочку информации. Основной носитель, бумага и чернила, все так же подвержены износу, ветхости, утере. Библиотеки, полные книг по всем возможным областям человеческих знаний, становились все более объемны, занимая огромные пространства и требуя все больше ресурсов для своего обслуживания, каталогизации и поиска.

Очередной сдвиг парадигмы в сфере хранения информации произошел после изобретения фотопроцесса. Нескольким инженерам пришла в голову светлая мысль, что миниатюрные фотокопии технических документов, статей и даже книг могут продлить исходникам жизнь и сократить необходимое для их хранения место. Получившиеся в результате подобного мыслительного процесса микрофильмы (миниатюрные фотографии и оборудование для их просмотра) вошли в обиход в финансовых, технических и научных кругах в 20-х годах двадцатого века. У микрофильма много плюсов — этот процесс сочетает в себе легкость копирования и долговечность. Казалось, что развитие способов хранения информации достигло своего апогея.

Что необходимо для хранения информации
Микроплёнка, используется до сих пор

От перфокарт и магнитных лент к современным ЦОДам

Инженерные умы пытались придумать универсальный метод обработки и хранения информации еще с 17-го века. Блез Паскаль, в частности, заметил, что если вести вычисления в двоичной системе счисления, то математические закономерности позволяют привести решения задач в такой вид, который делает возможным создание универсальной вычислительной машины. Его мечта о такой машине осталась лишь красивой теорией, однако, спустя века, в середине 20-го века, идеи Паскаля воплотились в железе и породили новую информационную революцию. Некоторые считают, что она все еще продолжается.

То, что сейчас принято называть «аналоговыми» методами хранения информации, подразумевает, что для звука, текста, изображений и видео использовались свои технологии фиксации и воспроизведения. Компьютерная память же универсальна — все, что может быть записано, выражается с помощью нулей и единиц и воспроизводится с помощью специализированных алгоритмов. Самый первый способ хранения цифровой информации не отличался ни удобством, ни компактностью, ни надежностью. Это были перфокарты, простые картонки с дырками в специально отведенных местах. Гигабайт такой «памяти» мог весить до 20 тонн. В такой ситуации сложно было говорить о грамотной систематизации или резервном копировании.

Что необходимо для хранения информации Перфокарта

Компьютерная индустрия развивалась стремительно и быстро проникала во все возможные области человеческой деятельности. В 50-х годах инженеры «позаимствовали» запись данных на магнитную ленту у аналоговой аудио и видеозаписи. Стримеры с кассетами объемом до 80 Мб использовались для хранения и резервного копирования данных вплоть до 90-х годов. Это был неплохой способ с относительно продолжительным сроком хранения (до 50 лет) и небольшим размером носителя? Кроме того, удобство их использования и стандартизация форматов хранения данных ввела понятие резервного копирования в бытовой обиход.

Что необходимо для хранения информации
Один из первых жёстких дисков IBM, 5 МБ

У магнитных лент и систем, связанных с ними, есть один серьезный недостаток — это последовательный доступ к данным. То есть, чем дальше запись находится от начала ленты, тем больше времени потребуется для того, чтобы ее прочитать.

В 70-х годах 20-го века был произведен первый «жесткий диск» (HDD) в том формате, в котором он знаком нам сегодня — комплект из нескольких дисков с намагничивающимся материалом и головками для чтения/записи. Вариации этой технологии используются и сегодня, постепенно уступая в популярности твердотельным накопителям (SSD). Начиная с этого момента, в течении всего компьютерного бума 80-х формируются основные парадигмы хранения, защиты и резервного копирования информации. Благодаря массовому распространению бытовых и офисных компьютеров, не обладающих большим объемом памяти и вычислительной мощности, укрепилась модель «клиент-сервер». По началу «сервера» были по большей части локальными, своими для каждой организации, института или фирмы. Не было какой-то системы, правил, информация дублировалась в основном на дискеты или магнитные ленты.

Появление интернета, однако, подстегнуло развитие систем хранения и обработки данных. В 90-х годах, на заре «пузыря доткомов» начали появляться первые дата-центры, или ЦОД-ы (центры обработки данных). Требования к надежности и доступности цифровых ресурсов росли, вместе с ними росла сложность их обеспечения. Из специальных комнат в глубине предприятия или института дата-центры превратились в отдельные здания со своей хитрой инфраструктурой. В то же время, у ЦОД-ов кристаллизовалась своего рода анатомия: сами компьютеры (серверы), системы связи с интернет-провайдерами и все, что касается инженерных коммуникаций (охлаждение, системы пожаротушения и физического доступа в помещения).

Чем ближе к сегодняшнему дню, тем больше мы зависим от данных, хранящихся где-то в «облаках» ЦОД-ов. Банковские системы, электронная почта, онлайн-энциклопедии и поисковые движки — все это стало новым стандартом жизни, можно сказать, физическим продолжением нашей собственной памяти. То, как мы работаем, отдыхаем и даже лечимся, всему этому можно навредить простой утерей или даже временным отключением от сети. В двухтысячных годах были разработаны стандарты надежности дата центров, от 1-го до 4-го уровня.

Тогда же из космической и медицинской отраслей начали активно проникать технологии резервирования. Конечно, копировать и размножать информацию с тем, чтобы защитить ее в случае уничтожения оригинала люди умели давно, но именно дублирование не только носителей данных, но и различных инженерных систем, а также необходимость предусматривать точки отказала и возможных человеческих ошибок отличает серьезные ЦОДы. Например, ЦОД, принадлежащий к Tier I будет лишь ограниченную избыточность хранения данных. В требования к Tier II уже прописано резервирование источников питания и наличие защиты от элементарных человеческих ошибок, а Tier III предусматривает резервирование всех инженерных систем и защиту от несанкционированного проникновения. Наконец, высший уровень надежности ЦОДа, четвертый, требует дополнительное дублирование всех резервных систем и полное отсутствие точек отказа. Кратность резервирования (сколько именно резервных элементов приходится на каждый основной) обычно обозначается буквой M. Со временем требования к кратности резервирования только росли.

Построить ЦОД уровня надежности TIER-III, — это проект, с которым справится только исключительно квалифицированная компания. Такой уровень надежности и доступности означает, что, как инженерные коммуникации, так и системы связи дублированы, и дата-центр имеет право на простой только в количестве около 90 минут в год.

У нас в Safedata такой опыт есть: в январе 2014 года в рамках сотрудничества с Российским Научным Центром «Курчатовский Институт» нами был введен в эксплуатацию второй дата-центр SAFEDATA — Москва-II, который также отвечает требованиям уровня TIER 3 стандарта TIA-942, ранее же (2007-2010) мы построили дата-центр Москва-I, который отвечает требованиям уровня TIER 3 стандарта TIA-942 и относится к категории центров хранения и обработки данных с защищенной сетевой инфраструктурой.

Мы видим, что в IT происходит еще одна смена парадигмы, и связана она с data science. Обработка и хранение больших объемов данных становятся актуальны как никогда. В каком-то смысле, любой бизнес должен быть готов стать немного учеными: вы собираете огромное количество данных о ваших клиентах, обрабатываете их и получаете для себя новую перспективу. Для реализации таких проектов потребуется аренда большого количества мощных серверных машин и эксплуатация будет не самой дешевой. Либо, возможно, ваша внутренняя ИТ-система настолько сложна, что на поддержание ее уходит слишком много ресурсов компании.

В любом случае, для каких бы целей вам не понадобились значительные вычислительные мощности, у нас есть услуга «Виртуального ЦОДа». Инфраструктура как сервис — не новое направление, однако мы выгодно отличаемся целостным подходом, начиная от специфически ИТ-шных проблем, вроде переноса корпоративных ресурсов в «Виртуальный ЦОД», до юридических, таких как консультация по актуальному законодательству РФ в сфере защиты данных.

Развитие информационных технологий похоже на беспощадно несущийся вперед поезд, не все успевают запрыгнуть в вагон когда им предоставляется возможность. Где-то до сих пор используют бумажные документы, в старых архивах хранятся сотни не оцифрованных микрофильмов, государственные органы могут до сих пор использовать дискеты. Прогресс никогда не бывает линейно-равномерным. Никто не знает, сколько важных вещей мы в результате навсегда потеряли и какое количество часов было потрачено из-за до сих пор не вполне оптимальных процессов. Зато мы в Safedata знаем, как не допустить пустых трат и невосполнимых потерь конкретно в вашем случае.

Источник

Обзор способов хранения данных

Данные – это самое главное для обычных пользователей и современного бизнеса. Если в системе ПК возникнет сбой, необходимо иметь возможность восстановить личные и рабочие файлы. Поэтому важно хранить информацию вне компьютера. При этом следует убедиться, что будет легко получить доступ к этим файлам и управлять ими.

Данные – это самое главное для обычных пользователей и современного бизнеса. Если в системе ПК возникнет сбой, необходимо иметь возможность восстановить личные и рабочие файлы. Поэтому важно хранить информацию вне компьютера. При этом следует убедиться, что будет легко получить доступ к этим файлам и управлять ими.

Хранение – ключевой компонент цифровых устройств, поскольку пользователи и компании привыкли полагаться на него для сохранения информации, начиная личными фотографиями и заканчивая важными для бизнеса документами.

Технология хранения со временем улучшается. Мы начали с мэйнфреймов, а теперь можно записывать все на быстрые SSD.

Как работает хранилище

Требования к емкости определяют, сколько хранилища необходимо для запуска приложения, набора приложений или наборов данных. Требования к емкости учитывают типы данных. Например, для простых документов может потребоваться емкость в килобайтах, в то время как файлы с большим количеством графики могут занимать мегабайты, а видеофайлы – гигабайты.

Локальное хранилище

Сервера можно арендовать или купить в собственность. Приобрести можно как новые, так и б/у серверы.

Некоторые компании хотят иметь полный контроль над своими ресурсами и файлами. Таким образом, стоит подумать о создании собственного дата-центра.

Облачное хранилище

Кроме того, партнеры могут получить доступ к папкам из любой точки мира. Это очень важно, поскольку большинство людей сейчас работают удаленно.

Еще один вариант – комбинировать облачные технологии с периферийными. Это поможет собрать больше данных и управлять ими, расширить охват своей сети, не покупая новое сетевое оборудование.

Типы устройств

HDD, или жесткие диски

Однако на самом деле эта скорость ограничена вращением диска. Большинство жестких дисков предлагают до 7000 об/мин. Если использовать дорогие HDD, скорость может достигать 15000 об/мин. Срок их службы – около 3-5 лет. Однако они дешевле по сравнению с другими устройствами.

SSD, или твердотельные накопители

Однако SSD дороже по сравнению с HDD. Каждый блок памяти может хранить ограниченные данные, считаются ненадежными для резервных копий.

Ленточные накопители

Хотя сами ленты довольно дешевы, приводная система, необходимая для чтения и записи информации, дорога в обслуживании и сложна в управлении. Многие компании, использующие ответвительные диски для обеспечения отказоустойчивого восстановления после сбоев, предпочитают одну и ту же систему в течение многих лет и избегают перехода на более сложную технологию (или «облако») из-за затрат на миграцию и внедрение.

Пятимерное (5D) хранилище

Но в качестве экспериментальной технологии 5D по-прежнему не является рентабельным или практичным способом для хранения рабочих и личных файлов. Возникают вопросы о том, сможет ли кварцевый состав поддерживать несколько записей, не говоря уже о том, какое оборудование потребуется для чтения закодированной информации.

Тем не менее, технология является многообещающей в качестве будущего долгосрочного архивного решения для хранения данных благодаря надежности и доступной памяти.

Корпоративные сети и серверная флэш-память

С 2011 года все большее число предприятий внедряют массивы all-flash, оснащенные только твердотельными накопителями на базе флэш-памяти NAND, в качестве дополнения или замены дисковых массивов.

В отличие от дисков, устройства флэш-памяти не полагаются на движущиеся механические части, что обеспечивает более быстрый доступ к информации и меньшую задержку. Флэш-память является энергонезависимой, что позволяет информации сохраняться в памяти, даже если система теряет питание. При этом для дисковых систем требуется встроенная резервная батарея или конденсаторы.

Но флэш-память еще не достигла уровня выносливости, эквивалентного диску, что привело к созданию гибридных массивов, объединяющих оба типа носителей.

Существует 3 основных варианта сетевых систем хранения. В своей простейшей конфигурации хранилище с прямым подключением (DAS) включает внутренний жесткий диск отдельного компьютера. На предприятии DAS может быть кластером дисков на сервере или группой внешних дисков, которые подключаются непосредственно к серверу через интерфейс малых компьютерных систем (SCSI), последовательный интерфейс SCSI (SAS), волоконный канал (FC) или Интернет.

NAS – это архитектура, в которой несколько файловых узлов совместно используются пользователями обычно через подключение к локальной сети (LAN) на основе Ethernet. Преимущество NAS в том, что файловым серверам не требуется полнофункциональная операционная система корпоративного хранилища. Устройства NAS управляются с помощью служебной программы на основе браузера, и каждому узлу в сети назначается уникальный IP-адрес.

С горизонтально масштабируемым NAS тесно связано хранилище объектов, которое устраняет необходимость в файловой системе. Каждый объект представлен уникальным идентификатором. Все объекты представлены в едином плоском пространстве имен.

Сеть хранения данных (SAN) может быть спроектирована для охвата нескольких местоположений дата-центров, которым требуется высокопроизводительное блочное хранилище. В среде SAN блочные устройства воспринимаются хостом как локально подключенное хранилище. Каждый сервер в сети может получить доступ к общему хранилищу, как если бы это был диск с прямым подключением.

Достижения в области флэш-памяти NAND в сочетании с падением цен в последние годы проложили путь к программно-определяемым хранилищам. Используя эту конфигурацию, предприятие устанавливает твердотельные накопители по стандартной цене на сервер на базе x86, используя стороннее ПО или собственный открытый исходный код для управления хранилищем.

Энергонезависимая память Express (NVMe) – это развивающийся отраслевой протокол для флэш-памяти. Отраслевые обозреватели ожидают, что NVMe станет стандартом для флэш-хранилищ. NVMe позволит приложениям напрямую взаимодействовать с центральным процессором (ЦП) через каналы связи PCIe, минуя наборы команд SCSI, передаваемые на сетевой адаптер главной шины. NVMe-oF предназначен для ускорения передачи данных между хост-компьютером и целевой флэш-памятью с использованием установленного сетевого подключения Ethernet, FC или InfiniBand.

Энергонезависимый двухрядный модуль памяти (NVDIMM) представляет собой гибридную память NAND и DRAM со встроенным резервным питанием, который подключается к стандартному слоту DIMM на шине памяти. Модули NVDIMM используют только флэш-память для резервного копирования, выполняя обычные вычисления в DRAM.

NVDIMM помещает флэш-память ближе к материнской плате, предполагая, что производитель компьютера модифицировал сервер и разработал базовые драйверы системы ввода-вывода (BIOS) для распознавания устройства. Модули NVDIMM – это способ расширить системную память или добавить высокопроизводительное хранилище, а не увеличить емкость. Текущие модули NVDIMM на рынке достигают максимум 32 ГБ, но плотность в форм-факторе увеличилась с 8 ГБ до 16 ГБ всего за несколько лет.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *