Устройства хранения больших обьемов иформации
С развитием современных компьютерных систем и увеличением информационного пространства, все чаще появляется потребность в хранении больших обьемов информации. Конечно, возможности всемирной сети WWW поистене огромны, и обьем информации, хранящейся в ней имеряется сотнями, если не тысячами, терабайт (Тбайт) информации. Однако, надо брать в расчет, что это распеделенная информация, которая хранится на десятках тысяч серверов, и скорость доступа к этой информации зачастую очень ограничена. Для некоторого рода задач возникает необходимость хранения большого обьема информации в одном месте, подключенного к одному серверу, или клястеру серверов. Организация такого хранилища информации может быть различна, и зависит от требований предъявляемых к оперативности доступа и скорости получения данных, необходимости хранения резервного архива или отслеживания предыдущих версий при изменении данных, надежности хранения и пр.. Попытаемся разобраться, какие способы организации больших хранилищ данных существуют, какие они имеют плюсы и минусы.
Как известно, устройства хранения данных различаются по типу информационной среды (электронная, магнитная, магнитооптическая и оптическая), типу носителя (на сменных и несменных носителях) и способу доступа к информации (последовательным доступом в ленточных накопителях и произвольным доступом в дисковых). Вся эта классификация действтельна и для больших хранилищ. Однако, реализация хранения на одном большом диске или ленте будет очень дорогостоящим и ненадежным решением, поэтому применяют некоторые промежуточные решения. Одним из таких решений является огранизация большого информационного поля по методу библиотеки.
ЭЛЕКТРОННАЯ БИБЛИОТЕКА.
Библиотечная схема огранизации информационного хранилища очень схожа с организацией обычной библиотеки. В таком хранилище имеется один или несколько приводов для сменых носителей, и большое сменных носителей с сервисным механизмом подачи этих носителей в приводы. К устойствам подобного типа относятся CD-Changer, MO-Library и Tape-Library. Стоимость, в пересчете на мегабайт (Мбайт), таких систем не очень высокая, так как вся информация хранится на недорогих сменных носителях. Например, библиотечная система на оптических дисках IBM Optical Library Dataserver 3995-163, емкостью 188 Гбайт, снабженная 4 приводами и укомплектованная 144 магнито-оптическимисменными дисками, имеет базовую стоимость 95’000 USD, то есть чуть больше 0.50 USD за Мбайт. Данное устройство представляет из себя устройство SCSI, и таких устройст возможно подключить до семи штук на один SCSI контроллер. К достоинствам подобной системы относится и возможность устанавливать в такие системы кассет с одноразовой записью (WORM — Write Once Read Many), в такой конфигурации данные в системе невозможно переписать или стереть, и она наиболее важна для хранения высокоответсвенных архивов, все изменения информации в которых фиксируется. Библиотечные системы на лентах еще дешевле. Например система IBM High Performance Tape Subsystem 3590 B11 имеет бызовую цену всего 60’000 USD. Учитывая, что данная система имеет суммарную емкость 300 Гбайт, получаем цену за Мегабайт меньше 0.20 USD. Ёмкость подобных библиотечных систем может быть поистине огромна, например IBM выпускает библиотечную систему на ленточных накопителях Tape Library Dataserver 3495-L50 емкостью до 568 Тбайт! В этой системе для хранения используется до 18’940 ленточных носителей, каждый емкостью 30 Гбайт (со сжатием), которые подаются специальным роботом-манипулятором в 64 высокоскоростных привода, и стоимость за Мбайт в таких системах может быть еще ниже.
Но у таких систем есть и недостатки — время доступа к информации велико и число одновременно обслуживаемых запросов на чтение/запись ограничено количеством приводов. Разработчики и производители библиотечных систем пытаются улучшить эти характеристики снабжая такие хранилища высокоскоростными системами подачи сменных носителей, уменьшая время старт/стоп для приводов, устанавливая дополнительные кеш-буфера и внедряя технологию чтения с опережением. Вдобавок к этому, подобные системы требуют установки на сервер, к которому подключен такой информационный массив, специального программного обеспечения, управляющего библиотекой. Такое ПО (которое разрабатывается для каждой ОС отдельно) будет поддерживать файловую систему библиотеки, выдавать комманды для смены носителей и обслуживать буферный диск, на который осуществляется переписывание часто используемых данных. Но даже применение этих мер, не дает такого времени доступа и той скорости чтения/записи как системы c параллельной записью и RAID системы. Поэтому библиотечные системы наиболее подходят в качестве устройств резервного копирования (особенно ленточные системы Tape-Library) или информационного поля, в котором время доступа не является первостепенной величиной (MO-Library).
СИСТЕМЫ С ПАРАЛЛЕЛЬНОЙ ЗАПИСЬЮ
Ограничения скорости чтения/записи, свойственные библиотечным системам, можно убрать если распараллелить процесс. Именно такой способ увеличения скорости обмена между сервером и хранилищем данных используется в системах с параллельной записью. В таких системах поток данных записывается, не на один привод, как в библиотечных системах, а параллельно на несколько приводов. При этом скорость чтения/записи увеличивается пропорционально увеличению количества приводов, но стоимость системы с такой организацией выше, чем у библиотечных систем. При этом, надо отметить, не достигается увеличение времени доступа и в лучшем случае, при синхронизации работы всех приводов в такой системе, эта характеристика совпадает с временем доступа одного привода.
Подобные решения существуют на базе ленточных и магнито-оптических накопителей (решения и на базе жестких дисков, как частный случай дискового массива – RAID с уровнем 0 —, более детально расмотренный ниже). При этом, естественно, сохраняется возможность смены носителей. Такие системы, чаще всего, используют в качестве быстрых устройств резерного копирования (ленточные системы) или массивов памяти большой емкости, в которых некритично время доступа, но предьявляются высокие требования к скорости обмена (например, при создании и обработке на компьютере видео). Существуют и смешанные системы, где принцип распараллеливания потока данных сочетается с возможностями библиотечных систем. Но, тем не менее, подобные системы не получили, и наверное уже никогда не получат, широкого распространения. Их с успехом вытеснили дисковые массивы RAID, которые при тех же ценах, обеспечивают лучшие характеристики и большую гибкость при конфигурировании.
СИСТЕМЫ RAID.
Технология дисковых массивов данных, была предложена достаточно недавно, но уже получила широкое применение, благодаря свей гибкости. Само определение RAID — Redundant Array of Independent Disks(Избыточный Массив Независимых Дисков), или как еще расшифровывают эту аббревиатуру —Redundant Array of Inexpansive Disks (Избыточный Массив Недорогих Дисков), говорит само за себя. Это хранилище данных, в котором информация хранится на жестких дисках (HDD), объединенных в массив, с избыточностью. Избыточность информации в массивавх RAID, позволяет обеспечить большую надежность, по сравнению с обыкновенным накопителем. Организация RAID по принципу N+1 диск (где: N — количество дисков, необходимых для хранения всего обьема информации) допускает выход из строя одного из накопителей, и при этом весь массив остается работоспособным и с ним можно продолжать работу, но с пониженной скоростью, так как системе необходимо время для реконструкции данный.
Системы RAID различают по способу организации и размещения данных и доступу к ним, наличием избыточной информации, контрольных сумм и способом ее размещения в массиве. Эти способы, называемые также уровнями (level) RAID, специфицируются и стандартизуются ассоциацией RAB (RAID Advisor Board), и соблюдаются, с небольшими отклонениями, практически всеми производителями RAID. В принципе, вы можете на одной и тойже системе, выбрать различные уровни RAID, что позволяет вам экспериментальным путем выбрать подходящий для вас режим работы. Однако, надо учитывать, что при такой реконфигурации все данные, которые уже были записанны, на массив будут потерянны. Правда, в последнее время, появились производители, предлагающие возможность реконфигурации RAID “на ходу”, но такой сервис пока ненадежен (возможна потеря данных в момент реконфигурации). У систем RAID есть и еще одно неоспоримое преимущество — интерфейс. Практически все выпускающиеся сейчас дисковые массивы используют интерфейс SCSI, и компьютер, к которому они подсоединены воспринимает их как обыкновенный диск (правда большой емкости). В связи с этим, массивы не требуют установки на сервер специального программного обеспечения или драйвера устройства, в отличие от библиотечных систем, и их можно подключать к любому компьютеру вне зависимости от платформы и операционной системы. Именно поэтому, для построения баз данных большого объема с высокими технико-экономическими характеристиками рекомендуется использовать комплексы RAID. Так, например, дисковый массив MegaDrive MX/500 RAID Disk Array, где в качестве носителей применяются стандартные жесткие диски максимального объема может работать с серверами на любой платформе (будь то PC, Mac, IBM RS/6000, DEC, SUN, SGI и пр.) под операционными системами Windows NT, OS/2, Novell, VMS, Solaris.
Этот дисковый массив MegaDrive является одним из наиболее развитых систем, в котором применены большинство современных решений, обеспечивающих увеличение производительности и надежности. На его примере достаточно наглядно можно показать преимущества RAID массивов. Модули с дисками в нем подключаются либо к серверу через интерфейс Fast/Wide SCSI-2, либо цепочкой друг к другу. В модуле размещаются шесть сменных (hot-swap) ячеек, пять из которых предназначены для полновысотных дисков с посадочным местом 5,25″. Еще одна ячейка является резервной и служит для размещения дополнительного накопителя (“винчестера”, стримера и т.д.). Каждый модуль имеет две системы охлаждения и три независимых блока питания, переключающиеся автоматически при выходе из строя одного из них. Дисковый модуль обеспечвает полную защиту от ударов и статических нагрузок. При отказе любого из элементов модуля срабатывает звуковая и световая сигнализация, а также предусмотрен пейджинговый вызов. Модули компонуются в 19″стойки (rack-mount) по шести штук. Максимальная емкость существующих на сегодняшний день стандартных дисков (например серии Seagate Elite), размещамого в ячейке модуля, достигает 9.09 Гбайт (хотя и это не предел, уже аннонсированны диски емкостью21Гбайт, выпуск которых начнется во втором квартале этого года), а всего модуля — 45 Гбайт (105 Гбайт). По крайней мере один модуль системы должен содержать контроллер (Array Controller), в этом случае он называется мастер-модулем. Контроллер в массиве производства MegaDrive построен на мощном RISC-процессоре Intel 960, ведь именно он будет рассчитывать контрольные суммы, обеспечивать максимальную производительность и управление дисками по технологиям RAID 0,3,5, а также подключение к SCSI-интерфейсу сервера. LCD-дисплей мастер-модуля обеспечивает текущий контроль за функционированием, а также автономную, при необходимости, настройку модуля. В целях увеличения быстродействия системы контроллеры мастер-модулей оснащаются кэш-памятью размером до 128 Мбайт. Каждый мастер-модуль может управлять подключенными к нему простыми модулями в количестве до шести штук, тогда емкость на один SCSI ID может достигать 315 Гбайт. Но для сохранения быстродействия не рекомендуется перегружать мастер-модуль. Будучи подключенным к SCSI-контроллеру сервера, мастер-модуль обеспечивает обмен данными со скоростью 20 Мбайт/с. При задействовании нескольких каналов SCSI общая скорость обмена может достигать 50 Мбайт/с. В сочетании с малым временем доступа к диску, не превышающим 7 мс, скорость чтения/запись обеспечивает выполнение самых высоких требований прикладных задач, вплоть до “живого видео”. Кроме того, существенное влияние на поддержание производительности оказывают внутренние алгоритмы контроллера, минимизирующие времена поиска с помощью Command Tag Queuing (тэговой очереди команд), а также наличие буферного кэша в контроллере, который сокращает число обращений к дискам на порядок. Такая организация управления позволяет работать при полной скорости обмена данными независимо от объема базы данных и числа пользователей.
Обеспечиваемые матрицей уровни RAID имют следующие особенности. Уровень 0 (RAID Level 0) характеризуется распределеним блоков данных по всей матрице без какой-либо избыточности. При этом обеспечивается наиболее полное использование дискового пространства без повышения степени защиты данных, а скорость записи данных максимальна (не требуется время для расчета контрольных сумм). При уровне 3 (RAID Level 3) данные пересылаются параллельно на 80% дисководов. Остальные 20% хранят контрольную информацию, позволяя восстановить данные в случае, если дисковод внезапно откажет. Уровень 3 обеспечивает наивысшую производительность для больших файлов с полной защитой данных. Эта технология идеальна для издательских серверов, графических баз данных, “живого видео”, мультимедиа и других применений, использующих большие файлы. На уровне 5 (RAID Level 5) обмен данными идет посредством независимых операций чтения и записи на один дисковод (не параллельно). Вместо использования выделенного дисковода с контрольной информацией уровень 5 распределяет эту информацию по всем дисководам. Как на уровне 3, здесь под хранение собственно данных отводится 80% емкости, а 20% используется для конторльных сумм которые понадабятся для немедленного восстановления данных при отказе ячейки. Уровень 5 обеспечивает более высокую частоту обращения при некотором снижении скорости чтения/запись (пропускной способности). Разработанный для максимизации частоты ввода/вывода уровень 5 наилучшим образом подходит для работы с большой сетью при очень высоких потоках транзакций. Оба последних уровня обеспечивают наработку на отказ не менее 50 миллионов часов (около 6000 лет), что позволяет считать систему хранения данных практически абсолютно надежной. Предлагаемая система позволяет при соответствующем разбиении базы данных на части, к которым идут запросы различного характера, использовать оптимальное сочетание технологий уровней 3 и 5.
При этом, цена такой системы, без учета импортных пошлин (10%) и НДС, в Москве, полезной емкостью 1 Тбайт (1.25 Tбайт - при использовании RAID уровня 0 и дисков ёмкостью 9 Гбайт), составит 895’000 USD или 0.85 USD за Мбайт. Такую высокую производительность, оперативность и скорость обмена данными обеспечивает только организация хранилища информации в массивах RAID. Но ни одно устройство не застраховано от сбоев в силовой сети электропитания и стихийных бедствий. Для обеспечения безопасности необходимо придерживаться следующих рекомендаций.
РЕКОМНДАЦИИ ПО БЕЗОПАСНОСТИ БОЛЬШИХ ОБЬЁМОВ ДАННЫХ
В целях защиты данных от катастрофы в случае пожара или взрыва рекомендуется использовать архивные хранилища данных на магнитных лентах(в случае библиотечных систем данная рекомендация бесполезна). Плюс к этому, необходимо придерживаться прочих требований безопасности таких как: ограничение физического доступа к системе, установка оборудования в специальное помещение, снабженное системой климатического контроля и пожаротушения.
Для обеспечения безопасности от сбоев электропитания необходимо в составе центральной части системы, включающей сервер и хранилище информации, предусмотреть наличие источников бесперебойного питания (UPS), поддерживающих необходимую мощность (наличие резервных мотор-генераторов не представляется необходимым). Система резервного питания должна, так же, допускать замену батарей без останова всей системы. Стоимость подобной системы UPS (например типа APC Matrix) на указанную мощность 10 кВА.составляет порядка 10000 USD
Еремин Серей