Технологии хранения данных на магнитных ВЗУ, организация избыточного массива независимых дисков

Автор работы: Пользователь скрыл имя, 30 Января 2011 в 07:53, курсовая работа

Описание

Цель курсовой работы – рассмотреть технологии хранения данных на магнитных ВЗУ, сделать предложение об использовании RAID-массива в Рубцовском институте (филиале) Алтайского государственного университета.

Для достижения данной цели требуется решить следующие задачи:

– изучить основные виды магнитных ВЗУ;

– рассмотреть основные уровни RAID-массивов;

– сделать предложение об использовании RAID-массива в Рубцовском институте, (филиале) Алтайского Государственного Университета.

Работа состоит из  1 файл

Копия Введение.doc

— 520.50 Кб (Скачать документ)

110

    Если при считывании зафиксировано слово 1100100, то контрольное слово для него равно 101. Сравнивая исходное контрольное слово с полученным (поразрядная операция исключающего ИЛИ), имеем:

то есть ошибка при считывании в третьей  позиции.

Соответственно, зная, какой именно бит является ошибочным, его легко исправить «на лету».

    RAID 2  – один из немногих уровней, позволяющих не только исправлять «на лету» одиночные ошибки, но и обнаруживать двойные. При этом он является самым избыточным из всех уровней с кодами коррекции. Эта схема хранения данных применяется редко, поскольку плохо справляется с большим количеством запросов, сложна в организации и обладает незначительными преимуществами перед уровнем RAID 3.

Плюсы:  
– приемлемая высокая скорость записи, меньше, чем у массива RAID 0, но больше чем у RAID 1.

 Минусы: 
– громоздкость структуры из почти двойного количества дисков. Именно этот минус не привел к распространению массив данного типа.
 

  RAID уровня 3 – это отказоустойчивый массив с параллельным вводом-выводом и одним дополнительным диском, на который записывается контрольная информация (рис.2.4.). При записи поток данных разбивается на блоки на уровне байт (хотя возможно и на уровне бит) и записывается одновременно на все диски массива, кроме выделенного для хранения контрольной информации. Для вычисления контрольной информации (называемой также контрольной суммой) используется операция «исключающего ИЛИ» (XOR), применяемая к записываемым блокам данных.

Рис.2.4. Raid 3 

    При выходе из строя любого диска данные на нем можно восстановить по контрольным данным и данным, оставшимся на исправных дисках.

RAID уровня 3 имеет намного меньшую избыточность, чем RAID 2. Благодаря разбиению  данных на блоки RAID 3 имеет высокую  производительность. При считывании  информации не производится обращение  к диску с контрольными суммами (в случае отсутствия сбоя), что происходит всякий раз при операции записи. Поскольку при каждой операции ввода-вывода производится обращение практически ко всем дискам массива, одновременная обработка нескольких запросов невозможна. Данный уровень подходит для приложений с файлами большого объема и малой частотой обращений. Кроме того, к достоинствам RAID 3 относятся незначительное снижение производительности при сбое и быстрое восстановление информации.

Плюсы:  
– приемлемая высокая скорость записи;

  
– для организации массива данного типа необходимо всего три диска, N дисков под данные и всего один вспомогательный.  
Минусы: 
– массив этого типа хорош только для однозадачной работы с большими файлами, так как наблюдаются проблемы со скоростью при частых запросах данных небольшого объема;

– большая нагрузка на контрольный диск, что приводит к тому, что его надёжность сильно падает по сравнению с дисками с данными.  

  RAID уровня 4 – это отказоустойчивый массив независимых дисков с одним диском для хранения контрольных сумм (рис.2.5.). RAID 4 во многом схож с RAID 3, но отличается от последнего, прежде всего, значительно большим размером блока записываемых данных (большим, чем размер записываемых данных).

  

Рис.2.5. Raid 4 

    В этом и есть главное различие между RAID 3 и RAID 4. После записи группы блоков вычисляется контрольная сумма (точно так же, как и в случае RAID 3), которая записывается на выделенный для этого диск. Благодаря большему, чем у RAID 3, размеру блока возможно одновременное выполнение нескольких операций чтения (схема независимого доступа).

RAID 4 повышает  производительность передачи файлов  малого объема (за счет распараллеливания  операции считывания). Но поскольку  при записи должна вычисляться  контрольная сумма на выделенном диске, одновременное выполнение операций здесь невозможно (налицо асимметричность операций ввода и вывода). Рассматриваемый уровень не обеспечивает преимущества в скорости при передаче данных большого объема. Эта схема хранения разрабатывалась для приложений, в которых данные изначально разбиты на небольшие блоки, поэтому нет необходимости дополнительно их разбивать. RAID 4 представляет собой неплохое решение для файл-серверов, информация с которых преимущественно считывается и редко записывается. Эта схема хранения данных имеет невысокую стоимость, но ее реализация достаточно сложна, как и восстановление данных при сбое.  

  RAID уровня 5 – это отказоустойчивый массив независимых дисков с распределенным хранением контрольных сумм (рис.2.6.). Блоки данных и контрольные суммы, которые рассчитываются точно так же, как и в RAID 3, циклически записываются на все диски массива, то есть отсутствует выделенный диск для хранения информации о контрольных суммах.

  В случае RAID 5 все диски массива  имеют одинаковый размер, однако общая емкость дисковой подсистемы, доступной для записи, становится меньше ровно на один диск. Например, если пять дисков имеют размер 10 Гбайт, то фактический размер массива составляет 40 Гбайт, так как 10 Гбайт отводится на контрольную информацию. 
 

  

  Рис.2.6. RAID5 

  RAID 5, так же как и RAID 4, имеет  архитектуру независимого доступа,  то есть в отличие от RAID 3 здесь  предусмотрен большой размер  логических блоков для хранения  информации. Поэтому, как и в  случае с RAID 4, основной выигрыш такой массив обеспечивает при одновременной обработке нескольких запросов.

  Главным же различием между RAID 5 и RAID 4 является способ размещения контрольных сумм.

Наличие отдельного (физического) диска, хранящего  информацию о контрольных суммах, здесь, как и в трех предыдущих уровнях, приводит к тому, что операции считывания, не требующие обращения к этому диску, выполняются с большой скоростью. Однако при каждой операции записи меняется информация на контрольном диске, поэтому схемы RAID 2, RAID 3 и RAID 4 не позволяют проводить параллельные операции записи. RAID 5 лишен этого недостатка, поскольку контрольные суммы записываются на все диски массива, что обеспечивает возможность выполнения нескольких операций считывания или записи одновременно.  
 
 
 

    2.3 Практическая реализация RAID – массивов 

  Для практической реализации RAID-массивов необходимы две составляющие: собственно массив жестких дисков и RAID-контроллер. Контроллер выполняет функции связи с сервером (рабочей станцией), генерации избыточной информации при записи и проверки при чтении, распределения информации по дискам в соответствии с алгоритмом функционирования.

    Конструктивно контроллеры бывают как внешние, так и внутренние. Имеются также интегрированные на материнской плате RAID-контроллеры. Кроме того, контроллеры различаются поддерживаемым интерфейсом дисков. Так, SCSI RAID-контроллеры предназначены для использования в серверах, а IDE RAID-контроллеры подходят как для серверов начального уровня, так и для рабочих станций [3].

Отличительной характеристикой RAID-контроллеров является количество поддерживаемых каналов для подключения жестких дисков. Несмотря на то, что к одному каналу контроллера можно подключить несколько SCSI-дисков, общая пропускная способность RAID-массива будет ограничена пропускной способностью одного канала, которая соответствует пропускной способности SCSI-интерфейса. Таким образом, использование нескольких каналов может существенно повысить производительность дисковой подсистемы.

При использовании IDE RAID-контроллеров проблема многоканальности встает еще острее, поскольку два жестких диска, подключенных к одному каналу (большее количество дисков не поддерживается самим интерфейсом), не могут обеспечить параллельную работу – IDE-интерфейс позволяет обращаться в определенный момент времени только к одному диску. Поэтому IDE RAID-контроллеры должны быть как минимум двухканальными. Бывают также четырех, и даже восьмиканальные контроллеры.

Другим  различием между IDE RAID- и SCSI RAID-контроллерами  является количество поддерживаемых ими уровней. SCSI RAID-контроллеры поддерживают все основные уровни и, как правило, еще несколько комбинированных и фирменных уровней. Набор уровней, поддерживаемых IDE RAID-контроллерами, значительно скромнее. Обычно это нулевой и первый уровни. Кроме того, встречаются контроллеры, поддерживающие пятый уровень и комбинацию первого и нулевого: 0+1. Такой подход вполне закономерен, поскольку IDE RAID-контроллеры предназначены в первую очередь для рабочих станций, поэтому основной упор делается на повышение сохранности данных (уровень 1) или производительности при параллельном вводе-выводе (уровень 0). Схема независимых дисков в данном случае не нужна, так как в рабочих станциях поток запросов на запись, чтение значительно ниже, в серверах.

Основной  функцией RAID-массива является не увеличение емкости дисковой подсистемы (как видно из его устройства, такую же емкость можно получить и за меньшие деньги), а обеспечение надежности сохранности данных и повышение производительности. Для серверов, кроме того, выдвигается требование бесперебойности в работе, даже в случае отказа одного из накопителей. Бесперебойность в работе обеспечивается при помощи горячей замены, то есть извлечения неисправного SCSI-диска и установки нового без выключения питания. Поскольку при одном неисправном накопителе дисковая подсистема продолжает работать (кроме уровня 0), горячая замена обеспечивает восстановление, прозрачное для пользователей. Однако скорость передачи и скорость доступа при одном неработающем диске заметно снижается из-за того, что контроллер должен восстанавливать данные из избыточной информации. Правда, из этого правила есть исключение – RAID-системы уровней 2, 3, 4 при выходе из строя накопителя с избыточной информацией начинают работать быстрее. Это закономерно, поскольку в таком случае уровень «на лету» меняется на нулевой, который обладает великолепными скоростными характеристиками.

До сих  пор речь в этой статье шла об аппаратных решениях. Но существует и  программное, предложенное, например, фирмой Microsoft для Windows 2000 Server. Однако в этом случае некоторая начальная экономия полностью нейтрализуется добавочной нагрузкой на центральный процессор, который помимо основной своей работы вынужден распределять данные по дискам и производить расчет контрольных сумм. Такое решение может считаться приемлемым только в случае значительного избытка вычислительной мощности и малой загрузки сервера.

  Существуют комбинированные уровни RAID: RAID 10, RAID 30, RAID 50. Производители каждый по-разному интерпретирует комбинированные уровни. Например, RAID 10 – это сочетание зеркалирования и чередования.      

  Для реализации RAID можно применять не только аппаратные средства, но и  полностью программные компоненты (драйверы). Например, в системах на ядре Linux существуют специальные модули ядра, а управлять RAID-устройствами в GNU/Linux можно с помощью утилиты mdadm. 

  2.4 Предложение об использовании RAID-массива в РИ (филиале) АлтГУ 

В Рубцовском институте (филиале) АлтГУ система  хранения данных представлена следующим  образом: три сервера, выполняющих разные функции.

  Файловый  сервер RFAGU – выполняет функции главного контроллера домена RBDOM, обеспечивающего централизацию управления ЛВС института; файлового сервера личных и общедоступных ресурсов; СПС «Консультант+», «Гарант», «Электронная библиотека». Технические характеристики: 2xP4Xeon, 2,8Ghz, 4x 1Gb, IDE-SATA 40Gb, 1Tb, RAID5 SATA 3X500Gb, 2xGigabit Ethernet. Установленное программное  обеспечение – Gento Linux 2008 Server Edition.

  Сервер  WWW – выполняет функции базового Web-сервера со следующим набором сервисов: HTTP, FTP, DNS, MAIL, PROXY, APACHE, MySQL, DIALUP. Технические характеристики: 2xP4Xeon, 3,0Ghz, 4x 1Gb, RAID1 SATA 2x80Gb, 2xGigabit Ethernet. Установленное ПО – Gento Linux 2008 Server Edition.

  Сервер  приложений ORACLE – выполняет функции сервера приложений для баз данных: «Студенты», «Абитуриенты», «Сотрудники», систем оценки качества образования СОКО и тестирования «TESA». Технические характеристики: 2xP4Xeon, 2,8Ghz, 4x 1Gb, IDE-SATA 40Gb, SATA 80Gb, RAID5 SATA 5X36Gb, 2XGigabit Ethernet. Установленное ПО – ASP Linux 7.3 Server Edition, Oracle 9i.

  Проанализируем  выбор RAID-массива, в Рубцовском институте (филиале) АлтГУ.

  На  данных серверах установлены RAID-массивы, уровней 5 и 1.

  RAID 5 – отказоустойчивый массив независимых дисков с распределенной четностью (Independent Data disks with distributed parity blocks), самый популярный массив в недорогих серверных системах. Здесь избыточность обеспечивает всего один из дисков массива, но при этом получаем защиту от выхода из строя любого из дисков, входящих в состав RAID 5. Такой тип массивов может состоять минимум из трёх жёстких дисков, он имеет лучшее соотношение параметров цена, объём, скорость, надёжность [7].

  Но  данный RAID-уровень имеет недостатки: при выходе из строя одного из дисков весь том переходит в критический режим, все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность, диски начинают греться. Если срочно не принять меры можно потерять весь том. Также согласно некоторым исследованиям, восстановление целостности после отказа одного диска на томе RAID5, составленном из дисков SATA большого объема (400 и 500Gb), в 5% случаев заканчивается утратой данных. Другими словами, в одном случае из двадцати во время регенерации массива RAID5 на диск резерва Hot Spare возможен выход из строя второго диска [6].

Информация о работе Технологии хранения данных на магнитных ВЗУ, организация избыточного массива независимых дисков