Scsi або serial ata - що ж вибрати все про it і програмуванні

швидкодія

Отже, на чому будуються аргументи прихильників SCSI дисків в якості основи високошвидкісних серверних дискових підсистем? Перший аргумент - інтерфейс SCSI відрізняється більшим "інтелектом" в порівнянні з SATA. Але навіть звичайний пересічний користувач комп'ютера розуміє, що сам по собі жорсткий диск являє собою якусь механічну систему для запису / зчитування даних і весь інтелект SCSI забезпечується контролером на самому жорсткому диску і контролером SCSI комп'ютера. Саме така пара і має досить важливими "інтелектуальними" можливостями по обміну даними. Безумовно, пара зі звичайного SATA контролера і SATA диска таким "інтелектом" не володіє. Але нас цікавлять серверні системи і системи зберігання даних - давайте розглянемо застосування SCSI і SATA в них.

У цих системах вкрай рідко застосовуються диски самі по собі - вимоги до надійності зберігання даних обумовлюють необхідність застосування RAID контролерів і навіть для зберігання операційної системи використовуються RAID 1, а для зберігання даних застосовуються, як правило, окремі RAID масиви рівня 5, 6 або TP. Тому логічно і розумно розглядати всю дискову підсистему в цілому, тобто пару RAID контролер плюс підключення до нього диски.

Для SCSI систем RAID контролер складається з процесора, що займається обробкою даних, кеш-пам'яті процесора і звичайного SCSI контролера, за допомогою якого дані надходять від процесора до дисків або від дисків до процесора. На одному SCSI контролері зазвичай "висять" кілька SCSI дисків. Звичайно, є багатоканальні (до 4-х каналів) SCSI RAID контролери, але і в разі їх застосування до кожного каналу підключають по кілька дисків. Ще раз звертаємо вашу увагу на цю важливу особливість - кілька SCSI дисків обслуговуються одним контролером і завжди кілька дисків "висять" на одній фізичній шині. З цього факту випливає ще один важливий висновок - без будь-якого "інтелекту" робота декількох дисків на одній фізичній шині SCSI контролера була б просто дуже повільної. У новій інкарнації SCSI, SAS вже застосована SATA-подібна топологія і контролер спілкується з диском через індивідуальний порт, причому в повнодуплексному режимі на відміну від полудуплексного SATA.

Для SATA систем RAID контролер також складається з процесора, що займається обробкою даних, кеш-пам'яті процесора і роздільних для кожного диска SATA контролерів, за допомогою яких дані надходять від процесора до дисків і від дисків до процесора. Тим самим видно принципова різниця між SCSI RAID контролерами і SATA RAID контролерами - в першому випадку кілька дисків обслуговуються одним контролером і все диски підключені на одну фізичну шину, у другому - кожен диск підключений до свого контролера індивідуально.

або Тепер просте питання - що заважає покласти на процесор RAID SATA контролера все ті інтелектуальні завдання, які вирішує SCSI контролер? Відповідь також проста - нічого не заважає і виробники хороших RAID контролерів, такі як 3ware, ArecaAdaptec наприклад, так саме і роблять.

Наступний аргумент на користь SCSI дисків - вони швидше, оскільки швидкість обертання шпинделя у SCSI дисків становить мінімум 10000 об / хв, а максимум 15000 об / хв. Дійсно, швидкість обертання у SCSI дисків більше і, якщо використовувати SCSI диски зі швидкістю обертання 15000 об / хв, то майже в два рази більше. Але не можна оцінювати тільки швидкість обертання, оскільки велику роль відіграє щільність запису / читання на пластини жорсткого диска. А ось тут ситуація не настільки райдужна для SCSI - щільність запису на SCSI дисках як мінімум в два рази менше, відповідно за один оборот диска можна вважати / записати в два рази менше с / на SCSI диск, ніж з / на SATA.

Звичайно, не можна стверджувати, що велика щільність запису повністю компенсує більшу швидкість обертання, але для потокових операцій це практично так і є, а для множинних операцій з невеликими файлами / блоками даних велика швидкість обертання краще, але в цьому випадку дуже багато залежить від процесора RAID контролера - наскільки він оптимально управляє дисками. Крім цього, можна распараллелить операції з дисками, просто збільшивши їх кількість. Грубо можна стверджувати, що SCSI RAID на трьох дисках при інших рівних умовах еквівалентний по продуктивності для множинних операцій з невеликими файлами / блоками даних (random read / write) SATA RAID з 6-8 дисками.

Звичайно, якщо заради підвищення продуктивності SATA ми змушені збільшувати кількість SATA дисків, то і вартість SATA RAID буде прагнути до вартості SCSI RAID. Але - ємність SATA RAID буде в рази більше. Іншими словами, якщо вам потрібно RAID 5 на 100 гігабайт видимої ємності для random операцій, то вигідніше і правильніше побудувати його на SCSI RAID. Якщо ж потрібно більш 1 терабайт видимої ємності, то рішення на 12 SATA дисках по 160 гігабайт буде помітно дешевше рішення на 5 SCSI дисках по 300 гігабайт кожен при практично тій же продуктивності.

Конструктивно зовнішні дискові масиви (їх ще називають системами зберігання даних) влаштовані просто - для підключення до комп'ютера використовується або SCSI Ultra320 або SAS (Serial Attached SCSI), або Fibre Channel 2/4 Gb, а для управління роботою масиву застосовується спеціалізований комп'ютер на базі спеціалізованого ж RISC процесора з оперативною пам'яттю від 256 мегабайт і внутрішньої шиною (шинами) PCI-X. Зрозуміло, що з точки зору комп'ютера, до якого підключається така система зберігання даних, це звичайне SCSI пристрій, що підтримує всі можливості SCSI інтерфейсу.

Тестування двох систем зберігання на різних процесорах, але з ідентичними жорсткими дисками, також доводить правоту цього твердження. Тому можна з усією відповідальністю стверджувати, що продуктивність системи зберігання даних залежить більшою мірою від процесора системи і кількості дисків, ніж від інтерфейсу і типу жорсткого диска.

надійність

Цілком очевидно, що для серверних систем масштабу підприємства надійність в багатьох випадках не менш важлива, ніж продуктивність. Втрата корпоративної бази даних навіть на кілька годин, необхідних для її відновлення з резервного носія, може обернутися для компанії багатомільйонними збитками. Історично вважається, що надійність вельми дорогих SCSI дисків значно перевищує надійність дешевих SATA дисків. Офіційні гарантійні терміни для SCSI дисків завжди були не менше 5 років, а на SATA диски тільки недавно стали встановлювати такі ж терміни гарантії. На жаль, нам невідомі достовірні джерела інформації про реальну статистику відмов жорстких дисків SATA в порівнянні з SCSI.

Але, навіть якщо вважати надійність SATA дисків свідомо нижчою, ніж у SCSI дисків, вартість SATA дисків дозволяє додати в RAID масив один або два диски для "гарячого" резерву без помітного подорожчання системи і / або використовувати RAID 6 / RAID TP. Для втрати даних на таких RAID з стоячи повинні вийти одночасно 3 або 4 диска. Тому надійність роботи RAID на SATA дисках в цілому можна зробити не нижче надійності RAID на SCSI дисках.

перспективи

устаткування

Компанія Intel, наприклад, збільшила кількість SATA портів до 6 (з 2-х) у всіх нових версіях своїх серверних платформ на платформі Bensley - SR1500 (1U), SR2500 (2U) і SC5400 (Desktop і 5U Rack). Практично всі імениті виробники серверного обладнання випускають моделі зовнішніх дискових масивів з SATA дисками. Що стосується власне виробників систем зберігання даних, таких як Maxtronic International, Medea Corporation, Enhance Technology, Infortrend, AXUS, Silicon Graphics Inc і багатьох інших, то вони вже давно випустили безліч моделей з підтримкою SATA дисків. У ряду виробників систем зберігання даних моделі на SCSI дисках просто відсутні в списку устаткування, що випускається.

інтерфейси

SAS (Serial Attached SCSI) - безумовний крок вперед у порівнянні з класичним паралельним SCSI інтерфейсом. У перспективі швидкість обміну даними між контролером SAS і диском (дисками) повинна досягти 12 Gb / s. На відміну від паралельного SCSI, у SAS кожен пристрій підключається до свого SAS порту, причому по полнодуплексная каналу, тобто з роздільними шинами введення і виведення. Інтерфейс повністю сумісний зверху вниз з SATA, тобто SATA диски зможуть працювати з SAS контролерами і в SAS кошиках (enclosure), але не навпаки.

Сфера застосування

Грубо можна розділити всі сфери застосування обговорюваних інтерфейсів на дві.

Друга сфера: бізнес - застосування. Множинний доступ до різних областей дисків, запис / зчитування даних невеликими (4-64 KB) блоками. До цієї сфери відноситься робота з базами даних, різні варіанти файл-серверів з великою кількістю користувачів. Тут потрібні високі швидкості випадкової (random) запису / читання. Поки в цій сфері в основному використовуються SCSI диски і масиви, але поступово SATA починає проникати і сюди. Складно сказати, чим і коли закінчиться це проникнення. Для вирішення завдань у цій сфері треба просто підбирати масив виходячи з даних навантаження на нього.

висновок

Аналітики і виробники жорстких дисків не раз передрікали стрічок кончину - tape must die. Однак їх прогнози виявилися настільки ж достовірні, як і обіцянки безпаперового суспільства. Кількість випущених стрічкових картриджів неухильно зростає, обчислюючи вже сотнями мільйонів. Розмір бізнесу, зв'язаність.

Чому пропадають дані Хоча надійність сучасних комп'ютерних систем в цілому досить висока, час від часу в них відбуваються збої, викликані несправністю апаратних засобів, помилками в програмному забезпеченні, комп'ютерними вірусами, а також помилками користувачів.

Протягом багатьох років основним інтерфейсом для підключення жорстких дисків до персонального комп'ютера був ATA (AT Attachment for Disk Drives - інтерфейс для підключення дискових накопичувачів для комп'ютерів PC AT), званий також IDE (Integrated Drive Electronics - накопичувач з вбудованим контролери.