Моніторинг жорстких дисків за допомогою smart, частина 2

За допомогою команди smartctl -t offline можна запустити оффлайн-тестування. Такі тести з'явилися ще з часів стандарту SFF-8035i і оновлюють значення тих атрибутів, що не оновлюються в процесі нормальної роботи диска (див. Стовпець UPDATED). Деякі диски підтримують автоматичне оффлайн-тестування, що виконується кожні кілька годин після його включення командою smartctl -o on.

SMART надає механізм моніторингу параметрів продуктивності диска. Однак є суттєва проблема, яка полягає в тому, що не існує механізму, за допомогою якого можна було б безпосередньо повідомляти операційну систему про виникаючі проблеми. А оскільки SMART-моніторинг зазвичай не налаштовується за замовчуванням, то багато явні проблеми не виявляються на ранніх етапах, що часто призводить до плачевних наслідків. Звичайно ж, ви можете регулярно самостійно вручну відстежувати стан дисків за допомогою smartctl. однак це досить нудне і виснажливе заняття.

# /etc/smartd.conf config file

/ Dev / hda - S on - o on - a - I 194 - m sense @ phys. uwm. edu

/ Dev / hdc - S on - o on - a - I 194 - m sense @ phys. uwm. edu

Зазвичай smartd запускається за допомогою традиційного UNIX-механізму init. Наприклад, в RedHat для запуску і зупинки smartd використовуються команди /etc/rc.d/init.d/smartd start і /etc/rc.d/init.d/smartd stop.

Що робити, якщо при роботі диска стали проявлятися проблеми? Що робити, якщо результати самотестування повідомляють про помилку або SMART-статус життєво-важливих параметрів диска знаходиться в помилковому стані? Почніть з того, що як можна швидше перемістіть всі важливі дані на іншу систему. Потім запустіть розширене самотестування диска і подивіться, чи виникають помилки на тих же самих блоках. Якщо це так, значить з диском коїться щось недобре. Якщо SMART повідомляє вам про помилки, але диск ще знаходиться на гарантії, вам повинні без проблем його замінити. Якщо диск не може виконати самотестування, можна спробувати пошукати спеціальне ПЗ, іноді надається виробниками, наприклад, PowerMax від Maxtor або Drive Fitness Test від IBM. Іноді такі програми можуть допомогти запобігти втраті даних за рахунок блокування пошкоджених блоків. А іноді за допомогою них можна отримати спеціальний код, який допоможе вам отримати заміну поганого диска.

У цій статті розглянуті лише основи роботи з smartmontools. Якщо вам необхідно більше інформації, ви завжди можете звернутися до man-сторінок, веб-сайту проекту або ж задати питання в список розсилки. Не забувайте, що використання smartmontools не рятує вас від необхідності робити резервні копії даних. SMART не може запобігти всім можливим збої в роботі жорстких дисків, проте часто дає ключ до того, що з вашим диском відбувається щось недобре, а це, в свою чергу, допоможе вам підвищити стабільність роботи вашої системи.

Розробники портувала smartmontools на FreeBSD. Darwin і Solaris. а також додали деякі розширення, що дозволяють, наприклад, спостерігати за дисками, які перебувають за RAID-контролером. Якщо ви бажаєте взяти участь в розробці, просто напишіть про це в списку розсилки smartmontools. Особливо корисними для розробників будуть дані про диски, яких ще немає в базі даних smartmontools.