Fault tolerance

Суть в тому, що ми робимо копію ВМ на іншому хості. Ця копія робиться, фактично, за допомогою процесу vMotion. Але якщо при міграції vMotion у нас вихідна ВМ видаляється, і залишається тільки перенесена, то в разі налаштування FT для ВМ залишаються обидві. Тобто
  • Крок 1 - створити копію працюючій ВМ (де факто - вміст оперативної пам'яті) на іншому хості.
  • Крок 2 - безперервно синхронізуються процесорні інструкції. Тобто наша ВМ працює, на процесорі що то там робиться - і ці інструкції по мережі передаються на інший хост, на копію цієї ВМ. Таким чином, вона все все повторює за оригінальною віртуалкою.
  • Крок 3 - в разі апаратного збою сервера з оригіналом, в мережу випускається копія (до того вона, зрозуміло, до мережі доступу не має). (Можемо, до речі, таке перенесення ініціювати ручками, за бажанням - тоді ВМ просто міняються ролями)
І все.

Обмеження, умови та особливості:
  • ВМ не захищена від програмного збою. BSOD в оригінальній ВМ передатись і відтвориться в копії.
  • Ніяких умов або модифікації для гостьових ОС і ПО.
  • Працює на стандратною x86 залозі. Є умова на процесори в зв'язці з гостьовими ОС:
    див. статтю в KB Processors and guest operating systems that support VMware Fault Tolerance.
  • Не можна використовувати vSMP у віртуальній машині - в ВМ може бути тільки 1 vCPU
  • ВМ не може мати снапшотов
  • Диски ВМ не можуть бути «тонкими» або RDM-дисками в режимі "physical compatibility"
  • Повинні бути відсутнім приєднані пристрої VMDirectPath
  • Не можна використовувати Storage VMotion
  • Не можна додавати ресурси під час роботи (hot add)
  • Немає підтримки Nested Page Tables / Extended Page Tables (NPT / EPT)
  • Немає підтримки NPIV
  • Віртуальні машини не можуть бути кластерізовани засобами MSCS \ MFC
  • Гостьова ОС не повинна бути з паравіртуалізованним ядром
Більш повний список тут - VMware Fault Tolerance Requirements and Limitations.

Рекомендації по використанню VMware Fault Tolerance в VMare vSphere.
  • Після збою сервера можливо автоматичне повернення в відмовостійке стан -
    • оригінальна ВМ померла
    • провідною стала копія
    • для неї створюється копія на якому то іншому з працюючих хостів - притому з врахуванням побажань HA \ DRS


  • vLockstep Technology - так називається технологія, що дозволяє виконувати одну і ту ж послідовність інструкцій на двох хостах.
    картинка з whitepaper
  • Fault tolerance

    Fault tolerance

    Может пригодится для траблшутінга FT - FT Problem Decoder Chart.