Як працює дедуплікація
Як працює дедуплікація
Під час резервного копіювання в дедупліцірующее сховище агент Acronis Backup Recovery 11 обчислює цифровий відбиток кожного блоку даних. Такий цифровий відбиток зазвичай називають хеш-значенням.
Перш ніж відправити блок даних в сховищі, агент запитує базу даних дедуплікаціі, чи немає вже в цьому сховищі блоку з таким хеш-значенням. Якщо так, то агент відправляє тільки хеш-значення елемента. В іншому випадку відправляється сам блок. Вузол зберігання зберігає отримані блоки даних в тимчасовому файлі.
Деякі дані, такі як зашифровані файли або дискові блоки нестандартного розміру, не можуть бути дедупліціровани. Агент завжди передає такі дані в сховище без обчислення їх хеш-значень. Додаткові відомості про обмеження дедуплікаціі см. В розділі Обмеження дедуплікаціі.
По завершенні процесу дедуплікаціі сховище містить отриману в результаті резервну копію і тимчасовий файл з унікальними блоками даних. Тимчасовий файл обробляється на наступному етапі. Резервна копія (TIB-файл) містить хеш-значення і дані, які не вдалося дедупліціровать. Подальша обробка цієї резервної копії не потрібно. Вона готова для відновлення даних з неї.
- Блоки даних переміщаються з тимчасового файлу в спеціальний файл в сховище, при цьому елементи, що повторюються зберігаються тільки один раз. Цей файл називається папкою дедупліцірованних даних.
- Хеш-значення і посилання, необхідні для «зборки» дедупліцірованних даних, зберігаються в базі даних дедуплікаціі.
- Після переміщення всіх блоків даних тимчасовий файл видаляється.
В результаті сховище даних містить деяку кількість унікальних блоків даних. На кожен блок вказує одна або кілька посилань з резервних копій. Ці посилання зберігаються в базі даних дедуплікаціі. Резервні копії залишаються без змін. Вони містять хеш-значення і дані, які не вдалося дедупліціровать.
На наступній діаграмі показаний результат дедуплікаціі в місці призначення.

Після видалення хоча б однієї резервної копії або архіву зі сховища як вручну, так і в процесі очищення, в сховище можуть залишитися блоки, на які не посилається жоден архів. Такі блоки видаляються завданням на ущільнення. яке виконується вузлом зберігання за розкладом.
Видалення блоків є ресурсномісткої операцією, тому завдання ущільнення виконується тільки при накопиченні значного обсягу підлягають видаленню даних. Граничний обсяг визначається параметром конфігурації Compacting Trigger Threshold (Поріг для включення стиснення).