Надежность дедуплицированных данных. Небольшое тестирование.

  • Автор:

dedup-reliability-000.jpgДедупликация в Windows Server сравнительно новая технология и многие администраторы относятся к ней с вполне обоснованным опасением. Действительно, пока не накоплен соответствующий опыт, касающийся надежности дедуплицированных томов, проверять ее на своих данных как-то не тянет. Поэтому мы решили провести небольшое тестирование, которое должно ответить на некоторые актуальные вопросы.

Онлайн-курс по устройству компьютерных сетей
На углубленном курсе "Архитектура современных компьютерных сетей" вы с нуля научитесь работать с Wireshark и «под микроскопом» изучите работу сетевых протоколов. На протяжении курса надо будет выполнить более пятидесяти лабораторных работ в Wireshark.

Основной вопрос, который волнует многих администраторов - а что будет если дедуплицированный том будет подключен к системе без поддержки данной технологии и с ним будут выполнены какие-либо действия? Например проверка тома с исправлением ошибок или попытка перемещения, копирования или иного изменения данных. Тем более что в сети стали появляться тревожные сообщения:

dedup-reliability-001.jpgДействительно ли проверка утилитой chkdsk на системе без поддержки дедупликации разрушает данные? Попробуем разобраться. Прежде всего немного теории. 

Как работает дедупликация? Общие блоки файлов выносятся в специальное хранилище и заменяются ссылкой. Никаких новых сущностей на уровне файловой системы не создается, хранилище общих блоков в System Volume Information - набор обычных файлов, а ссылки в NTFS поддерживаются начиная с NT 4. Теоретически любая система, умеющая работать с NTFS, не должна находить на дедуплицированных томах ничего странного и тем более не должна повреждать данные.

Перейдем от теории к практике. Мы взяли внешний диск, отформатировали его под NTFS и разместили на нем три папки с одинаковыми данными. Затем подключили этот том к Windows Server 2012 и дедуплицировали его.

dedup-reliability-002.jpgСтоит отметить, что имея три абсолютно одинаковых набора данных мы ожидали увидеть степень дедупликации 67% (возраст данных был выставлен как ноль), но дедуплицированы оказались не все файлы. В итоге мы получили смесь из оптимизированных и неоптимизированных файлов, что даже интересней.

После чего данный диск был подключен к Windows XP SP3 и проверен утилитой chkdsk.

dedup-reliability-003.jpgПосле чего вернули том обратно в среду Windows Server 2012 и проверили данные. Как мы и предполагали, с ними ничего не произошло. Снова подключив диск к Windows XP мы попробовали прочитать данные. Неоптимизированные файлы спокойно открывались, копировались и перемещались, а оптимизированные выдавали ошибку доступа.

dedup-reliability-004.jpgТо есть даже при всем желании каким-либо образом изменить или переместить дедуплицированные данные в системе без поддержки данной технологии у вас не получится. При этом никакой угрозы самим данным данные попытки не несут.

Затем мы повторили все эти операции для Windows 7.

dedup-reliability-005.jpgС тем же самым результатом. Ни проверка, ни безуспешная попытка изменить оптимизированные данные не несет им никакой угрозы.

Для полноты картины мы не поленились подключить данный диск к Windows NT 4, хотя с практической точки зрения такая ситуация сегодня малореальна.

dedup-reliability-006.jpgСобственно, ничего нового мы не увидели, оптимизированные данные по прежнему недоступны, неоптимизированные доступны, а chkdsk корректно распознал старшую версию NTFS и проверять ее отказался.

Следующим шагом было подключение нашего диска к альтернативным ОС. Ubuntu корректно подключило NTFS том, показав оптимизированные файлы как символьные ссылки, наглядно предоставив возможность оценить степень оптимизации.

dedup-reliability-007.jpgОпять таки работа с томом происходит предельно корректно, оптимизированные данные для изменения недоступны.

Аналогичная картина наблюдается и в среде MacOS X.

dedup-reliability-008.jpgНаш небольшой эксперимент только подтвердил теоретические выкладки, дедупликация не создает никаких новых сущностей на уровне файловой системы, а следовательно всё, что умеет работать с NTFS будет корректно воспринимать такие тома и никаких дополнительных угроз целостности данных при этом не возникает. А появляющиеся в сети "тревожные" сообщения мы склонны рассматривать как некорректные выводы из принципиально иных ситуаций.

Как видим, дедупликация не добавляет никаких новых рисков для ваших данных и может быть смело рекомендована к использованию.

Онлайн-курс по устройству компьютерных сетей
На углубленном курсе "Архитектура современных компьютерных сетей" вы с нуля научитесь работать с Wireshark и «под микроскопом» изучите работу сетевых протоколов. На протяжении курса надо будет выполнить более пятидесяти лабораторных работ в Wireshark.


Loading Comments