Дедупликация в Windows Server сравнительно новая технология и многие администраторы относятся к ней с вполне обоснованным опасением. Действительно, пока не накоплен соответствующий опыт, касающийся надежности дедуплицированных томов, проверять ее на своих данных как-то не тянет. Поэтому мы решили провести небольшое тестирование, которое должно ответить на некоторые актуальные вопросы.
Онлайн-курс по устройству компьютерных сетей
На углубленном курсе "Архитектура современных компьютерных сетей" вы с нуля научитесь работать с Wireshark и «под микроскопом» изучите работу сетевых протоколов. На протяжении курса надо будет выполнить более пятидесяти лабораторных работ в Wireshark.
Основной вопрос, который волнует многих администраторов - а что будет если дедуплицированный том будет подключен к системе без поддержки данной технологии и с ним будут выполнены какие-либо действия? Например проверка тома с исправлением ошибок или попытка перемещения, копирования или иного изменения данных. Тем более что в сети стали появляться тревожные сообщения:
Действительно ли проверка утилитой chkdsk на системе без поддержки дедупликации разрушает данные? Попробуем разобраться. Прежде всего немного теории.
Как работает дедупликация? Общие блоки файлов выносятся в специальное хранилище и заменяются ссылкой. Никаких новых сущностей на уровне файловой системы не создается, хранилище общих блоков в System Volume Information - набор обычных файлов, а ссылки в NTFS поддерживаются начиная с NT 4. Теоретически любая система, умеющая работать с NTFS, не должна находить на дедуплицированных томах ничего странного и тем более не должна повреждать данные.
Перейдем от теории к практике. Мы взяли внешний диск, отформатировали его под NTFS и разместили на нем три папки с одинаковыми данными. Затем подключили этот том к Windows Server 2012 и дедуплицировали его.
Стоит отметить, что имея три абсолютно одинаковых набора данных мы ожидали увидеть степень дедупликации 67% (возраст данных был выставлен как ноль), но дедуплицированы оказались не все файлы. В итоге мы получили смесь из оптимизированных и неоптимизированных файлов, что даже интересней.
После чего данный диск был подключен к Windows XP SP3 и проверен утилитой chkdsk.
После чего вернули том обратно в среду Windows Server 2012 и проверили данные. Как мы и предполагали, с ними ничего не произошло. Снова подключив диск к Windows XP мы попробовали прочитать данные. Неоптимизированные файлы спокойно открывались, копировались и перемещались, а оптимизированные выдавали ошибку доступа.
То есть даже при всем желании каким-либо образом изменить или переместить дедуплицированные данные в системе без поддержки данной технологии у вас не получится. При этом никакой угрозы самим данным данные попытки не несут.
Затем мы повторили все эти операции для Windows 7.
С тем же самым результатом. Ни проверка, ни безуспешная попытка изменить оптимизированные данные не несет им никакой угрозы.
Для полноты картины мы не поленились подключить данный диск к Windows NT 4, хотя с практической точки зрения такая ситуация сегодня малореальна.
Собственно, ничего нового мы не увидели, оптимизированные данные по прежнему недоступны, неоптимизированные доступны, а chkdsk корректно распознал старшую версию NTFS и проверять ее отказался.
Следующим шагом было подключение нашего диска к альтернативным ОС. Ubuntu корректно подключило NTFS том, показав оптимизированные файлы как символьные ссылки, наглядно предоставив возможность оценить степень оптимизации.
Опять таки работа с томом происходит предельно корректно, оптимизированные данные для изменения недоступны.
Аналогичная картина наблюдается и в среде MacOS X.
Наш небольшой эксперимент только подтвердил теоретические выкладки, дедупликация не создает никаких новых сущностей на уровне файловой системы, а следовательно всё, что умеет работать с NTFS будет корректно воспринимать такие тома и никаких дополнительных угроз целостности данных при этом не возникает. А появляющиеся в сети "тревожные" сообщения мы склонны рассматривать как некорректные выводы из принципиально иных ситуаций.
Как видим, дедупликация не добавляет никаких новых рисков для ваших данных и может быть смело рекомендована к использованию.
Онлайн-курс по устройству компьютерных сетей
На углубленном курсе "Архитектура современных компьютерных сетей" вы с нуля научитесь работать с Wireshark и «под микроскопом» изучите работу сетевых протоколов. На протяжении курса надо будет выполнить более пятидесяти лабораторных работ в Wireshark.
Последние комментарии