Дедупликация данных — это метод, используемый для уменьшения требований к емкости хранения, избавившись от повторяющихся данных. В конце концов, если у вас есть несколько копий одного файла вам действительно нужно только хранить одну версию этого файла, правильно? К сожалению компьютеры часто создают избыточные данные без вашего ведома. Например допустим, вы создали 100 мегабайт презентации PowerPoint и его по электронной почте до десяти ваших коллег. Ваша программа электронной почты может архивировать все десять из этих исходящих сообщений, включая все десять экземпляров этой презентации 100 мегабайт. Это приводит к почти весь гигабайт избыточные данные, которые вам не нужно. Высвободить что неиспользуемого пространства не может показаться как крупная сделка для вас, но представьте себе как много неиспользуемого пространства, генерирует всей Организации.
С дедупликации это избыточные данные могут быть устранены, поскольку больше не требуется. Только один экземпляр остается на устройстве хранения, что позволяет для более эффективного использования для хранения всей вашей сети. Являетесь ли вы обеспокоены стоимость или производительности SQL server виртуализации, сокращения избыточности может играть важную роль.
Чтобы убедиться, что другие системы, которые первоначально ссылки дублирующиеся данные способны вызвать исходных данных, дедупликация данных создает ссылку на оставшиеся сохраненной копии. Например если вы просматриваете архивные копии десяти писем, отправленных ранее, каждый из них будет указывать представление сохраненного 100 мегабайт и не ненужных, избыточных копию.
Это не только дедупликации отлично подходит для восстановления емкость, это экономит ваши деньги Организации. В конце концов если ваш жесткий диск массивы заполнить с ненужных данных без вашего ведома, вы сможете найти себе покупать больше дисковых массивов. С помощью дедупликации, можно выжать больше емкости из существующих систем хранения и отложить дополнительные расходы. Кроме того Дедупликация минимизирует данные, которые должны быть подкреплены, позволяя быстрее, более эффективные резервные копии. Если вы платите за вашей резервной службы на каждого мегабайт или гигабайт, дедупликация данных может хлестать ваши резервной цены.
В то время как дедупликации файлов играет роль, дедупликация данных также имеет место на уровне блоков. Лица файлы рассмотрены и обработаны с уникальными итераций каждого блока файла помечены и сохранены в индекс. При изменении файла сохраняются только измененных данных блоков. Например если вы редактируете один слайд в файле PowerPoint 100 мегабайт, только пострадавших блоков сохраняются - не файл всего 100 мегабайт. Блок дедупликации данных требует больше вычислительной мощности, чем дедупликации данных на уровне файлов, но это гораздо более эффективно. Многие разработчики решений дедупликации данных используется сочетание алгоритмов и изучить метаданные файла, чтобы избежать возможности «ложных срабатываний», которые могут привести, если блок получает тот же идентификационный номер существующего блока.
Дедупликация данных является эффективным способом для уменьшения требований к емкости хранения и связанные с этим расходы. Обычно, это один из нескольких методов сокращения данных, которые используются вместе для оптимизации хранения и снижения затрат в хранения предприятия или виртуализации среды SQL server.