Computer-Hardware

Verständnis Datendeduplizierung

Datendeduplizierung ist eine Technik, um Speicherkapazitätsanforderungen zu reduzieren, indem doppelte Daten loszuwerden. Nach allem, wenn Sie mehrere Kopien einer einzelnen Datei, haben Sie wirklich nur noch zum Speichern einer Version dieser Datei, richtig? Computer generieren leider häufig redundante Daten ohne Ihr wissen. Zum Beispiel nehmen wir an Sie ein 100 Megabyte PowerPoint-Präsentation erstellt haben, und haben es bis zehn Ihrer Kollegen per e-Mail. Ihr e-Mail-Programm kann alle zehn dieser ausgehenden Nachrichten, einschließlich alle zehn Instanzen das 100 MB-Präsentation archivieren. Das bedeutet fast eine gesamte Gigabyte redundante Daten, die Sie nicht benötigen. Freisetzen, dass unnötig belegtem Speicherplatz eine große Sache für Sie nicht mag, aber stellen Sie wie viel Platzverschwendung Ihr gesamte Unternehmen generiert vor.

Mit Deduplizierung können diese redundanten Daten gelöscht werden, da es nicht mehr erforderlich ist. Nur eine Instanz bleibt auf dem Speichergerät, ermöglicht eine effizientere Nutzung des Speichers im gesamten Netzwerk. Egal, ob Sie besorgt über Kosten oder SQL-Server-Virtualisierungs-Performance kann die Verringerung der Redundanz eine wichtige Rolle spielen.

Um sicherzustellen, dass andere Systeme, die ursprünglich doppelte Daten verwiesen die ursprünglichen Daten aufrufen können, erstellt die Datendeduplizierung einen Verweis auf die verbleibenden gespeicherte Kopie. Beispielsweise wenn Sie archivierte Kopien der zehn e-Mails, die Sie früher gesendet anzeigen, wird jeder von ihnen auf die gespeicherten 100 Megabyte-Präsentation und keine unnötige, redundante Kopie zeigen.

Nicht nur Deduplizierung ist ideal für die Wiederherstellung von Speicherkapazität, es spart Ihre Organisation Geld. Schließlich, wenn Ihre Festplatten-Arrays sich mit unnötigen Daten ohne Ihr Wissen füllen, finden Sie sich weitere Festplatten-Arrays zu kaufen. Mithilfe von Deduplizierung können Sie drücken Sie mehr Kapazität aus Ihrem vorhandenen Storage-Systeme und Mehraufwendungen zu verschieben. Deduplizierung minimiert zusätzlich die Daten, die gesichert werden müssen damit schneller, effizientere Backups. Wenn Sie zahlen für Ihre backup-Service auf eine pro Megabyte oder Gigabyte, kann Datendeduplizierung Ihrer backup-Kosten sowie Schrägstrich.

Während Datei Deduplizierung eine Rolle spielt, findet die Datendeduplizierung auch auf Blockebene. Personen Dateien werden geprüft und verarbeitet mit einzigartigen Iterationen jeder Block der Datei mit der Bezeichnung und in einen Index gespeichert. Sobald eine Datei geändert wird, werden nur die geänderten Datenblöcke gespeichert. Beispielsweise wenn Sie eine einzelne Folie in Ihrer 100 Megabyte-PowerPoint-Datei bearbeiten, werden nur die betroffenen Blöcke gespeichert - nicht die gesamten 100 MB Datei. Block Datendeduplizierung erfordert mehr Rechenleistung als auf Dateiebene Datendeduplizierung, aber es ist viel effizienter. Viele Daten-Deduplizierung-Lösungsentwickler verwenden eine Mischung aus Algorithmen und untersuchen eine Datei-Metadaten, um die Gefahr von "false Positives", was führen kann, wenn ein Block die gleiche Identifikationsnummer als vorhandenen Block erhält.

Datendeduplizierung ist ein wirksames Mittel zur Reduzierung von Speicherkapazitätsanforderungen und damit verbundenen Kosten. Es ist normalerweise eine von mehreren Daten-Reduktion-Techniken, die zusammen verwendet werden, um Speicher zu optimieren und senken in einem Enterprise-Speicher oder SQL-Server-Virtualisierung-Umgebung.