Hardware

Comprensione deduplicazione dei dati

Deduplicazione dei dati è una tecnica usata per ridurre i requisiti di capacità di storage da sbarazzarsi di dati duplicati. Dopo tutto, se si dispone di più copie di un singolo file, hai davvero solo bisogno di memorizzare una versione di tale file, giusto? Purtroppo, computer generano spesso ridondante dei dati senza la vostra conoscenza. Per esempio, diciamo che tu hai creato un 100 megabyte presentazione PowerPoint e hanno inviato tramite email a dieci dei suoi colleghi. Il vostro programma di posta elettronica può archiviare tutti e dieci di quei messaggi in uscita, compresi tutti i dieci istanze di quella presentazione di 100 megabyte. Questo si traduce in quasi un intero gigabyte di dati ridondanti che non è necessario. Liberando che lo spazio inutilizzato può non sembrare un grosso problema per voi, ma Immaginate quanto spazio sprecato genera l'intera organizzazione.

Con deduplicazione, questo ridondante dei dati può essere eliminati poiché non è più necessaria. Una sola istanza rimane sulla periferica di memorizzazione, permettendo l'uso più efficiente del deposito in tutta la rete. Se siete preoccupati per i costi o le prestazioni di virtualizzazione del server SQL, ridurre la ridondanza può giocare un ruolo importante.

Per garantire che altri sistemi che originariamente riferimento dati duplicati sono in grado di richiamare i dati originali, deduplicazione dei dati crea un riferimento alla restante copia salvata. Ad esempio, se si mostra archiviate copie delle dieci email che hai inviato in precedenza, ognuno di loro punto la presentazione salvata 100 megabyte e non una copia inutile, ridondante.

Non solo è deduplica grande per il recupero di capacità di archiviazione, si risparmia il tuo denaro di organizzazione. Dopo tutto, se il vostro hard disk array riempire con dati inutili senza la vostra conoscenza, vi troverete acquisto più array di dischi. Tramite la deduplicazione, è possibile spremere ulteriori capacità i sistemi di archiviazione esistenti e posticipare spese aggiuntive. Inoltre, deduplication riduce al minimo i dati che devono essere eseguiti il backup, consentendo più veloce, più efficiente backup. Se si paga per il servizio di backup su una base al megabyte o gigabyte, deduplicazione dei dati può ridurre drasticamente i costi di backup pure.

Mentre la deduplicazione file gioca una parte, deduplicazione dei dati avviene anche a livello di blocco. File individui sono esaminati e trattati con iterazioni univoca di ogni blocco del file etichettati e salvati in un indice. Ogni volta che un file viene modificato, vengono salvati solo i blocchi di dati modificati. Ad esempio, se si modifica una singola diapositiva nel file PowerPoint 100 megabyte, solo i blocchi interessati vengono salvati - non il file intero 100 megabyte. Deduplicazione dei dati blocco richiede più potenza di elaborazione di deduplicazione dei dati a livello di file, ma è molto più efficiente. Molti gli sviluppatori di soluzioni di deduplicazione dei dati, utilizzano una combinazione di algoritmi ed esaminare i metadati di un file per evitare la possibilità di "falsi positivi", che può provocare un blocco riceve lo stesso numero di identificazione di un blocco esistente.

Deduplicazione dei dati è un modo efficace per ridurre i requisiti di capacità di archiviazione e i costi associati. Di solito è una delle diverse tecniche di riduzione di dati che vengono utilizzati insieme per ottimizzare la conservazione e ridurre i costi in un'archiviazione aziendale o ambiente di virtualizzazione del server SQL.