Logo Blogo

ZFS deduplication elimima automaticamente i duplicati su disco

Pubblicato: 07 nov 2009 da Lpt on fire!

Zfs deduplication consiste nella rimozione di copie di dati identici.

Ogni volta che un blocco dev’essere scritto su disco viene calcolato un hash per la scrittura, se l’hash è già presente significa che il dato è duplicato e non serve scriverlo nuovamente.

Se qualcuno stesse pensando alle possibilità di collisione dell’algoritmo di hash le probabilità sono, nel caso di SHA-256, 50 ordini di grandezza inferiore ad un errore non corretto e non riconosciuto sulla macchina più affidabile che potete acquistare oggi.

Nonostante questo è possibile scegliere il proprio algoritmo preferito ed affiancarlo ad un controllo opzionale per controllare se si tratta di una collisione. In questo caso si può usare l’algoritmo fletcher4 abbinato all’opzione verify.

Via | Sun

1 stelle2 stelle3 stelle4 stelle5 stelle (1 Voti | Media: 5 su 5)
condividi condividi
2 commenti

Commenti dei lettori

(Inserisci un commento - Nascondi commenti anonimi)
  • Andrea R

    07 nov 2009 - 11:05 - #1
    0 punti
    Up Down

    Ma siamo sicuri che le probabilità siano veramente così basse? Non c’è l’effetto compleanno in questo caso?

  • BadTux

    07 nov 2009 - 12:05 - #2
    0 punti
    Up Down

    Basta anche solo l’effetto Sfiga ;)

    Comuqnue l’idea più interessante serebbe fletcher4 per lookup e sha256 per verificare anziché controllare byte per byte.

L'email è richiesta ma non verrà mostrata ai visitatori.
Commenta questo articolo

Registrati per riservare il tuo nickname preferito su tutti i blog di Blogo e per caricare il tuo avatar. Se sei già registrato, effettua il login per usare il tuo nickname.

Si No
I commenti sono sottoposti alle linee guida per la moderazione.

Anteprima del commento