Zfs deduplication consiste nella rimozione di copie di dati identici.
Ogni volta che un blocco dev’essere scritto su disco viene calcolato un hash per la scrittura, se l’hash è già presente significa che il dato è duplicato e non serve scriverlo nuovamente.
Se qualcuno stesse pensando alle possibilità di collisione dell’algoritmo di hash le probabilità sono, nel caso di SHA-256, 50 ordini di grandezza inferiore ad un errore non corretto e non riconosciuto sulla macchina più affidabile che potete acquistare oggi.
Nonostante questo è possibile scegliere il proprio algoritmo preferito ed affiancarlo ad un controllo opzionale per controllare se si tratta di una collisione. In questo caso si può usare l’algoritmo fletcher4 abbinato all’opzione verify.
Via | Sun
Andrea R
07 nov 2009 - 11:05 - #1Ma siamo sicuri che le probabilità siano veramente così basse? Non c’è l’effetto compleanno in questo caso?
BadTux
07 nov 2009 - 12:05 - #2Basta anche solo l’effetto Sfiga ;)
Comuqnue l’idea più interessante serebbe fletcher4 per lookup e sha256 per verificare anziché controllare byte per byte.