Rychly binarni diff
Jan Pechanec
jp at devnull.cz
Wed Feb 17 21:01:25 CET 2010
On Wed, 17 Feb 2010, Dan Lukes wrote:
> A jestli ne ?
>
> Zalezi jestli budou soubory casteji shodne nebo casteji ruzne. Pokud se da
> ocekavat, ze budou vetsinou ruzne, pak si muzeme dovolit v pripade shodneho
> hashe soubory skutecne 1:1 porovnat. Nebudeme to delat casto.
>
> Pokud se naopak da ocekavat, ze soubory jsou vetsinou shodne je vhodnejsi jiny
> postup - spocitat druhy hash jinym algoritmem. Treba md4 (u me 11 sekund).
pravdepodobnost, ze nahodne vybrane 2 soubory budou mit stejny MD5
hash, je 1/2^128, je to tak? Ruznych moznosti, jak to vyjde, je 2^128*2^128,
a moznosti, kdy je hash stejny, je 1^128. Z toho mi vychazi 1/2^128.
je "potreba" dal kontrolovat? Pokud ano, to uz asi je potreba
kontrolovat bajt po bajtu, protoze ani 2 nebo 3 ruzny algoritmy uz nemusi
stacit.
muze se nam stat chyba pokud pouzijeme hash? Samozrejme muze, ja
nerekl ze ne. Ale stejne jako u bezpecnosti, nejslabsi clanek je ten
rozhodujici. MD5 to zde opravdu neni.
> Pravdepodobnost simultanni kolize dvou ruznych algoritmu na neshodnych datech
> je uz opravdu velice mala.
ja si nemyslim, ze udelat dalsi sumu neni fajn, ale opravdu si
myslim, ze je to v uvazovanym pripade naprosto zbytecny.
h.
--
Jan Pechanec <jp (at) devnull (dot) cz>
http://www.devnull.cz
More information about the Users-l
mailing list