sprava pameti / volna pamet
Dan Lukes
dan at obluda.cz
Thu Aug 10 12:55:49 CEST 2006
Divacky Roman napsal/wrote, On 08/10/06 10:21:
>> to proto, ze kdyz mam dva stroje, jeden s 512MB a druhy 1GB ram a pustim
>> na nich stejny zatezovy test, ktery zapisuje na disk a zpetne cte a
>> porovnava md5 velke soubory porad dokola, po chvili behu dojde veskera
>> volna pamet, ale samozrejme se nezacne swapovat
> v pripade "md5 big_file" si myslim ze (neznam algoritmus md5) veskera pamet se
> spotrebuje pouze na cachovani toho souboru.
MD5 ma konstantni pametovou narocnost (nezavislou na celkove velikosti
dat, ze kterych se hash pocita). To mimochodem plati snad pro vsechny
hashovaci algoritmy.
> coz stejne ale nedava moc smysl pokud
> je md5 proudovy hash (tj. cte soubor sekvence a kazdy bajt jen jednou)
Ale dava - kdy bys chtel bloky souboru umistoval do cache ?
Well - lepsi algoritmus by mohlo byt je do cache umistovat teprve
tehdy, kdyz je nekdo v kratke dobe chce podruje - to by bylo vystaveno
na teorii, ze jeden pristup k souboru muze byt "nahoda", ale kdyz s e k
nemu pristupuje dvakrat, tak je asi casteji pouzivany a mel by byt v cache.
Ale - zaprve - o tom predpokladu by bylo mozne diskutovat a za druhe,
bylo by to daleko narocnejsi (byla by potreba si pamatovat, ktere bloky
disky byly v dobe nedavne pozadovany, lec nebyly ulozeny do cache) a je
otazka, jestli by overhead teto logiky nebyl vetsi nez vykon
efektivnejsim cacheovanim ziskany ...
Takze - cteny soubor se proste uklada do cache, kdyby ho chtel nekdo
znovu. To, ze duvod jeho cteni je vypocet MD5 hashe - a tedy soubor v
dohledne dobe zrejem nikdo chtit nebude - to system nevi (a navic je to
stejne diskutabilni hypoteza).
Nevim, jestli by to systemu slo nejak rict - treba pomoci O_DIRECT.
Obavam se, ze ne, to je jina uroven cacheovani.
Dan
--
Dan Lukes SISAL MFF UK
AKA: dan at obluda.cz, dan at freebsd.cz,dan at kolej.mff.cuni.cz
More information about the Users-l
mailing list