Ono to nie je uplne to iste, procesor neprecita 4byte ptz ta instrukcia ma len 2byty. Aj keby precital naraz 4byty tak zvysne 2byty su uz z dalsej instrukcie (instrukcie nie su zarovnavane), co moze byt (nemusi) vyhoda.
Ak by pouzil integer tak to bude
mov eax,0
a tato instrukcia ma 5 bytov takze moze(nemusi, zavisi od vnutornej architektury CPU a od konkretneho stavu cache apod.) to trvat dlhsie.
P.S. tiez si myslim ze sa zaobera nie moc podstatnymi vecami, a ktovie ako je napisany algoritmus (a najvacsie mnozstvo optimalizacie sa da urobit hlavne v algoritme, sposobe ulozenia dat atd., to su podstatne veci).