Procesor skutečně přečte vždy 4 byte, míň prostě neumí. Když další dva byte nepotřebuje, v tichosti je ignoruje. Proto je důležité zarovnávání adres, aby to přečetl jedním taktem.
PS: Tak ale programovat opravdu, ale opravdu nejde. Dřív, než takový optimální algoritmus někdo vyprodukuje, přijde rychlejší procesor a námaha vyzní nadarmo .