Další věc je komprese - ta může nebýt, být bezztrátová, nebo ztrátová (a podle toho je výsledný soubor obrovský, velký, nebo malý a nekvalitní). Přičemž i ta ztrátovost se dá většinou nějak nastavit (když se to komprimuje) - pro klasickou hudbu chceš malé ztráty, pro jednoduchý diktát se smíříš i s velkou ztrátou, pokud výsledek bude hodně zdrcnutý.
Jak jsem psal výš, tak v počítači máš všechno uloženo jako čísla "nuly a jedničky" - jak hudbu, tak programy, tak text, prostě všechno. Takže se i na text nebo hudbu můžeš koukat jako na čísla a naopak, jak se ti to zrovna hodí. Pojďme si ukázat, jak to s tou kompresí je:
Něco jako zvuk může vypadat třeba takto (písmena jsou hlasitost, A je minimum, I je maximum - je to taková jakoby sinusovka)
BBBBBBBBCCCCCCDDDEFFFGGGGGGHHHHHHHHGGGGGGFFFEDDDCCCCCCBBBBBBBB BBBBBBBBCCCCCCDDDEFFFGGGGGGHHHHHHHHGGGGGGFFFEDDDCCCCCCBBBBBBBB - nekomprimovaný formát 124 hodnot
2x(8B6C3D1E3F6G8H6G3F1E3D6C8B) - komprimovaný (neztrátově) formát 30 hodnot
Kam se ztratilo 124-30=94 hodnot? A odkud se zase vzaly zpátky po dekompresi? To je špatně položená otázka - prostě je vidět, že nějaké věci se opakují a je tedy kratší to psát jako dvojice (počet opakování, hodnota) a vyjde to celkově menší, i když pro ty E, které tam jsou za sebou jen jednou je zápis 1E delší.
Ale převádět to tam a zpátky není problém, je vidět, že je to pořád to samé.
Teď tam přidám trochu barvy do té sinusovky - dám tam vyšší frekvenci, ale slabší - každou 4. střídavě snížím nebo zvýším o jedna
BBBABBBCCCCBCCDEDEFEFGGHGGGIHHHGHHHHGGGFGFFGEDDCCCCDCCBABBBCBB BBBABBBCCCCBCCDEDEFEFGGHGGGIHHHGHHHHGGGFGFFGEDDCCCCDCCBABBBCBB - nekomprimovaný formát s namotanou sinusovkou (každá 4. hodnota je střídavě o jednu níž, nebo výš) 124 hodnot
2x(3B1A3B4C1B2C1D1E1D1E1F1E1F2G1H3G1I3H1G4H3G1F1G2F1G1E2D4C1D2C1B1A3B1C2B) - bezztrátová komprese 74 hodnot - tady mi ty malé výkyvy už docela vadí, zkusím osamělé hodnoty připojit k té následující:
2x(8B6C3D4F6G8H6G3F4D6C8B) - ztrátová komprese 26 hodnot - hele, ono se to docela zkrátilo, zkusme to rozbalit
BBBBBBBBCCCCCCDDDFFFFGGGGGGHHHHHHHHGGGGGGFFFDDDDCCCCCCBBBBBBBB BBBBBBBBCCCCCCDDDFFFFGGGGGGHHHHHHHHGGGGGGFFFDDDDCCCCCCBBBBBBBB - po dekompresi - není to stejné, chybí nabalená sinusovka (zbarvení zvuku) a některé hodnoty základu jsou taky jinak (takže tam je vlastně úplně jiné zbarvení) - dostali jsme sice podobný, ale ne stejný vzorek a zpátky už se to nevrátí
I kdybych to teď bezztrátově zabalil, tak už je ten zvuk ochuzený a změněný
(Ve skutečnosti jsou komprimační algoritmy výrazně chytřejší a složitější a používají se na větší soubory dat, takže ta komprese může být ještě výraznější, pokud je vstupní soubor nějakým způsobem "jednoduchý", například se v něm některé úseky opakují - třeba takové komorní A se opakuje 440x za sekundu :)