Hudba, nebo obecně zvuk je vlnění vzduchu. v jednom bodě v prostoru si to můžeš představit jako křivku (jak roste a klesá ten tlak). V centru reproduktoru ta křivka v podstatě odpovídá tomu, jak moc proudu do něj zrovna leze a jak moc se tam ta cívka a membrána mydlí.
Že slyšíš prostorově je dáno tím, že uši jsou kus od sebe, hlava zvuk tlumí, zvuk slábne se vzdáleností od zdroje a taky je fázově posunutý - zjednodušeně, když dáš levé sluchátko hlasitěji a pravé míň, bude se ti zdát, že se každý zdroj zvuku posunul doleva. Když se nahrává stereo, tak použiješ dva mikrofony kus od sebe a z různých nástrojů se do každého z nich dostane víc, nebo míň zvuku, podle toho kterým směrem ten nástroj je. Z mikrofonu leze jen napětí po jednom drátu, můžeš si ho zobrazit třeba na osciloskopu, do sluchátek by ti pak mělo lézt něco podobného, abys slyšel stejné nástroje na stejných místech hrát stejnou hudbu.
Když nahráváš prostorově, nahráváš víc stop a předhráváš je na víc reproduktorech a když pak otočíš hlavou tak máš pocit, že se natáčíš k jednotlivým nástrojům kolem tebe. Ve sluchátkách máš pocit, že se hudebníci točí s tebou (uděláš čelem vzad a kytara je furt v levém uchu slyšet víc). (v praxi se často snímají jednotlivé nástroje zvlášť a pak se uměle umístí do virtuálního prostoru tím, že se do nějakého kanaálu dá víc kytary a do druhého víc kláves třeba, ale to zatím ignorujme)
Takže v každém bodě prostoru je nějaká křivka, která odpovídá zvuku v tom prostoru, pro stereo slyšení potřebuješ dvě, pro prostorové víc (to jsou ty 5+1, 7+1 a podobně), podle toho buď použiješ příslušný počet repráků, nebo to nějak namícháš když jich máš míň (nebo to za tebe udělá někdo po cestě, když si koupíš "jen stereo")
Kdybys dokázal ty křivky do svých uší zreprodukovat přesně tak, jak by odpovídalo křivkám v pozicích uší přímého posluchače, měl bys stejný pocit, jako bys tam na tom místě byl osobně.
Problém je, že žádný nástroj nehraje jen pouhou sinusovku (jejíž frekvence odpovídá výšce tónu a rozkmit hlasitosti), ale rovnou celé spektrum zvuků, které se poskládají do něčeho značně složitého (proto taky poznáš kytaru od flétny a houslí, i když hrajou "ten samý tón", tak mají každý jinou barvu toho zvuku) a navíc se ti top poskládá od všech nástrojů a zpěváků (a případných odrazů od stěn a tak - zase poznáš utlumené studio, otevřenou louku a nádražní halu s ozvěnou).
Jakoukoli takovouto křivku jde poskládat ze sinusovek různé frekvence, různé hlasitosti a různě proti sobě posunutých - jde to matematicky dokázat (buď si to dohledej, nebo mi to věř), často je potřeba těch sinusovek nekonečno, s tím, že některé jsou hodně hlasité a zbytek je čím dál slabší, až nakonec máš tak slabé, že je stejně neslyšíš. Stejně tak jich je část ve slyšitelném pásmu, ale většina má frekvence moc hluboké, nebo vysoké, na to abys je dokázal slyšet.
Problém je, jak ten zvuk zachytit - no, dáš tam mikrofon a jak to tlačí na membránu, tak to buď hýbe cívkou, nebo stačuje uhlíková zrna, nebo tak něco a z připojených drátů ti leze nějaký signál - ten už sám je trochu zkreslený, protože membrána má setrvačnost, některé frekvence bere líp, některé hůř a některé vůbec. Dráty, po kterých to leze díl mají nejen odpor (který to jen tlumí), ale i kapacitu a indukčnost, které tlumí některé frekvence víc než jiné. Zesilovače taky nemají totálně lineární charakteristiku. Pomineme teď všechny umělecké úpravy a budeme přemýšlet, jak to uložit pro další použití.
Můžeš to nahrát na magnetickou pásku (která taky některé frekvence pobírá líp a jiné hůř) a mít to jako sílu magnetického pole, můžeš to nahrát na gramodesku a budeš to mít jako grafické zachycení toho signálu namotané na spirálu z kraje k prostředku - odchylka od spirály je síla signálu, ale jehla má nějakou tloušťku, váhu a tak, materiál desky taky není naprosto dokonalý, zase se to trochu zkreslí.
Můžeš to zkusit uložit do souboru v počítači. Ale tam už jsou jen nuly a jedničky (po osmicích dávají byty 0-255, nebo jinak organizované dávají nějaká jiná čísla, klidně v mnohem větším rozsahu). Jak to na ně převést - můžeš prostě měřit dost často (třeba 132 000x za sekundu) a vždycky si zapsat naměřené napětí - tím získáš například ten WAV soubor - ale už to není plynulá křivka, ale jen dost husté schody a když to přehraješ, tak reprák ti neudělá ostré hrany těch schodů, ale nějak to zaoblí - čímž to sice je zase nějak plynulé, ale už jiné, než ten původní zvuk. (špatný reprák se od těch schodů bude lišit hodně, lepší míň).
Taky to můžeš rozložit na ty matematické sinusovky a ukládat si jejich parametry (kmitočet, hlasitost..), ale nekonečno nikdy nedáš, tak vezmeš jen nějaké ze slyšitelného rozsahu a okolí a z nich jen ty nejhlasitější a budeš to brát jako přiblížení tomuhle kousíčku hudby a za nějakou chvíli (zase pidizlomky sekundy) spočteš nové hodnoty, protože jinak ti ta chyba naroste příliš moc (a přitom ti jako nejvýraznější vyjdou klidně úplně jiné). Při přehrávání pak generuješ "něco jako posčítané sinusovky" a cpeš to do nedokonalých repráků. Takhle to zase dělají jiné (ztrátové) formáty. Využívá se toho, že uchu často stačí naznačit a ono si to zbytek nějak domyslí a tak jde těch hodnot zaznamenávat opravdu málo, ale zase se to někdy může docela lišit od originálu.
No a každým převodem mezi formáty dochází k dalším ztrátám, jak se to počítá a zaokrouhluje a pak se z toho něco vybere a zaokrouhlí. Proto moc převádění mezi formáty škodí.
A samozřejmě je jasné, že když to nahraješ kvalitně, pak to něčím brutálně ořízneš, aby toho nebylo tolik, tak o něco přijdeš a dalším zpracováním už to tam nedostaneš. Takže když nahraješ celkem kvalitní mp3 (jakožto ztrátový formát) a necháš to tak, tak to může být mnohem kvalitnější, než když nahraješ extra kvalitní wav s frekvencí vzorků dostatečnou i pro netopýry, pak to tak nějak zprůměruješ na frekvenci špatného telefonu, pošleš si to přez dva kelímky od jogurtu a špagátek a pak to naprosto dokonale nahraješ a rozpočítáš na wav s vysokým vzorkováním, tak ten druhý wav sice věrně zaznamená svůj zdroj, ale to je kvalita špagátkového telefonu a lepší už to nebude - tedy po blbém zpracování i neztrátový fromát v vysokým bitratem může obsahovat mnohem horší nahrávku, než slušně zpracovaný ztrátový.
Tedy ztrátový formát nebo nízký bitrate ti může omezit kvalitu, ale ani nejlepší formát nezachrání, když ti tu kvalitu jednou sníží něco v celém řetězci od původního záznamu do finálního poslechu.
Blbá zpráva je, že poslední dobou má většina studií tendenci dělat něco podobného - aby se zdálo, že mají písničky hlasitější a tedy lepší než konkurence, tak kvalitně nahrajou skladbu s velkým dynamickým rozsahem kde se střídají hlasité a tiché úseky, nebo se v h lasitém śeku vrazí zlomek sekundy ticha jako inverzní úder (na kyteře hrábneš silně do strun, pak tam připlácneš dlaň, takže úder ticha a zase hrábneš naplno) - no a by se "využilo pásmo" a byli "dost slyšet", tak zvukař to prožene filtrem, který srovná hlasitost celé skladby na jednu (nejvyšší nahratelnou) úroveň a takhle to pošlou do distribuce. (Když si vezmeš 250W zesilovač, zapojíš do něj 5W bedničky a vohulíš hlasitost na maximum tak (pokud ty bedničky rovnou neshoří, nebo nevyplivnou cívky přez celou místnost) dostaneš podobný efekt - od začátku do konce to řve jak przněná kráva, ale není tomu vůbec rozumět a všechny jemné detaily, s kterými si kapela dala tolik práce jsou rázem pryč. Říká se tomu Loudness War a bohužel to je dnes skoro všude.) V porovnání s tím pak staré zašuměné gramodesky můžou být "paradoxně" výrazně lepší, protože se šumem si ucho nějak poradí a dynamický rozsah je mnohem víc než hlasitost. (No a při nejhorším si volume přez maximum co snese tvá reprosoustava/sluchátka můžeš vytočit i sám).