Časté pojmy z oblasti digitálního videa
Článek se pokusí shrnout nejčastější pojmy z oblasti digitálního videa. Účelem není vše popsat do elementárních detailů, ale může jít o základ vědomostí, na kterém lze stavět čtením dalších odborných článků.
Úvod:
Video se skládá z jednotlivých obrázků, které jsou zobrazovány za sebou konstatní rychlostí o určitém počtu snímků za sekundu (FPS - frames per second).
Každý obrázek tvoří rastr pixelů. Počet pixelů na šířku (width) a na výšku (height) značí rozlišení obrazu (W x H).
Pixel má jednu vlastnost a tou je barva. Ta je reprezentována kombinací určitého počtu bitů (jedniček a nul). Více bitů znamená více kombinací barev, kterých pixel může nabývat.
Hovoříme o barevné hloubce (color depth).
Pokud vynásobíme barevnou hloubku s rozměrem obrazu a počtem snímků za sekundu, dostaneme počet bitů za sekundu - datový tok (bit rate). Pokud to vše vynásobíme ještě délkou videa v sekundách, dozvíme se celkovou velikost videa.
Bity vs. Byty:
Jeden byte (bajt, B) je 8 bitů. 1 kb je 1024 bitů. Stejně tak 1 Mb je 1024 kb atd. Máme-li video, které má datový tok např. 10240 kb/s a chceme vědět, kolik zabere jedna sekunda v MB, musíme datový tok vydělit osmi. Tím dostaneme 1280 kB/s a pokud číslo vydělíme ještě 1024, dostaneme 1,25 MB/s a můžeme si udělat přibližnou představu, kolik video zabere na pevném disku.
Obecně:
Převod z bitů na byty (nebo z kb na kB atd.) -> dělí se osmi.
Převod z bitů na kb (nebo z bytů na kB atd.) -> dělí se číslem 1024.
Rozlišení a poměr stran
Rozlišení udává počet pixelů horizontálně a vertikálně, např. 720x576 (norma PAL), 1280x720 nebo 1920x1080 (HDTV) atp. Čím je rozlišení větší, tím obraz obsahuje více detailů a je při větší úhlopříčce ostřejší. S rozlišením úzce souvisí poměr stran (aspect ratio). Ten udává poměr horizontálního rozměru k vertikálnímu rozměru obrazu. Dokud dominovaly CRT televizory, běžný poměr stran byl 4:3. Širokoúhlé filmy se doplňovaly o černé pruhy (letterbox), nebo byl obraz ořezán. S nástupem LCD televizí začal převládat poměr stran 16:9 a dnes již většina televizních stanic v něm vysílá. Také většina nahrávacích zařízení dnes již natáčí širokoúhle. U filmů se používá spousta dalších (ještě šiřších) formátů, proto je někdy potřeba doplnit o černé pruhy i obraz s poměrem stran 16:9. Pokud přehráváme video s poměrem stran 4:3 na širokoúhlé televizi, je potřeba jej zprava i zleva doplnit vertikálními černými pruhy, nebo nechat obraz automaticky přizpůsobit celé ploše obrazovky, avšak dojde k deformaci. Záleží na nastavení. Změna rozlišení nebo poměru stran při konverzi videa znamená snížení jeho kvality, nebo deformaci obrazu. Je proto vhodné zachovat stejné rozlišení i poměr stran, jako originál.
Prokládané a progresivní skenování:
U analogového televizního vysílání bylo nutné kvůli přenosu obrazu každý snímek rozdělit na dva půlsnímky (fields), které se poté na CRT televizoru postupně vykreslovaly jako sudé a liché řádky - tedy celkem 50 půlsnímků za sekundu (norma PAL). Vzhledem k principu CRT televizoru tohle dělení obrazu bylo pro lidské nezpozorovatelné a obraz nepůsobil nijak nepřirozeně. Na monitoru počítače byl však problém takový obraz přehrát - monitor nevykresluje půlsnímky, ale plné snímky. Je tedy možnost spojit oba půlsnímky dohromady a zobrazovat 25 plných snímků/s, avšak kvůli časovému posunutí jednotlivých půlsnímků je obraz rozostřený. Další možností je poskládat obraz pouze z lichého, nebo sudého půlsnímku. Zmizí sice nepříjemné rozostření, ale výsledný obraz má poloviční vertikální rozlišení. Tímto problémem se zabývají deinterlace filtry přehrávače (např. Weave, Bob, Blend). Dá se tedy říci, že prokládaný obraz byl šitý na míru CRT televizorům. Pro LCD displeje je však mnohem vhodnější obraz s progresivním skenováním (plné snímky). Dnes se však stále setkáváme s prokládaným obrazem u digitálního vysílání v normě PAL, ale i v normě HDTV (avšak jen u rozlišení 1920x1080 z důvodu nižší technické náročnosti). Často se používá značení jako 576i, 720p či 1080i, kde číslo značí vertikální rozměr obrazu a písmeno p nebo i představuje progresivní, nebo prokládaný (interlaced) obraz. Dnešní kamery, ať už SD či HD umožňují nahrávat prokládaně i progresivně. Progresivně skenovaný obraz lépe zachytí pohyb, prokládaný se zase hodí pro statické scény.
Televizní normy:
Televizní norma je souhrn standardů pro televizní vysílání. Zahrnuje v sobě principy a technické specifikace pro přenost obrazu a zvuku. Normě musí být přizpůsobena zařízení vysílače i přijímače. V bývalém Československu se po zavedení barevného vysílání začalo vysílat v normě SECAM , na přelomu 90. let se přešlo na normu PAL. Především v severní Americe a v Japonsku je to norma NTSC. S příchodem digitálního videa byly některé parametry převzaty kvůli zachování zpětné kompatibility s televizory a u digitálního vysílání přibyla nová norma HDTV. Převzaté parametry jsou především rozlišení (PAL 720x576, NTSC 720x480), snímková frekvence (PAL 25 fps, NTSC 29,97 fps) a prokládané skenování. Samotné vysílání je již podle standardu DVB-T (pozemní), DVB-S (satelitní), nebo DVB-C (kabelové). Norma HDTV umožňuje vysílat obraz s mnohem vyšším rozlišením a k tomu prostorový zvuk. Rozlišení obrazu je 1280x720, nebo 1920x1080 bodů. Video má 23,976, 24, 25, nebo 30 fps a progresivní i prokládané skenování (použité především u vyššího rozlišení). Ke sledování HDTV není nutná Full HD televize, ale stačí zařízení s logem HD Ready - zařízení, které je schopno zpracovat video s vysokým rozlišením, ale nemusí jej nutně zobrazit 1:1 - typicky LCD televize s úhlopříčkou menší, než 82 cm.
Komprese:
Video tak, jak bylo popsáno na začátku, by bylo příliš náročné na uchování. Mějme například video s rozlišením 1280x720, barevnou hloubkou 24 bitů a 30 fps. Každou sekundu zabere cca 79 MB místa a za hodinu už by to bylo kolem 278 GB. Proto se používá komprese obrazu a to ztrátová, nebo bezztrátová.
Bezztrátová komprese umožňuje zmenšit objem dat tak, aby je bylo možné později zpětně rekonstruovat a nedošlo ke ztrátě kvality (avšak nedojde k takové úspoře dat, jako u komprese ztrátové). Bezztrátové kompresní metody pro video jsou např. HuffYUV, FFV1, Lagarith a LCL.
Ztrátová komprese zmenší objem dat na zlomek původní velikosti, avšak již s určitou ztrátou. Dochází k transformaci dat, aby bylo možné oddělit důležité informace od nedůležitých. Zde je rozhodující kvalitní psychovizuální nebo psychoakustický model (u komprese zvuku), který rozhoduje, jaká data potlačit, nebo úplně vypustit.
Kodeky, formáty, multimediální kontejnery:
Kodek (složenina slov kodér a dekodér) je zařízení, nebo program, který se stará o kompresi a dekompresi videa nebo zvuku. Má jednotné programové rozhraní, přes které se mu při kompresi posílá zdrojové video a kodek vrací zpět již zkomprimované video. Při dekompresi je tomu naopak. Přes toto rozhraní lze také konfigurovat parametry jako datový tok, nebo kvalitu komprese (to vše přes konfigurační dialog, který je v kodeku zabudovaný). Pro lepší komunikaci programátorů s kodeky vznikly multimediální frameworky (soubory knihoven s API a nástroji pro práci s multimédii). Ve Windows je to starší VfW (znám také jako VCM) a novější DirectShow. Kodeky lze rozdělit do dvou kategorií podle použití:
Kodeky pro následné zpracování - cílem je snížit velikost nekomprimovaného videa, ale bez znatelného snížení kvality a je kladen důraz na rychlost komprese a dekomprese (pro účely editace). Jsou to kodeky s intraframe kompresí (každý snímek je komprimován zvlášť bez návaznosti na předchozí). Příkladem jsou kodeky formátu MJPEG nebo DV (např. Morgan MJPEG2000 Codec, nebo Mainconcept DV) a také všechny bezztrátové kodeky.
Kodeky pro finální kompresi - cílem je co největší komprese při zachování rozumné kvality obrazu. Sem patří např. kodeky formátu MPEG a jejich odvozeniny jako DivX, XviD, H.264 apod. Velký kompresní poměr je dosažen mj. metodou interframe (vychází z podobnosti sousedních snímků, přičemž jsou pravidelně ukládány celé snímky a zbytek je definován jako rozdíl mezi nimi).
Výsledkem práce kodeku (při kódování) je video v určitém formátu. Často dochází k zaměňování pojmů kodek a formát, ke kterému přispívá fakt, že některé názvy kodeků se shodují s názvy formátů (např. již zmíněný HuffYUV). Opačným příkladem jsou kodeky DivX a XviD, jejichž výstupem je formát MPEG-4 ASP a je tedy zavádějící, pokud některé přístroje uvádí "podporu pro DivX". Součástí videa je samozřejmě i zvuk, který má také své formáty. Mezi nejpoužívanější patří WAV (nekomprimovaná LCMP data), FLAC (Free Losless Audio Codec), MPEG Layer 3 (nebo-li MP3, známe kodeky jsou LAME, FhG, Blade), WMA (oficiálně pouze jeden kodek integrovaný ve WMP), AAC, AC-3 (Dolby Digital) a Vorbis (nejčastěji uložen v kontejneru Ogg a nazýván Ogg Vorbis).
Aby mohly být oba datové streamy (obraz a zvuk) uloženy do jednoho souboru, jsou "zabaleny" do multimediálního kontejneru a je zajištěna i jejich synchronizace. Kontejner může obsahovat videostopu, několik audio stop a titulky. Kontejnery se vzájemně liší množinou podporovaných formátů. Zároveň nesou informaci o jednotlivých streamech (jaký kodek byl použit ke kódování streamů atp.) pomocí FourCC, nebo Codec ID. Tyto informace je možné přečíst např. porgramem MediaInfo. Nejznámější multimediální kontejnery: AVI, Matroska (MKV), MPEG-TS (MTS), MPEG-PS (VOB), MP4, QuickTime (MOV), Advanced Systems Format (ASF), 3GP, Flash Video (FLV). Kontejner je tedy jakási obálka, která na první pohled neříká nic o formátu videa, který obsahuje.
Formáty a jejich použití:
V dobách, kdy byly běžné Mini-DV kamery, bylo nutné záznam z pásku nahrát do PC v reálném čase pomocí rozhraní Firewire. Video bylo ve formátu DV-AVI s rozlišením 720x576 a konstantním datovým tokem kolem 30 Mbit/s. Nebyl problém takové video editovat i na pomalejších PC. Zpracované video se nahrávalo zpět na pásek, nebo se archivovalo na DVD (formát MPEG-2 v kontejneru VOB). Obraz byl prokládaný a vhodným zařízením na přehrávání proto byla televize (většinou ještě CRT). Datový tok videa byl do 10000 kb/s. Pozdější DVD kamery nahrávaly video na malý 8 cm disk, který se dal ihned přehrát v DVD přehrávači. Dnešní kamery s pevným úložištěm (HDD nebo paměťové karty) již natáčí většinou ve formátu AVCHD. Tento formát používá kompresi H.264/MPEG-4 AVC pro video a Dolby Digital (AC-3) pro zvuk. Streamy jsou uloženy v kontejneru MPEG-2 Transport Stream (resp. v jeho modifikaci) s koncovkou m2ts. Tento kontejner byl původně navržen pro použití v prostředí, kde není zaručena bezchybnost přenosu (DVB-T, streamování po internetu). S menšími modifikacemi známými jako BDAV MPEG-2 Transport Stream se používá na Blu-ray discích a v kamerách. Modifikace spočívá v tom, že k základnímu paketu je přidán 4B timecode pro rychlý přístup k libovolné části proudu, čehož využívají přehrávače a nelineární střihové systémy. Střih takového videa je poměrně náročný. Je vhodné mít vícejádrový procesor a dostatek operační paměti. Díky kompatibilitě s Blu-ray se video při autorizaci disku nemusí překódovávat. AVCHD disc (DVD s videem tohoto formátu) ovšem nemusí jít přehrát ve všech Blu-ray přehrávačích. Kromě kamer dokáží nahrávat video i digitální fotoaparáty a mobilní telefony (dnes smartphony). Starší přístroje nahrávaly video s nízkým rozlišením ve formátu MJPEG (malý kompresní poměr - malé nároky na procesor), s nízkým framrate (třeba jen 15 fps) a s nekvalitním mono zvukem. Postupem času docházelo ke zlepšení, až se kvalita videa vyrovnala Mini-DV kamerám a poté je i překonala. S rostoucím výkonem přístrojů nebyl problém přejít na dokonalejší formáty MPEG-4. Mobilní telefony v tomhle směru urazily také velký kus cesty. Od videa s rozlišením 220x178, 15 fps, formátu MPEG-4 Part 2 (H.263) a zvukem ve formátu AMR (to vše v kontejneru 3GP), až k HD videu, které se kvalitou obrazu i zvuku téměř vyrovná dnešním mainstreamovým kamerám. Do budoucna lze čekat podporu Full HD videa u většiny smartphonů i fotoaparátů a u kamer lze čekat nástup 4K rozlišení. Formáty s velkým kompresním poměrem umožnily transformovat celovečerní film v jednotkách GB na stovky MB a přispěly tak ke sdílení filmů na internetu. Často používaným kodekem pro filmy v SD rozlišení je DivX a jeho free varianta XviD. Výsledný film je ve formátu MPEG-4 ASP, zvuk v MP3 nebo AC-3 a streamy jsou zabaleny většinou v kontejneru AVI. Datový tok se běžně používá 1000 kbit/s až 2000 kbit/s u videa a 128 kbit/s až 384 kbit/s u zvuku. Protože se nejedná o oficiální distribuci filmů, kvalita videí není nijak zaručena. Lze se setkat s filmy s velmi nízkou kvalitou (několikrát překódované video s nízkým datovým tokem) a nevhodně zvoleným rozlišením (např. 720x576, kde je obraz s poměrem stran 16:9 doplněn o černé pruhy). Novější DVD přehrávače už tento formát podporovaly a tak řada z nás jistě má sbírku DVD s několika filmy, nebo seriály na každém z nich. Pro sdílení filmů ve vysokém rozlišení je nejčastěji použit formát H.264/MPEG-4 AVC se zvukem AC-3 v kontejneru MKV s datovým tokem do 10000 kbit/s.
Lineární a nelineární střih:
Lineární střih spočíval v přímém kopírování záznamu z kamery na kazetu, nebo z jedné kazety na druhou v reálném čase. Vyžadoval dokonalou znalost zdrojového materiálu. Existovaly karty do PC s několika videovstupy a jedním výstupem. Pomocí střihového softwaru bylo možné přidávat titulky, prolínačky a některé jiné efekty. Pokud se dílčí proces nepovedl, musel se celý opakovat.
Nelineární střih zavedl prostředníka - počítač s pevným diskem. Video je nahráno na disk a lze přistupovat téměř okamžitě k jakémukoliv úseku. Nedochází k destrukci zdrojových dat. Střih je samostatná činnost a renderování se provádí až následně. Při střihu je možné vidět náhled výsledného videa. Většinou v nižším rozlišení, protože aplikace filtrů, titulků a efektů je výpočetně náročná. Editroy videa pro běžné použití: Windows Movie Maker, Vegas Movie Studio, Pinnacle Studio, CyberLink PowerDirector, pro Linux Kdenlive, OpenShot a další. Do zvláštní kategorie bych zařadil aplikace, které sice umějí základní střih, ale více se hodí pro pokročilou práci s formáty. Pro Windows je to VirtualDub, pro Linux např. Avidemux.
Kvalita videa:
Kvalitu videa ovlivňuje zejména volba formátu a kodeku a jeho nastavení při renderování.
Formát a kodek - nahrávku z Mini-DV kamery, VHS, nebo TV pořad je nejvhodnější převést do formátu MPEG-2 a případně zálohovat na DVD. To poskytuje optimální kvalitu obrazu pro videa tohoto typu. Nedochází ke změně rozlišení a zůstává zachován prokládaný obraz. U videí z fotoaparátu a smartphonu s SD rozlišením lze použít léty prověřený kodek XviD v kontejneru AVI, nebo dokonalejší H.264 v MP4. Pro HD a Full HD videa je formát H.264/MPEG-4 AVC a kontejner MKV prakticky standardem (ale může být použit klidně kodek XviD). Moderní přehrávače a televize přehrají většinou bez problému všechny tyto formáty.
Datový tok - může být konstantní (CBR), nebo variabilní (VBR). Konstantní datový tok je stejný po celou dobu záznamu a lze tedy před renderováním přesně určit, jakou velikost bude mít výsledný soubor. U VBR se nastavuje většinou minimální, maximální a průměrná hodnota. Enkodér zvolí datový tok podle náročnosti scény, např. u rychlého pohybu se použije vysoký datový tok, u statických záběrů může být nižší. Výsledný soubor tak zabírá méně místa při zachování téměř stejné kvality. Jeho velikost však nelze předem určit (vše záleží na složitosti scén konkrétního videa). Kvalitu kódování lze ještě zvýšit použitím dvouprůchodového renderingu (two-pass). První průchod analyzuje scény a při druhém průchodu teprve dochází ke kódování. Tento způsob je však časově náročnější. Pro velikost datového toku obecně platí, že čím je vyšší, tím je vyšší kvalita. To ale platí jen do určité míry. U některých kodeků už od určité velikosti datového toku není znát nárůst kvality. Příkladem může být kodek DivX, nebo XviD.
Rozlišení - je vhodné zachovat stejné, jako u originální nahrávky. Změna směrem dolů má za následek snížení kvality obrazu a směrem nahoru nemá smysl (použije až přehrávač, nebo televize při roztažení obrazu na celou plochu obrazovky - tzv. upscaling).
Zvuk - nastavuje se datový tok, vzorkovací frekvence, bitová hloubka a počet kanálů (většinou dva). Datový tok se také volí mezi CBR a VBR. Vzorkovací frekvence (počet vzorků za sekundu) a bitová hloubka (počet bitů k definici jednoho vzorku) jsou parametry, které určují kvalitu a věrnost zvuku při digitaliazci. Jak už je jednou zvuk digitalizován, není potřeba tyto parametry měnit. Při editaci, kdy se ke zvukové stopě videa přidávají další zvukové stopy (hudba a efekty) s různými parametry, se však musí tyto parametry při renderování sjednotit. Běžně se používá vzorkovací frekvence 44,1 khz nebo 48 khz a bitová hloubka 16 bitů a to v naprosté většině případů dostačuje. Více pozornosti je vhodné věnovat výběrů formátu a nastavení datového toku. U nejpoužívanějšího formátu MP3 je dobré nastavit datový tok alespoň na 224 Kbit/s (můj subjektivní dojem). Dokonalejší AAC dokáže vyprodukovat kvalitní zvuk i při mnohem nižším toku. S prostorovým zvukem ve formátu AC-3 (Dolby Digital) se lze setkat u komerčních filmů na DVD a Blu-ray. Některé běžné kamery také používají formát AC-3, avšak převládá pouze stereo.
Přehrávání videa:
Jak už bylo řečeno, video a zvuk jsou společně uloženy v kontejneru. Při přehrávání je potřeba streamy z kontejneru extrahovat. K tomu slouží splitter (nebo též demuxer) a jednotlivé streamy jsou poté dekódovány pomocí odpovídajících dekodérů (nazývané též jako filtry). Dokud nebyly rozšířeny softwarové přehrávače integrující vlastní splittery a dekodéry, převládaly přehrávače využívající systém DirectShow (na Windows). Ten používá transformační filtry. Pro každé video je zapotřebí tři: splitter, video dekodér a audio dekodér (případně ještě filtr pro titulky). Základní filtry jsou v systému již po instalaci, další lze doinstalovat (např. ffdshow). Přehrávače využívající DirectShow jsou na těchto filtrech zcela závislé (např. Windows Media Player, BSPlayer aj). Přehrávače, které přímo obsahují splittery a dekodéry, nejsou závislé na systému DirectShow. Stačí je nainstalovat a přehrají bez problému většinu formátů. Velmi známými a oblíbenými přehrávači jsou VLC Media Player a pouze pro Windows také MPC-HC (Media Player Classic - Home Cinema), který disponuje DXVA dekodérem (GPU akcelerace videa). Pokud mi tedy nejde přehrát video nějakého formátu, potřebné filtry doinstaluji, nebo použiji přehrávač, který je již obsahuje.
Závěr:
Pokud jste dočetli až sem, máte alespoň základní přehled o digitálním videu v současné době a jistě se v případných dotazech neomezíte pouze na konstatování, že "video AVI nejde".
Zdroje:
http://www.tvfreak.cz/art_doc-D449C8F4ACA8C978C125 7615004D1656.html
http://www.tvfreak.cz/art_doc-373A9DA2913B7BD3C125 727C00592A37.html
http://www.digilidi.cz/prehravani-videa-na-pc-kode ky-formaty-filtry?page=0,1
http://www.tvfreak.sk/modules.php?file=viewtopic&n ame=Forums&t=169
Kodek
http://cs.wikipedia.org/wiki/Ztr%C3%A1tov%C3%A1_ko mprese
Televizn%C3%AD_norma
TV_prenos.php
http://cs.wikipedia.org/wiki/High-definition_telev ision
AVCHD
Blu-ray_Disc
http://cs.wikipedia.org/wiki/Multimedi%C3%A1ln%C3% AD_framework
Kniha: Digitální video v praxi (Petr Beránek, vydání druhé 2003)
Pěkný článek. Pokud děláš s videem, co tak napsat něco o editorech, nebo třeba převod z videokazety na DVD?
Pokud bude zájem, proč ne..
Pěkná práce.
Spousta informací na jednom místě, netřeba hledat na mnoha místech.
Jen dodám, že Mini-DV formát je používán i dnes (fullHD kamery). Pravda, proces převodu je oproti kartám, HDD otravnější (časově 1:1), ale surových dat obsahuje více než AVCHD na kartě. Míru komprimace si určím sám po zpracování ve videoeditoru.
Velmi pěkně, jen bych se příště vyvaroval nadměrnému užití tučného písma, rozbíjí to tok textu.
Dobře, přístě zvýrazním jen opravdu nezbytné.
Zvýraznit je možno též kurzívou, za článek jinak chválím.
Mě se to tak tučně líbí, a začtu se tam, kde je to pro mě opravdu zajímavé, pěkný článek
Pěkný článek, děkujeme!
Pěkné. Přihodím pár odkazů:
MediaInfo - častý dotaz ve stylu: "Nejde mi přehrát avi video."
VLC.
SMPlayer - doporučené GUI nad MPlayerem.
Avidemux
Spousta jako portable.
dobrý. je to takový soupis toho, co si lidi pletou.
Jo, tohle bylo dobrý.
Díky za kladné hodnocení
Zaujímalo by ma, prečo sa H264 pchá do kontajnera MP4 a nie do AVI (prichádzam tým o podporu v prehrávači MV2Player).
Proto, že se nejedná o román, ale průvodce po problému, vítám použité zvýraznění, které umožní po "průletu očima" najít bod, který mě zajímá. Nechci pokaždé, když tu(nebojím se říct) příručku potřebuji, plynule číst od začátku. Rovněž kurzíva daný účel nesplňuje. Perfektní článek. Jen houšť a větší kapky.
Díky, hodilo se mi trochu se přivzdělat .
Jinak pokud bude detailnější pokračování, prosila bych vměstnat popis a vysvětlení různých "typů" snímků ve videu: např. dva úseky v Avidemuxu nespojím, pokud první snímek druhého dílu nezačíná písmenem I (má to něco společného s indexací?). Pak se tam vyskytuje ještě snímek P a snímek B a já nerozumím, k čemu je to dobré...
Pěkný den!
Pokračování bude zaměřené spíše na videoeditory. Pokud tě to zajímá, napiš do Googlu interframe, MPEG, nebo group of pictures.