Zvuk - Formáty audia

Zvuk může být v počítači uložen v různých formátech. Pro snížení nároků na velikost souboru se často používá komprese. Podle typu komprese rozlišujeme tři základní skupiny audio formátů.

Audioformáty bez komprese

Hlavním audio formátem nepoužívajícím kompresi je formát PCM (pulse code modulation), který je obvykle ukládán ve .wav souborech ve Windows nebo .aiff souborech na Mac OS. Oba tyto typy souborů obsahují hlavičku, ve které jsou informace o délce záznamu, počtu kanálů a použité vzorkovací frekvenci a kvantizaci.

Na obrázku je vlna sinu zaznamenaná 4-bitovým PCM. Kvantizované hodnoty od počátku jsou 7, 9, 11, 12, 13, 14, 14, 15, 15, 15, 14 atd. Tyto hodnoty jsou zakódovány do binární reprezentace jako 1001, 1011, 1100, 1101, 1110, 1110, 1111, 1111, 1111, 1110. Nejtypičtější je formát používaný na klasických kompaktních discích - 16-bit stereo PCM s vzorkovací frekvencí 44 100Hz.

 

PCM

Audioformáty s bezztrátovou kompresí

Bezztrátová komprese snižuje nároky na velikost bez ztráty kvality. Formáty bez komprese použijí při zakódování sekundy absolutního ticha stejně dat, jako při kódování sekundy zvuku. Hudba zakódovaná bezztrátovou kompresí zabere méně místa (obvykle 50% oproti formátům bez komprese), ticho pak nezabírá téměř žádné místo. Typickými typy souborů pro bezztrátové kódování zvuku jsou FLAC, WavPack nebo ALAC.

Audioformáty se ztrátovou kompresí

Ztrátová komprimace dosahuje vyšší úspory dat oproti bezztrátové odstraněním některých dat. To má za následek ztrátu kvality. Při kódování je snaha odstranit taková data, aby výsledná ztráta člověkem vnímané kvality byla co nejnižší. Ztráta kvality je tak často při poslechu člověkem těžko rozpoznatelná.

Nejznámějším zástupcem ztrátových formátů je formát MP3. Mezi často používané patří také formáty AAC. Obvykle je možné nastavit požadovanou kvalitu, která určuje míru komprese a tím i výslednou kvalitu. Obvykle se takto stanoví tzv. bitrate - tj. počet bitů za sekundu. Typickým případem je 128 kbps MP3 stereo, kde oba audio kanály využívají 16 kB za sekundu (tj. 960 kB za minutu).

Pro dosažení lepšího kompresního poměru se občas využívá variabilní bitrate, kdy encodér (tj. program, který provádí kódování) ohodnotí složitost na zakódování každého krátkého úseku nahrávky a na základě toho pak pro každý úsek použije jinou bitrate. Standard MP3 je relativně flexibilní a existuje značné množství různých encodérů. Ty se liší jak náročností na procesor při kódování, tak výslednou zvukovou kvalitou. Oblíbeným open-source MP3 encodérem je například LAME.