Zvukový súborový formát

z Wikipédie, slobodnej encyklopédie
Skočit na navigaci Skočit na vyhledávání

Zvukový súborový formát je formát súboru určený na uloženie digitálnych zvukových údajov na počítačovom systéme.

Digitalizácia analógového zvukového signálu sa robí meraním napätia signálu v pravidelných intervaloch. Čím kratšie budú intervaly, tým viac meraní urobíme za určitý časový úsek a tým presnejšie priebeh zvuku zachytíme. Získame tak kvalitnejší záznam. Počet meraní za určitú časovú jednotku sa nazýva vzorkovacia frekvencia (sampling rate) a udáva sa v kHz (napr. frekvencii 11 kHz zodpovedá 11 000 meraní za sekundu)

Najnižšie hodnoty vzorkovacej frekvencie sa používajú pri digitalizácii telefónneho hovoru (bežne je to 8000 Hz). Jednou z najnižších používaných hodnôt vzorkovacej frekvencie je 11,025 kHz. Ďalej sa používa 22,05 kHz a pre digitalizáciu veľmi kvalitnej nahrávky, zodpovedajúcej kvalite CD audio nahrávky, sa používa frekvencia 44,1 kHz a 48 kHz, čo predstavuje 44 100 a 48 000 údajov za sekundu.

Ďalším parametrom kvality nahrávky je veľkosť vzorky (sample size). Udáva sa v počte bitov. Čím väčší počet bitov, tým presnejší údaj získame a môžeme zachytiť väčšie rozdiely v hlasitosti. Pre uloženie nameranej hodnoty sa používa najmenej 1 byte, t. j. 8 bitov, pri kvalitných nahrávkach sa využíva 16 bitov, pri stereo hudbe potom máme dvakrát 16 bitov.

Vzorkovanie a prevod analógového signálu sa robí pomocou prevodníka A/D (analog-to-digital) uloženého na zvukovej karte. Pri prehrávaní záznamu treba spätne digitálny signál previesť na analógový pomocou prevodníka D/A. Na kvalite analógovo-digitálneho prevodníka (zvukovej karty) závisí kvalita výsledného digitalizovaného zvuku. Najčastejšou metódou prevodu analógového signálu na digitálny je Pulzná kódová modulácia (PCM).

Digitálny signál v základnom PCM formáte[upraviť | upraviť kód]

Digitálny signál s dĺžkou 10 minút vytvorený pomocou PCM v základnom formáte môže mať nasledovnú veľkosť:

  • pri vzorkovaní 8 kHz a 8 bitovej vzorke 4,8 MB (klasický telefónny prístroj)
  • pri vzorkovaní 22,05 kHz a 8 bitovej vzorke 13,23 MB (rozhlasové vysielanie FM)
  • pri vzorkovaní 44,1 kHz a 16 bitovej vzorke 105,84 MB (CD kvalita)

Typy zvukových formátov[upraviť | upraviť kód]

Zvukové súbory obsahujú zvuk v rôznych formátoch. Formáty digitalizovaného zvuku môžeme rozdeliť na nekomprimované (zaberajú na disku viac miesta) a komprimované, ktoré sú pri porovnateľnej kvalite menšie a sú vhodné aj na prenos po internete. Formáty bez kompresie ukladajú zvukové dáta v takej podobe ako boli získané digitalizáciou. Formáty s kompresiou tieto dáta ďalej upravujú. Pod pojmom kompresia sa rozumie odstraňovanie redundancie (nadbytočných dát), takže súbor zaberá menej miesta na disku.

Kompresné formáty sa rozdeľujú na stratové a bezstratové. Bezstratové kompresie odstraňujú len istú časť dát tak, aby bolo možné vrátiť súbor do originálneho stavu. Stratové kompresie odstraňujú väčšie množstvo dát, takže sa nemôžeme vrátiť k pôvodnej kvalite. Štruktúra zvukového súboru pozostáva z hlavičky a samotných dát. V hlavičke sú uložené dôležité informácie ako dĺžka záznamu, počet kanálov, typ formátu, vzorkovacia frekvencia a pod.

Pre hudobné účely bol vyvinutý formát MIDI. MIDI predstavuje čisto digitálny zvuk, teda zvuk ktorý bol vytvorený priamo v počítači. MIDI súbory zaberajú na disku omnoho menej miesta ako zvukové vzorky a pritom ponúkajú vynikajúcu kvalitu zvuku.

Kodek[upraviť | upraviť kód]

Pre efektívnejšiu prácu so zvukovými súbormi sa používajú kodeky. Slovo kodek pochádza z angličtiny (codec) a je to skratka z dvoch slov COder a DECoder. Kodek slúži na zakódovanie a dekódovanie, inak povedané na kompresiu a dekompresiu zvuku. Je to ovládač, ktorý pridáva podporu pre nejaký konkrétny audio/video formát pre operačný systém. Vďaka kodeku operačný systém tento formát rozozná a dovolí ho prehrať (decode = dekóduje ho) alebo dovolí zmeniť ho na iný formát (encode = zakóduje).

Metódy kompresie sú kvôli vzájomnej kompatibilite aplikácií a technického vybavenia definované štandardami ISO (International Organization for Standardization), ITU (International Telecommunications Union) a IEC (International Electronical Commission). V súčasnosti existuje veľké množstvo kodekov, pričom mnohé z nich boli vytvorené pre špeciálne účely.

Príklady kodekov
  • PCM (Pulse Code Modulation) – štandardný nekomprimovaný formát pre zvukový záznam
  • Microsoft ADPCM – často používaný formát, ktorý komprimuje 16-bitové audio na 4-bitové,
  • IMA ADPCM – komprimuje 8-bitové vzorky na 4-bitové,
  • GSM 6.10 – používa sa pri mobilných telefónoch
  • DSP Group TrueSpeech – ponúka väčšiu kompresiu než GSM pri vyššej kvalite

Nájsť vhodný pomer medzi kvalitou zvuku a veľkosťou súboru je jedna z najťažších volieb pri práci s digitalizovaným zvukom. Treba vhodne zvoliť nielen parametre digitalizácie (vzorkovaciu frekvenciu, bitovú hĺbku a počet kanálov), ale aj správny formát súboru, prípadne kompresiu. Počet rôznych formátov zvukových súborov je veľmi veľký a preto v ďalšom spomenieme len niektoré.

Formáty bez kompresie[upraviť | upraviť kód]

  • AU (*.au, *.snd) – (Audio File Format) AU je štandardom pre prostredie Unix a programovací jazyk JAVA.
  • AIFF (*.aiff, *.aif) – (Audio Interchange File Format) Je zvukový formát, používaný v OS počítačov Apple.
  • WAVE (*.wav) – (Waveform Audio file format) Je to základný, predvolený formát na počítačoch s OS Windows.

So stratovou kompresiou[upraviť | upraviť kód]

Vznik súborov so stratovou kompresiou bol podmienený hlavne potrebou podstatne znížiť objem dát zvukových súborov. Mnohé z týchto formátov našli svoje uplatnenie najmä na sieti internet.

  • MPEG Audio (*.mp1, *.mp2, *.mp3, *.m2a, *.mpa, *.mpg, *.mpeg, *.sws) – MPEG je stratovou kompresnou schémou založenou na psychoakustickom modeli ľudského ucha. MPEG má mnoho podôb, v závislosti od zložitosti použitých kompresií. Čím vyššia vrstva, tým vyššia kompresia a menšia veľkosť súboru.
  • WMA (*.wma) – (Windows Media Audio) WMA vyvinula spoločnosť Microsoft. Kvalitou mierne prekonáva obľúbený formát mp3, ale iba pri nižších dátových tokoch.
  • RealAudio (*.ra, *.rm, *.ram) – Tento formát získal svoju popularitu vďaka streamovaniu zvuku na webe ako prvý streamovací zvukový formát. Patrí medzi najstaršie formáty a má široké použitie. Vysoký kompresný pomer, ale nízka kvalita.

S bezstratovou kompresiou[upraviť | upraviť kód]

Referencie[upraviť | upraviť kód]

  • MIKUŠ, Ľ.: Efektívna tvorba CBT kurzov, Žilinská univerzita, 2002. – 101 s. + CD-ROM, ISBN 80-7100-995-4
  • GRACE, R.: Hudba a zvuk na počítači, GRADA Publishing, 2000, + CD, ISBN 80-7169-519-X