Rozpoznávanie reči

z Wikipédie, slobodnej encyklopédie

Prejsť na: navigácia, hľadanie

Technológie rozpoznávania reči umožňujú počítačom vybaveným zdrojom zvukového vstupu, ako je mikrofón, interpretovať ľudskú reč, na príklad pre účel zaznamenávanie alebo pre alternatívnu metódu interakcie s počítačom.


Informácie v tomto článku alebo jeho časti sú neoverené alebo nepodložené citáciou zdroja.
Dôveryhodnosť alebo spoľahlivosť týchto informácií je sporná! Upravujte preto článok opatrne a predtým si prosím prečítajte diskusiu!

[upraviť] Klasifikácia

Takéto systémy sa dajú klasifikovať podľa toho či

  • Požadujú, aby používateľ „natrénoval“ systém pre rozpoznávanie jeho jedinečného hlasového vzoru, alebo nie.
  • Systém je natrénovaný iba pre jedného používateľa, alebo je nezávislý na rečníkovi
  • Systém dokáže rozpoznávať reč nepretržite, alebo požaduje od používateľ, aby svoju reč rozdelil do diskrétnych slov
  • Systém je určený pre čistý rečový materiál, alebo je navrhnutý pre prácu na zaručených prenosových kanáloch (t.j. mobilné telefóny) a s možným šumom na pozadí alebo ďalším rečníkom, ktorý súčasne hovorí.
  • Slovník, ktorý systém rozpoznáva je malý (rádovo desiatky až stovky slov najviac), alebo veľký (tisícky slov).
  • Aký je kontext jeho rozpoznávania - číslice, mená, voľne tvorené vety.