Optické rozoznávanie znakov

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Optické rozoznávanie znakov alebo OCR (z angl. Optical Character Recognition) je metóda umožňujúca preklad obrazu (grafiky) tlačených alebo písaných znakov do textovej, editovateľnej formy napr. do ASCII znakov abecedy. Typickým príkladom je zoskenovaný text (čo je vlastne len obrázok znázorňujúci text) a jeho preklad do strojovej formy použiteľnej a editovateľnej v textovom editore. V minulosti sa využívali rôzne metódy rozoznávania znakov napr. optické, dnes sa na tento účel používa výhradne výpočtová technika.


OCR technológie sa nepoužívajú len na rozoznávanie textu, ale napr. aj na rozoznávanie notového zápisu, špeciálnych znakov (napr. na bankovkách pre zvýšenie bezpečnosti), rozoznávanie správnosti podpisu a pod.

OCR softvér[upraviť | upraviť zdroj]

OCR softvér je program umožňujúci rozoznanie jednotlivých znakov v texte. Zahŕňa v sebe prvky umelej inteligencie a strojového videnia, ako aj lingvistické prvky kontrolujúce správnosť preložených slov a viet. Od zložitosti softvéru záleží aj presnosť výstupu. Samostatnou kapitolou sú softvéry schopné rozoznávať rukou písaný text, obvykle vybavené schopnosťou naučiť sa formu a štýl rukopisu, s prispôsobením na meniacemu sa sklonu a rôznej veľkosti písma.

U OCR softvéru je obvykle potrebné nastaviť jazyk v ktorom je text napísaný, napr. slovenčina, angličtina ..., aby správne vyhodnotil diakritické znaky, a aby pre výstupný text použil správny jazykový slovník. Jednoduché OCR softvéry sú bežnou súčasťou softvérového vybavenia skenerov, alebo sa predávajú ako samostatné produkty.

Známe OCR softvéry:

  • ABBYY FineReader OCR
  • OmniPage
  • Readiris
  • CVision Technologies
  • Top Image Systems
  • Zonal OCR
  • Computhink
  • ViewWise
  • CuneiForm
  • GOCR
  • Microsoft Office Document Imaging
  • Microsoft OneNote
  • Nicomsoft OCR

a iné.

Externé odkazy[upraviť | upraviť zdroj]