Spracovanie obrazu

z Wikipédie, slobodnej encyklopédie
Skočit na navigaci Skočit na vyhledávání

Spracovanie obrazu (angl. image processing) v informatike je akékoľvek spracovanie signálu, kde vstupom je obrázok a výstupom je upravený obrázok alebo určité charakteristiky či vlastnosti, ktoré vychádzajú zo vstupného obrázku.[1] Výstupný obrázok môže mať napríklad upravenú veľkosť alebo zmenený jas pixelov tak aby sme zdôraznili určitý aspekt obrázku a potlačili ostatné. Príkladom môžu byť objekty, hrany alebo iné štruktúry, ktoré sú na obrázku považované za dôležité.[2]

Typy techník spracovania obrazu[upraviť | upraviť kód]

Metódy spracovania obrazu môžeme zaradiť do niekoľkých kategórii:[1]

  1. Vylepšenie obrazu
  2. Rekonštrukcia obrazu
  3. Kompresia obrazu
  4. Segmentácia obrazu
  5. Rozpoznanie obrazu
  6. Vyhladenie obrazu

Vylepšenie obrazu[upraviť | upraviť kód]

Pôvodný obrázok
Obrázok vylepšený ekvalizáciou histogramu

Vylepšenie obrazu nám poskytuje obrázok ktorý bude vhodnejší na zobrazenie a analýzu. Ide o odstránenie šumu, zaostrenie obrázku, zvýšenie kontrastu čo následne zjednodušuje hľadanie kľúčových prvkov v obrázku.

Vylepšenie obrazu môžeme ešte rozdeliť na 2 kategórie:

  1. Metódy v priestorovej oblasti - obrázok je 2-dimenzionálne pole pixelov
  2. Metódy vo frekvenčnej oblasti - obrázok je transformovaný do frekvenčnej oblasti napr. diskrétnou Fourierovou transformáciou

Niekoľko metód vylepšenia obrázku:[3]

Rekonštrukcia obrazu[upraviť | upraviť kód]

Rekonštrukcia obrázku pomocou umelej inteligencie

Obrázky môžu byť rôznymi vplyvmi poškodené, zašumené alebo rozmazané, cieľom rekonštrukcie je vylepšiť ich alebo vrátiť do ich pôvodnej kvality.[1] Väčšina metód na rekonštrukciu sú založené konvolúcii aplikovanej globálne na celý obrázok. Poškodenie obrázku môže byť spôsobené viacerými dôvodmi: defekty na optických šošovkách, zlé zaostrenie, pohyb objektu, zrnitosť, skenovanie fotografii atď. Rekonštrukciu obrázku je možné dosiahnuť napríklad dekonvolúciou vo frekvenčnej oblasti alebo Wienerovým filtrom.[4]

Kompresia obrazu[upraviť | upraviť kód]

Cieľom kompresie obrázku je zníženie jeho dátovej veľkosti. Redukcia dátovej veľkosti nám umožňuje nielen skladovanie väčšieho množstva obrázkov na danom pamäťovom úložisku aj rýchlejšie sťahovanie a posielanie obrázkov po sieti. Kompresiu delíme na stratovú a bezstratovú. Bezstratová kompresia je vhodná na umelé obrázky ako technické kresby, ikony a obrázky kde je preferované vysoké rozlíšenie ako obrázky z medicíny alebo skeny určené pre archivačné účely. Metódy poskytujúce bezstratovú kompresiu sú napríklad Huffmanove kódovanie a Lempel Ziv kódovanie. Stratová kompresia je vhodná na prirodzené fotografie, kde malá strata presnosti akceptovaná ku dosiahnutiu podstatnej redukcii dátovej veľkosti. Pri stratovej kompresii sa aplikujú DCT, vlnková transformácia nasledované kvantovaním a kódovaním symbolov.[5]

Segmentácia obrazu[upraviť | upraviť kód]

Ukážky segmentácie obrázkov

Cieľom segmentácie je rozdeliť obrázok na časti ktoré majú silnú koreláciu s objektami alebo plochami z reálneho sveta zobrazených na obrázku.[4] Segmentácia obrazu sa snaží rozdeliť obraz na niekoľko častí zgrupovaním pixelov do regiónov, ktoré majú podobné vlastnosti ako napr. intenzitu, farbu, textúru... Hlavným cieľom je jasne oddeliť náš objekt záujmu o pozadia.[6]

Niekoľko metód segmentácie obrázku:

Rozpoznanie obrazu[upraviť | upraviť kód]

Rozpoznanie obrazu (angl. image recognition) je schopnosť identifikovať napríklad objekty, miesta, ľudí, text alebo činnosť na obrázku. Rozpoznanie obrazu je široko používané v strojovo orientovaných vizuálnych úlohách, ako je napríklad označovanie obsahu obrázkov tagmi, vyhľadávanie obrázkov na základe obsahu, navigovanie robotov a riadenie autonómnych áut. Algoritmy na rozpoznávanie obrázkov sú väčšinou založené na hlbokom strojovom učení a najlepšie výsledky dosahujú konvolučné neurónové siete.[7]

Niekoľko techník ktoré vedú k rozpoznaniu obrazu:[4]

  • graph matching
  • neurónové siete
  • genetické algoritmy
  • simulované žíhaní
  • boosting...
Ukážka Gaussovho vyhladenia

Vyhladenie obrazu[upraviť | upraviť kód]

Hlavným cieľom je odstránenie šumu v obrázkoch a tým zvýšenie jeho kvality. Väčšinou ide o nejakú formu priemerovanie hodnôt pixelov z okolia. Vyhladzovanie čelí problému rozmazania ostrých hrán v obrázku, preto by sme mali brať v ohľad algoritmy, ktoré ostré hrany zachovávajú. Tieto algoritmy počítajú priemer z okolia len z pixelov ktoré majú podobné hodnoty ako spracovávaný bod. Lokálne vyhladenie obrazu dokáže efektívne eliminovať impulzný šum alebo niektoré vady ako tenké prúžky, ale nedokáže si poradiť napríklad s veľkými škvrnami.[4]

Niekoľko algoritmov na vyhladenie obrazu:

  • Gaussovo vyhladenie
  • Kuwahara filtrovanie
  • bilaterálne filtrovanie
  • mediánový filter a ďalšie...

Aplikácie[upraviť | upraviť kód]

Spracovanie obrazu má množstvo praktických aplikácii:[8]

  • úpravy obrazov vytvorených pomocou foto a video techniky - tieto úpravy sú často motivované chybnou expozíciou, rozmazaním, šumom alebo potrebou zvýšenia kontrastu, tak aby sa obrázky pozorovateľom „čo najviac páčili“.
  • zvýraznenie niektorých rysov obrazu - oblasti ktoré chceme zvýrazňovať môžu byť definované určitým jasom, farbou, obsahom vysokých frekvencii, textúrou alebo inak popísané oblasti. Príkladom zvýraznenia rysov je napr. hľadanie hrán v obrázku.
  • detekcia objektov a vzorov
  • delenie obrazu na súvisiace oblasti (segmentácia) - používa sa hlavne ako predspracovanie pre ďalšie metódy počítačového videnia. Zmyslom vyhodnotenia môže byť napríklad určenie typu snímku pre ďalšie úpravy (napr. veľa modrej v hornej časti - asi krajinka, veľký obsah farby kože - asi portrét) alebo kontrola výrobkov v priemyselných aplikáciách.
  • geometrické transformácie obrazu - cieľom je zmeniť geometriu obrazu a tým ho transformovať do iného tvaru. Využitím môže byť korekcia vád objektívu, úpravy obrázkov pred spájaním alebo umelecké stvárnenie fotiek.
  • skladanie obrazov - uplatňuje sa pri tvorbe panoramatických snímok na základe ich prekryvu.
  • meranie rozmerov, kvality povrchu a ďalšie... - meranie rozmerov a kvalita povrchu je jednou z jednoduchých aplikácii spracovania obrazu, ktorá sa uplatňuje v priemyselných aplikáciách. Meranie vychádza z detekcie hrán a jednoduchých geometrických výpočtov. Pri meraní kvality sa zase hľadajú pixely s podstatne odlišnou hodnotou.

Referencie[upraviť | upraviť kód]

  1. a b c SUMITHRA, BUVANA, SOMASUNDARAM. A Survey on Various Types of Image Processing Technique [online]. International Journal of Engineering Research & Technology (IJERT), Marec 2015, [cit. 2020-11-01]. Dostupné online.
  2. RUSS, JOHN C.. Computer-Assisted Microscopy : the Measurement and Analysis of Images. Boston, MA : Springer US, 1990. Dostupné online. ISBN 978-1-4613-0563-7.
  3. Image Enhancement [online]. www.mathworks.com, [cit. 2020-11-01]. Dostupné online. (po anglicky)
  4. a b c d SONKA, Milan. Image processing, analysis, and machine vision. Toronto : Thompson Learning, 2008. (3rd ed.) Dostupné online. ISBN 0-495-08252-X.
  5. RAVI, ASHOKKUMAR. Analysis of Various Image Processing Techniques [online]. International Journal of Advanced Networking & Applications (IJANA), 2017, [cit. 2020-11-01]. Dostupné online.
  6. KHAN, RAVI. Image Segmentation Methods: A Comparative Study [online]. International Journal of Soft Computing and Engineering, 2013, [cit. 2020-11-01]. Dostupné online.
  7. What is image recognition? - Definition from WhatIs.com [online]. SearchEnterpriseAI, [cit. 2020-11-01]. Dostupné online. (po anglicky)
  8. Zemčík, P.; Španěl, M. et al. Zpracování obrazu. Studijní opora. Vysoké učení technické v Brně. 2011.