Preskočiť na obsah

Zhluková analýza

z Wikipédie, slobodnej encyklopédie

Zhluková analýza alebo klastrová analýza je „skupina metód, ktorých cieľom je rozklad súboru objektov na niekoľko relatívne rovnorodých podmnožín (zhlukov) tak, aby objekty patriace do rovnakého zhluku si boli „čo najviac“ podobné, zatiaľ čo objekty pochádzajúce z rôznych zhlukov majú byť „čo najviac“ nepodobné.“[1] Klastrová analýza zahŕňa rôzne techniky, pričom sa členia na dve základné skupiny[2]:

  1. hierarchické zhlukovacie metódy
  2. nehierarchické zhlukovacie metódy

Rozlišujú sa 3 druhy úloh klastrovej analýzy[3]:

  1. nájsť dopredu nadefinované množstvo zhlukov
  2. nájsť množiny zhlukov, ktorých počet nie je špecifikovaný
  3. vytvoriť hierarchický strom

Pre všetky zhlukovacie metódy platí, že su založené na niektorej miere vzdialenosti alebo podobnosti medzi jednotkami.[4]

Na výpočet vzdialeností možno použiť euklidovskú vzdialenosť, Hammingovu vzdialenosť, Minkovskeho vzdialenosť alebo Mahalanobisovu vzdialenosť.[1]

Príkladom grafického zobrazenia zhlukov je dendrogram, možnosťou využitia klastrovej analýzy je napr. analýza socio-ekonomických dát[3]. Uplatnenie klastrovej analýzy je dôležité napríklad v regionálnej štatistike.[5]

Referencie[upraviť | upraviť zdroj]

  1. a b Archivovaná kópia [online]. [Cit. 2014-09-20]. Dostupné online. Archivované 2016-03-05 z originálu.
  2. RIMARČÍK, Marián. Zhluková analýza. Dostupné online: [1]
  3. a b HENDL, Jan. Přehled statistických metod: analýza a metaanalýza dat. 3. přeprac. vyd. Praha : Portál, 2009. 696 s. ISBN 978-80-7367-482-3. S. 493-496. (po česky)
  4. ANALÝZA STATISTICKÁ VÍCEROZMĚRNÁ. In: JELÍNEK, Jaroslav, ed. Ekonomická encyklopedie 1 A-O. 2., přeprac. vyd. Praha: Svoboda, 1984. s. 29.
  5. VOINEAGU BALU, Mariana-Elena; FURTUNA, Felix. Clusters Analyses in Regional Statistics. 2006. Dostupné online: [2] (po anglicky)