Hĺbková analýza dát

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie

Hĺbková analýza dát (ang. data mining [dejta majnyn] – dolovanie z dát) alebo neodborne dolovanie dát je proces analýzy dát z rôznych perspektív a ich sumarizácia na užitočné informácie. Spravidla ide o extrahovanie užitočných informácií z veľkých databáz, hľadanie korelácií alebo vzorov spomedzi tisícok polí v relačných databázach.

Využíva metódy štatistiky, matematiky (matematické modelovanie = klasifikačné pravidlá alebo stromy, regresia, zhluková analýza), umelej inteligencie (neuronové siete, rozpoznávanie, samoučiace sa algoritmy), nástroje OLAP (on-line analytické spracovanie)[1] a strojového učenia.

Obsah

[upraviť] Typy modelov

  • Predikčné modely – cieľom je na základe historických dát predpovedať budúcnosť
  • Segmentačné modely – cieľom je roztriediť množstvo dát na zvládnuteľný počet homogénnych skupín

[upraviť] Aplikácia v praxi

  • Propensity to Buy - cross-sell (predaj ďalších produktov existujúcim zákazníkom) a up-sell (zvýšenie spotreby daného produktu, doplnky)
  • Credit risk - modelovanie pravdepodobnosti nesplácania úveru
  • Fraud - identifikácia podvodov
  • Churn - identifikácia zákazníkov náchylných na prechod ku konkurencii
  • Segmentácia - zoskupovanie do homogénnych skupín
  • Market Basket Analysis - analýza nákupného koša
  • Diagnostické modely
  • Modely analýzy časových radov
  • Text mining

[upraviť] Delenie

[upraviť] Metodológie

  • CRISP DM (SPSS)
  • SEMMA (SAS)
  • Virtuos cycle of data mining (Berry & Linoff)

[upraviť] Typické oblasti využitia

[upraviť] Algoritmy

[upraviť] Softvér

[upraviť] Referencie

  1. Kučerová, Helena. data mining. In KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2011-05-15]. Dostupné z WWW: [1].

[upraviť] Iné projekty

[upraviť] Externé odkazy