Hĺbková analýza dát

z Wikipédie, slobodnej encyklopédie
(Presmerované z Data mining)
Prejsť na: navigácia, hľadanie

Hĺbková analýza dát (ang. data mining [dejta majnyn] – dolovanie z dát) alebo neodborne dolovanie dát je proces analýzy dát z rôznych perspektív a ich sumarizácia na užitočné informácie. Spravidla ide o extrahovanie užitočných informácií z veľkých databáz, hľadanie korelácií alebo vzorov spomedzi tisícok polí v relačných databázach.

Využíva metódy štatistiky, matematiky (matematické modelovanie = klasifikačné pravidlá alebo stromy, regresia, zhluková analýza), umelej inteligencie (neuronové siete, rozpoznávanie, samoučiace sa algoritmy), nástroje OLAP (on-line analytické spracovanie)[1] a strojového učenia.

Obsah

Typy modelov [upraviť]

  • Predikčné modely – cieľom je na základe historických dát predpovedať budúcnosť
  • Segmentačné modely – cieľom je roztriediť množstvo dát na zvládnuteľný počet homogénnych skupín

Aplikácia v praxi [upraviť]

  • Propensity to Buy - cross-sell (predaj ďalších produktov existujúcim zákazníkom) a up-sell (zvýšenie spotreby daného produktu, doplnky)
  • Credit risk - modelovanie pravdepodobnosti nesplácania úveru
  • Fraud - identifikácia podvodov
  • Churn - identifikácia zákazníkov náchylných na prechod ku konkurencii
  • Segmentácia - zoskupovanie do homogénnych skupín
  • Market Basket Analysis - analýza nákupného koša
  • Diagnostické modely
  • Modely analýzy časových radov
  • Text mining

Delenie [upraviť]

Metodológie [upraviť]

  • CRISP DM (SPSS)
  • SEMMA (SAS)
  • Virtuos cycle of data mining (Berry & Linoff)

Typické oblasti využitia [upraviť]

Algoritmy [upraviť]

Softvér [upraviť]

Referencie [upraviť]

  1. Kučerová, Helena. data mining. In KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2011-05-15]. Dostupné z WWW: [1].

Iné projekty [upraviť]

Externé odkazy [upraviť]