Klasická teória testov

Klasická teória testov (angl. Classical test theory), skrátene CTT je svojou podstatou spojená s psychometrickou teóriou testov, ktorá predpovedá výsledky psychologického testovania, ako sú náročnosť položiek alebo schopnosti testovaného. Vo všeobecnosti je hlavným cieľom klasickej teórie testov porozumieť a vylepšiť reliabilitu (spoľahlivosť) psychologických testov. Klasická teória testov môže byť považovaná za synonymum teórie skutočného skóre (True Score Theory). Pojem „klasická“ neponímame len v rámci chronológie týchto modelov, ale aj ako kontrast s inými, nedávnymi psychometrickými teóriami; vo všeobecnosti myslíme hlavne teóriu odpovedí na položku (angl. Item Response Theory), skrátene IRT, ktorá nesie označenie „moderná“ podobne ako v „moderná teória latentných rysov“. Klasická teória ako ju poznáme dnes, bola kodifikovaná Novickom (1966) a popísaná v klasických textoch ako napríklad Lord & Novick (1968) a Allen & Yen (1979/2002). Z týchto pôvodných publikácií vychádza popis klasických teórií testovania.

Pojmy – Definície[upraviť | upraviť zdroj]

Klasická teória testov predpokladá, že každá osoba má svoje skutočné skóre (T), ktoré získa v tom prípade, ak sa v meraní nevyskytnú žiadne chyby. Skutočné skóre osoby je definované ako očakávané číslo správneho skóre nad nekonečným množstvom testových položiek. Žiaľ tí, ktorí používajú testy nikdy nepozorujú skutočné osobné skóre, len pozorované skóre (X). Z tohto vyplýva, že pozorované skóre = skutočné skóre + chyby.

      X          =       T        +     E
observerd score      true score       error

Klasická teória testov sa zaoberá vzťahmi medzi troma premennými X, T a E v populácii. Tieto vzťahy sa používajú na vyjadrenie kvality testových skóre. V tomto ohľade je najvýznamnejším konceptom reliabilita (spoľahlivosť). Reliabilita pozorovaného testového skóre X, ktoré je označené ako ${\rho _{XT}^{2}}$ , je definovaná ako pomer odchýlky skutočného skóre ${\sigma _{T}^{2}}$ od pozorovanej odchýlky skóre ${\sigma _{X}^{2}}$ :

${\rho _{XT}^{2}}={\frac {\sigma _{T}^{2}}{\sigma _{X}^{2}}}$

Odchýlka pozorovaných skóre môže vyjsť ako rovná súčtu odchýliek skutočných skóre a odchýliek chybových skóre, tento výsledok zapíšeme takto:

${\rho _{XT}^{2}}={\frac {\sigma _{T}^{2}}{\sigma _{X}^{2}}}={\frac {\sigma _{T}^{2}}{{\sigma _{T}^{2}}+{\sigma _{E}^{2}}}}$

Táto rovnica, ktorá formuluje pomer signál-šum sa intuitívne odvoláva na nasledovné tvrdenie: Reliabilita testových skóre sa stáva vyššou v tej časti chybových odchýliek, v ktorých testové sa testové skóre stáva nižšie a naopak. Reliabilita sa rovná časti variácií testových skóre, ktoré vieme vysvetliť pokiaľ poznáme skutočné skóre. Vzťah medzi skutočným skóre a pozorovaným skóre vyjadruje odmocnina reliability.

Reliabilita[upraviť | upraviť zdroj]

Reliabilita nemôže byť odhadnutá priamo, pretože to by vyžadovalo, aby sme vedeli skutočné skóre, čo je podľa CTT nemožné. Ale odhady reliability môžu byť získané rôznymi spôsobmi. Jedným z nich je odhadnutie reliability pomocou konštrukcie nazývanej paralelný test. Základnou vlastnosťou paralelného testu je fakt, že poskytuje pre každého jedinca rovnaké skutočné skóre a rovnakú odchýlku pozorovaného skóre ako originálny test. Ak máme paralelné testy x a x´, môžeme napísať:

${\varepsilon }(X_{i})={\varepsilon }(X'_{i})$

a

${\sigma }_{E_{i}}^{2}={\sigma }_{E'_{i}}^{2}$

Z týchto predpokladov môžeme vyvodiť, že korelácia medzi skóre paralelných testov je rovná reliabilite (pozri Lord & Novick, 1968, Ch. 2).

${\rho }_{XX'}={\frac {{\sigma }_{XX'}}{{\sigma }_{X}{\sigma }_{X'}}}={\frac {{\sigma }_{T}^{2}}{{\sigma }_{X}^{2}}}={\rho }_{XT}^{2}$

Používaním paralelných testov na odhadnutie reliability je ťažkopádne, pretože paralelné testy sa zvyčajne nevyskytujú. V praxi sa táto metóda používa zriedka. Namiesto toho, výskumníci používajú meranie vnútornej súdržnosti, tiež známe ako Cronbachova alfa. Uvažujme test zložený z k jednotiek $k$ items $u_{j}$ , $j=1,\ldots ,k$ . Celkové skóre testu je potom definované ako suma skóre jednotlivých položiek, takže pre jednotlivé $i$ platí:

$X_{i}=\sum _{j=1}^{k}{U_{ij}}$

Potom sa Cronbachova alfa rovná:

$\alpha ={\frac {k}{k-1}}\left(1-{\frac {\sum _{j=1}^{k}{\sigma _{U_{j}}^{2}}}{\sigma _{X}^{2}}}\right)$

Cronbachova α môže byť použitá ako spodná hranica reliability. Tak je reliabilita testového skóre populácie vždy vyššia ako hodnota Cronbachovej α v danej populácii. Táto metóda je empiricky uskutočniteľná a je veľmi populárna medzi výskumníkmi. Výpočty Cronbachovej α sa vyskytujú v mnohých štandardných štatistických balíčkoch, ako sú SPSS a SAS. Ako už bolo spomínané vyššie, celé pôsobenie klasickej teórie testov je zamerané na to, aby sme dosiahli vhodné definície reliability. Reliabilita má za úlohu povedať niečo o všeobecných kvalitách testového skóre v otázkach. Hlavnou myšlienkou sa zakladá na pomere: čím vyššia je reliabilita – tým lepšie. Klasická teória testov neurčuje aká vysoká má reliabilita testov skutočne byť. Príliš vysoká hodnota α, povedzme nad 0,9, naznačuje nadmernosť položiek. Hodnota cca 0,8 sa odporúča pre výskum osobnosti, avšak hodnota 0,9 a viac je požadovaná pre individuálne cielené testovanie. Musíme brať do úvahy, že tieto „kritériá“ nie sú založené na odôvodnených tvrdeniach, ale ako výsledok spoločenských zvyklostí. Nie je jasné či majú zmysel alebo nie.

Alternatívy[upraviť | upraviť zdroj]

V sociálnych vedách je klasická teória testov je vplyvnou teóriou testových skóre. V psychometrii bola teória nahradená sofistikovanejšími modelmi ako napríklad IRT (teória odpovedí na položku) a teória zovšeobecňovania (angl. Generalizability Theory). Napriek tomu, IRT v sebe nezahŕňa štandardné štatistické balíčky, ako sú SPSS a SAS, keďže tieto balíčky sú väčšinou poskytované odhadmi z Cronbachovej alfy. Na to je potrebný špeciálny software.

Použitá literatúra[upraviť | upraviť zdroj]

Tento článok je čiastočný alebo úplný preklad článku Classical test theory na anglickej Wikipédii.

Allen, M.J., & Yen, W. M. (2002). Introduction to Measurement Theory. Long Grove, IL: Waveland Press.
Novick, M.R. (1966) The axioms and principal results of classical test theory Journal of Mathematical Psychology Volume 3, Issue 1, február 1966, strany 1-18
Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading MA: Addison-Welsley Publishing Company