Statistické vzorce použité k vyhodnocení úloh
Základní literatura pro zpracování testů
[1] Chráska,M.:
Didaktické testy, Paido, Brno, 1999.
Základní statistické veličiny jako průměr, rozptyl nebo směrodatná odchylka jsou počítány podle obvyklých statistických vzorců.
Histogram výsledků by měl vykazovat "normální" Gaussovo rozdělení.
Validita a reliabilita didaktického testu
Validita
U běžných testů se jedná především o obsahovou validitu, tedy o to, aby byl obsah úloh reprezentativním vzorkem zkoušeného učiva.
Pro testy, které zkoumají výsledky výuky, jsou kritériem validity především příslušná kurikula vyučovací předmětů.
Reliabilita
Reliabilita testu určuje, jak jsou výsledky testu ovlivněny náhodnými vlivy (okamžitá kondice testovaného, vnější podmínky, apod.).
Vysoká reliabilita znamená, že test je těmito vlivy dotčen minimálně.
K exaktnímu stanovení míry reliability testu slouží koeficient reliability, který nabývá hodnot od 0 (naprostá nespolehlivost testu) do 1 (dokonalá spolehlivost testu).
V běžné praxi by se tento koeficient měl pohybovat nad hodnotou 0,8. Reliabilita závisí nejen n a kvalitě testových úloh, ale i na jejich počtu.
Za spodní hranici se považuje cca 10 úloh (reliabilita je přibližně 0,6).
K výpoču koeficientu reliability lze použít např. Kuderův-Richardsonův vzorec nebo metodu půlení [1].
k - počet úloh v testu, p - počet studentů, kteří řešili určitou úlohu v testu správně, q = 1 − p, s je směrodatná odchylka celkových výsledků testu.
Obtížnost Q, index obtížnosti P, Guilfordova korekce PC
Obtížnost Q
Hodnota obtížnosti Q udává procento žáků, kteří danou úlohu řešili špatně nebo neřešili vůbec.
Q =
nn /
n,
kde
nn je počet žáků, kteří odpověděli nesprávně nebo vůbec a
n je celkový počet žáků, kteří se účastnili testu.
Za velmi obtížné se považují úlohy, jejich Q > 0.8, velmi snadné jsou pak úlohy s Q < 0.2. Extrémně obtížné úlohy (Q se blíží 1) je třeba z testu vyloučit.
Nejvhodnější úlohy mají přibližnou hodnotu Q = 0.5
Index obtížnosti P
Index obtížnosti udává procento žáků, kteří řešili danou úlohu správně.
P =
ns /
n = 1 − Q
Guilfordův koeficient PC
Jedná se o korekci indexu obtížnosti u uzavřených úloh, kdy studenti mohou správnou odpověď uhodnout.
PC = P − Q / (
a − 1), kde
a je počet distraktorů (odpovědí) testové úlohy.
Citlivost úlohy
Citlivost úlohy
bývá také někdy označována termíny "rozlišovací schopnost", "rozlišovací ostrost" nebo "diskriminativnost" úlohy.
V podstatě jde o schopnost úlohy rozlišit mezi lepšími a horšími studenty, kdy jedna skupina může být zvýhodněna.
Pro určení koeficientu citlivosti bylo navrženo několik způsobů výpočtu, založených většinou na metodě korelačních koeficientů.
Tyto koeficienty nabývají hodnot od -1 do 1, přičemž záporná hodnota koeficientu znamená, že jsou zvýhodněni horší studenti, hodnota rovna nule znamená,
že úloha nerozlišuje mezi oběma skupinami a kladná hodnota vyjadřuje zvýhodnění studentů s lepšími vědomostmi.
V praxi to znamená, že se všichni studenti rozdělí podle počtu dosažených bodů na dvě skupiny - buď přesně na lepší a horší polovinu nebo např. na horní a dolní třetinu.
Poté můžeme zvolit jednu z následujících metod výpočtu koeficientu citlivosti.
Metoda ULI
Metoda ULI - Upper-Lower-Index
patří mezi nejjednodušší způsoby výpočtu poskytujících uspokojivé hodnoty.
Vychází z rozdílu hodnot ukazatelů obtížnosti určených ve skupině lepších a ve skupině horších studentů:
kde
d je koeficient citlivosti ULI,
nL je počet správných odpovědí na danou otázku ve skupině lepších studentů,
nH je počet správných odpovědí na danou otázku ve skupině horších studentů a
N je celkový počet studentů.
U koeficientu ULI se požaduje, aby v případě úloh jejichž koeficient obtížnosti je v rozmezí 30 - 70, resp. 20 - 30, byla jeho hodnota alespoň 0,25, resp. 0,15.
Nízká hodnota tohoto koeficientu je ve
Vyhodnocení testových úloh vyznačena varovným červeným podbarvením u příslušné otázky.
Tetrachorický koeficient rtet
Tato metoda je náročnější na vypracování, ale poskytuje většinou spolehlivější výsledek.
Pro výpočet tohoto koeficientu sestavíme nejprve tzv. tetrachorickou tabulku, která uvádí zvlášť počty studentů kteří odpověděli správně (+) a kteří odpověděli špatně nebo neodpověděli vůbec (−) ,
přičemž se berou v úvahu dvě skupiny: lepší (L) a horší (H). Pro názornost uvádíme tabulku, ve které jsou jednotlivé počty označeny písmeny a, b, c, d.
Tetrachorický koeficient se potom vypočítá ze vztahu:
V případě, že dělení studentů na skupiny L a H bylo provedeno přesně na dvě poloviny, hodnota tetrachorického koeficientu by neměla být nižší než 0,15.
Vybíráme-li skupiny jiným způsobem (např. horní a dolní třetina nebo čtvrtina) je potřeba uplatnit přísnější měřítko.