Úvod k didaktickým testům
Úvod
Didaktický test je nástroj systematického zjišťování (měření) výsledků výuky. Spadají pod něj dva rozdílné typy testů. Jsou to jednak testy úspěšnosti výsledků výuky, které určují míru a kvalitu osvojení vědomostí a dále testy na přijímací zkoušky, které měří schopnost dalšího studia žáka. Základem didaktického testování je přiřazování číselných reprezentací (bodů, známek) určitému latentnímu měřenému znaku, jako je např. stupeň osvojení vědomostí, který se empiricky projevuje určitým chováním. Druhy didaktických testů je možné rozdělit podle několika kritérií:
KLASIFIKAČNÍ HLEDISKO |
DRUHY TESTŮ |
||||
měřená charakteristika výkonu |
rychlosti (speed) |
výkonu (power) |
|||
dokonalost přípravy testu a jeho příslušenství |
standardizované |
kvazistandar-dizované |
nestandardizované |
||
povaha činnosti testovaného |
kognitivní |
psychomotorické |
|||
míra specifičnosti učení zjišťovaného testem |
výsledků výuky |
studijních předpokladů |
|||
interpretace výkonu |
relativního výkonu (rozlišující) |
absolutního výkonu (ověřující) |
|||
Časové zařazení do výuky |
vstupní |
formativní (průběžné) |
sumativní (výstupní) |
||
tematický rozsah |
monotematické |
polytematické |
|||
míra objektivity skórování |
objektivně skórovatelné |
subjektivně skórovatelné |
Didaktické testování je pravděpodobně jedinou skutečně masově rozšířenou diagnostickou metodou, kterou během své profesní kariéry mnohokrát aplikuje každý učitel. Podle M. Chrásky (1999) však učitelé v praxi mají o testech a testování mnohdy neucelené a často velmi zkreslené představy. Vzhledem k tomu, že v současné době se pro potřeby škol vydává jen velice omezená nabídka standardizovaných didaktických testů, jsou učitelé nuceni pracovat v drtivé většině s nestandardizovanými, tzv. „teacher made“ testy vlastní provenience. Při tvorbě „teacher made“ testů postupují učitelé často intuitivně a ignorují i základní pravidla pro tvorbu kvalitního didaktického testu, který zde vystupuje jako výzkumný nástroj systematického měření výsledků výuky. Přitom známkám získaných vyhodnocením testů učitelé přikládají význam zpravidla zcela neadekvátní kvalitám testu. U „teacher made“ testů navíc nejsou známy ani jejich základní vlastnosti, což opět problematizuje výsledky získané pomocí takovýchto testů, resp. další využívání a dopad těchto výsledků. (Je třeba si uvědomit, že např. i o tak závažném životním kroku, jako je přijetí na střední a vysoké školy, rozhodují zpravidla výsledky ne vždy profesionálně a kvalitně připravených testů, které navíc mají velice nízkou predikční validitu.) Přitom lze konstatovat, že používání didaktických testů je na základních i středních školách velice rozšířené a prožívá svůj boom.
Stručný nástin historie didaktického testování
Podle S. Vrány (1948) se systém školního zkoušení a hodnocení žáků v českých zemích ustálil sice až koncem 19. století, ale jeho počátky ve studijních řádech jezuitských škol se datují již rokem 1599. Tyto řády zavádějí již nám dobře známé věci, jako je klasifikační stupnice (první dochovaná písemná zmínka o použití klasifikace pochází z roku 1530), katalog žáků vedený třídním učitelem či důraz kladený na písemné zkoušky. Úloha zkoušení a jeho význam měly velmi kolísavou úroveň. Zcela zásadní změnou se ukázalo zavedení maturity na gymnáziích v roce 1854 podle pruského vzoru. Zde byl položen základ systému, který spočívá v tom, že hodnocení prospěchu žáků se stalo neodmyslitelnou součástí vyučování v systému tříd a učebních předmětů. Jako určitý rudiment minulosti přetrvává až do dneška vysoký společenský význam školního známkování. Žáci se neučí proto, aby něco uměli a něco se dozvěděli, ale aby měli dobré známky. (Což mnohdy nebývá ani jejich vnitřním motivátorem, ale vyžadují to po nich rodiče.) Byť je tato „idea“ vlastní zejména utilitaristickému učebnímu stylu, můžeme její vliv zřetelně vysledovat i v majoritním povrchovém stylu učení.
Zkoušení a hodnocení žáků procházelo dále dalšími peripetiemi. Ač relativně ustálená součást vyučování, přesto byla vystavena různým tlakům. První kritická vlna je spojena s osobností Lva Nikolajeviče Tolstého, který ve jménu svobodné výchovy odmítal zkoušení jako takové. „Já učitel oceňuji vědomosti, třebas ani žák mně, ani já sobě neodříkával úloh, a chce-li cizí člověk oceniti ty vědomosti, nechť žije nějakou dobu s námi, pozná výsledky našich vědomostí a využití jich v životě. Jiného prostředku není a všechny pokusy zkoušek jsou jen klamem, lží a překážkami vyučování.“ (L. N. Tolstoj, 1914). Zpětnovazebná informace tedy měla být získána v podstatě aplikací žákových vědomostí v praktických situacích. Což je ostatně myšlenka, která v současných inovativních a alternativních trendech ve vzdělávání prožívá svoji renesanci (Škoda, Doulík, 2002).
Další kritice bylo školní zkoušení a hodnocení žáků vystaveno ze strany reformních pedagogických směrů, u nás zosobňovaných především V. Příhodou. Terčem této kritiky se stala zejména nízká objektivita zkoušení. Podle Příhody známka není jen měřítkem žákova výkonu, ale vyjadřuje také posouzení jeho schopností a dosažitelné výsledky (J. Hniličková, M. Josífko, A. Tuček, 1972). Jako alternativu dosavadnímu způsobu zkoušení doporučuje Příhoda právě didaktické testy, přičemž z výčtu Příhodou uváděných pozitiv testů vyplývá, že hovoří především o objektivně skórovatelných testech, resp. přesněji testových úlohách.
Ve 30. letech minulého století vystoupil s vážnými námitkami vůči didaktickým testům O. Chlup. „Mechanismus této metody (didaktického testování – pozn. autoři) nemůže správně hodnotiti ani soustavu vědění a myšlení žákova, ani jednotlivých poznatků, jejichž důležitost odhadnouti jest koneckonců vždy věcí subjektivního posouzení. Měřením odvrací se žactvo od vážného myšlení a tvořivá činnost žákova, rozvíjející se pod vedením učitelovým, ubíjí se v bičovaném jezuitském závodění.“ (O. Chlup, 1931). Spor o didaktické testy se v praxi projevil ve dvou rovinách. V té první vedl ke zdokonalování didaktických testů, precizaci jejich teorie a kombinaci testů s jinými zkušebními metodami. Ve druhé rovině vedl k tomu, že řada učitelů při vyučování didaktické testy prostě vůbec nepoužívala. Zdrženlivý postoj Chlupův a Kádnerům k reformám spojeným s didaktickými testy neznamená, že by přijímali tradiční systém školního hodnocení žáků. Jejich reformní úsilí však směřovalo spíše k oslabení významu, jaký mělo kodifikované školní hodnocení (známky a vysvědčení) a k vymýcení samoúčelného zkoušení odůvodněného jen potřebou klasifikovat žáky. Bohužel tento nešvar se má čile k světu i v našem současném školství.
Ve zkušebním řádu pro školy 1. až 3. stupně z 12. 12. 1950 vyplývajícího z neblaze proslulé Nejedlého školské reformy z roku 1948 je výslovně zakázáno používání testů, bodovacích systému apod. na školách. Tento zkušební řád v podstatě zakonzervoval systém zkoušení a hodnocení, který byl vytvořen na konci 19. století a na dlouho přerušil vývoj didaktického testování u nás. Teprve na sklonku 60. let minulého století se přístup k testování začíná velmi zvolna měnit. Týká se to však především psychologických testů. Didaktické testy jsou sestavovány v podstatě pouze pro potřeby pedagogických výzkumů a ve školní praxi se začínají objevovat při přijímacím řízení.
Teprve po roce 1989 začaly do našeho školství pronikat ve větší míře různé reformní, alternativní a inovativní směry ve vzdělávání, které s sebou přinesly (i v souvislosti s „amerikanizací“ naší společnosti) větší příklon k didaktickým testům. Didaktické testování dnes zažívá svůj boom a lez předpokládat jeho rostoucí význam i do budoucnosti.
Didaktické testování a chyby s ním související
V reakci na negativa ústního zkoušení, která jsou v dnešní době v odborných publikací často diskutována, a v souvislosti s obecným trendem se ve školní praxi začínají masově uplatňovat didaktické testy. P. Byčkovský (1982) definuje didaktické testy jako nástroj systematického měření výsledků výuky. Do didaktických testů dnes poněkud nesprávně spadají dva rozdílné typy testů – testy úspěšnosti, které měří výsledky výuky a testy na přijímací zkoušky, které měří schopnost studia žáka. Zatímco testy úspěšnosti by měly být zaměřeny především na obsahovou validitu, testy na přijímací zkoušky pak především na predikční validitu. Je chybou, když testy na přijímací zkoušky mají charakter testů úspěšnosti, což bývá naprosto běžné.
Z hlediska metodologie pedagogického výzkumu představuje didaktické testování nepřímé asociativní měření na slabých, většinou ordinálních škálách. Měření je tedy vždy zatíženou určitou chybou, se kterou je nutné počítat při vyhodnocování výsledků měření. Především začínající učitelé se při didaktickém testování dopouštějí řady chyb, které výsledky získané didaktickými testy značně znehodnocují:
Nízká validita didaktických testů, resp. testových výsledků. Bývá determinována snahou učitelů o vtělení maximálního množství učiva do didaktického testu. Výsledkem je, že takový test měří spíše schopnost rychločtení a rychlopsaní, než to, co se žák skutečně naučil. Časový stres doprovázející takto koncipované testy nutí žáky odpovědi spíše odhadovat, než o nich skutečně přemýšlet.
Teacher-made didaktické testy mají sklon k testování formálních a nepodstatných věcí. Učitelé raději testují to, co se snadno formuluje do testových otázek, snadno opravuje a snadno vyhodnocuje, než to, co je v daném učivu skutečně podstatné. Nehledě k faktu, že začínající učitelé považují za podstatné naprosto všechno.
Počet úloh v testu. Tento důležitý aspekt souvisí s tzv. chybou měření. Čím je počet úloh v testu nižší, tím narůstá relativní velikost chyby měření. V testu o 25 úlohách představuje chyba měření přibližně 8,6%, v testu o 10 úlohách už 13,6% a v běžné desetiminutovce se 4 otázkami už 21,5%. A to jde přitom o čistou chybu měření! Vezmeme-li dále v úvahu náhodné vlivy vztahující se k osobě testovaného (např. momentální indispozice, vliv vnějších podmínek atd.), získáváme výsledek, který je ve velké míře ovlivněn jinými faktory, než jsou skutečné žákovy znalosti. Proto by v didaktických testech nikdy nemělo být méně než 10 úloh. Tato hranice se považuje za naprosté minimum. Znamená to, že výsledky prakticky všech tzv. „desetiminutovek“ jsou natolik zkreslené, že nemohou poskytovat jinou informaci než hrubě orientační.
Neadekvátní obtížnost testu. Zejména začínající učitelé nejsou schopni posoudit reálné možnosti svých žáků a vytvářejí testy obvykle s velmi vysokou obtížností. Proto se doporučuje konzultace vytvořeného testu se zkušenějším kolegou (tzv. expertní posouzení), který případně doporučí určité korekce.
Přítomnost tzv. „chytáků“. Zejména v testech pro základní školy by se „chytáky“ neměly vyskytovat vůbec! Zjišťují totiž zcela jiné parametry a vlastnosti žáků, než výsledky výuky a schopnost žáků aplikovat získané vědomosti.
Srozumitelnost zadání úloh. Pro žáky představuje obecně problém správné porozumění psaného textu. Je proto nutné úlohy formulovat jasně, stručně, úplně a jednoznačně. Je třeba vyhýbat se složitým souvětím a zbytečně dlouhým textům. Stejně tak jako záporně formulovaným otázkám, neboť dvojí zápor češtiny může velmi znesnadňovat pochopení zadání úlohy. (Např. Není pravda, že kyselina siřičitá není silná kyselina. ANO – NE.)
Paralelní varianty testu. Měly by obsahovat tytéž otázky, ale pouze v jiném pořadí nebo jen málo upravené (např. změněný sled distraktorů u úloh s výběrem odpovědi, změna hodnoty téže veličiny při výpočtu z rovnice atd.). Budou-li paralelní varianty testů z jiných úloh, nebudou se shodovat v klíčových parametrech testu, jako je obtížnost a citlivost a výsledky pak vůbec nemusí být validní.
Přítomnost neadekvátních zdrojů obtížnosti. Jedná se např. o text s mnoha odbornými termíny, čísla uváděná s velkým počtem desetinných míst, složité převody jednotek atd. Tyto faktory opět znesnadňují pochopení úlohy a tím přispívají k tomu, že test měří spíše schopnost porozumění psanému textu, než např. schopnost výpočtu z chemické rovnice.
Vzájemná závislost úloh. Didaktický test by měl vždy obsahovat úlohy navzájem nezávislé, tedy takové, v nichž řešení jedné úlohy nepodmiňuje řešení dalších úloh. Tím jsou totiž hendikepováni žáci, kteří by danou úlohy vyřešili správně, ale nemohou, protože nevyřešili úlohu, na jejíž řešení řešená úloha navazuje.
Nezamýšlené nápovědi. V textu zadání předcházejících či následujících úloh nesmí být obsažena nápověda pro řešení jiných úloh. Stejně tak by neměly být v zadání úloh s výběrem odpovědí používány tzv. do očí bijící distraktory. Tedy varianty odpovědi, z nichž jedna je výrazně méně plausibilní.
Přestože je didaktické testování ve školní praxi zatížené mnoha chybami, je známkám získaných na základě didaktického testování je přisuzována značná váha. Z tohoto úhlu pohledu je více než zarážející, že v rámci pregraduální přípravy studentů učitelství se tvorbě, použití a hodnocení didaktických testů dosud nevěnuje systematická pozornost, ačkoliv didaktické testování je hojně používanou metodou na všech stupních škol. Z toho vyplývá, že učitelé využívají didaktické testování spíše intuitivně, a tudíž od něj nemohou očekávat to, co od něj ale ve skutečnosti očekávají – totiž kvalitní, rychlé, přesné, spolehlivé a objektivní měření výsledků výuky. Z toho důvodu se cvičebnice umožňující praktické procvičení správné konstrukce didaktických testů (nejen) pro učitele jeví jako velmi potřebná.
Základní použitá literatura
Byčkovský, P. Základy měření výsledků výuky. Tvorba didaktického testu. Praha: ČVUT, 1982.
DOULÍK, P., ŠKODA, J. Cvičebnice obecné didaktiky. [CD-ROM]. Ústí nad Labem: PF UJEP, 2005. Dostupné na http://cvicebnice.ujepurkyne.com [online]
HNILIČKOVÁ, J., JOSÍFKO, M., TUČEK, A. Didaktické testy a jejich statistické zpracování. Praha: SPN, 1972. ISBN -
CHLUP, O. O školu měšťanskou. Brno: 1931. ISBN –
CHRÁSKA, M. Didaktické testy. Brno: Paido, 1999. ISBN 80-85931-68-0.
ŠKODA, J., DOULÍK, P. Hodnocení ve výuce aktivní konstrukcí poznatků. e-Pedagogi-um, 2002, 1. mimořádné č., s. 20-25. ISSN 1213-7758.
ŠKODA, J., DOULÍK, P. Změny učebních činností – nezbytný předpoklad modernizace výuky chemie. In Acta Facultatis Paedagogicae Universitatis Tyrnaviensis. Séria D. Supplementum 1. Smolenice, Trnavská Univerzita, Pedagogická fakulta, 2002. s. 111-117. ISBN 80-89074-47-2.
TOLSTOJ, L. N. Články pedagogické I. a II. Praha, 1914. ISBN -
VRÁNA, S. Zkoušení a známkování. Praha: Stání nakladatelství, 1948. ISBN –