Å måle studenters prestasjoner på en meningsfull måte er en vanskelig oppgave, og det finnes et helt studiefelt innen psykologi dedikert til temaet denne typen måling: psykometri . For at en vurdering i et bestemt studieområde skal oppfylle sitt formål, må poengsummen gjenspeile kunnskaps- eller ferdighetsnivået til personen som tar testen. Flere standarder er etablert innen psykometri for pedagogisk evaluering for å sikre objektiv måling av testdeltakernes nivåer, og en av disse standardene involverer nøyaktighet.
Begrepet nøyaktighet er sentralt, ettersom det fungerer som en paraplybetegnelse for to konsepter som er sentrale i vurderingspsykometri: validitet og pålitelighet. Sammen fungerer disse to konseptene som indikatorer for kvaliteten og nøyaktigheten til datainnsamlingsverktøy – i utdanningsverdenen refererer dette til vurderingene som brukes til å samle inn testdeltakernes poengsummer.
Så hva er validitet og reliabilitet?
Validitet: I sammenheng med pedagogiske vurderinger er en test gyldig hvis den måler det den er utformet for å måle. Dette betyr at validitet ikke er en egenskap ved selve testen, men refererer til i hvilken grad en resulterende poengsum kan brukes til å utlede nivået til testtakeren.
Pålitelighet: Hvorvidt en test er pålitelig har derimot ingenting å gjøre med innholdet eller hva den er utformet for å måle, men snarere om den måler det den skal måle konsekvent. Med andre ord refererer det til i hvilken grad poengsummene fra en bestemt test er konsistente fra gang til gang.
Av de to anses validitet generelt som den viktigste for kvaliteten og nøyaktigheten av vurderingen, fordi den er knyttet til selve innholdet i en vurdering.
Hvordan vet du om en test er gyldig?
Kort sagt innebærer det å fastslå om en test er gyldig eller ikke å finne bevis som knytter (tolkningen) av testresultatene til konseptene testen er utformet for å måle. Disse bevisene er hentet fra forskjellige kilder og tar forskjellige former, avhengig av hvilken type validitet de brukes til å støtte. Det er tre hovedtyper validitet som må vurderes for pedagogiske vurderinger, og det må være bevis for alle disse før en test kan aksepteres som gyldig.
For å finne ut om testen din er gyldig, still deg selv følgende spørsmål:
- Hva ønsker du å måle, og dekker vurderingen dette? Dette kalles innholdsvaliditet .
- Hvor godt måler vurderingen innholdet? Dette kalles kriterievaliditet .
- Måler det faktisk innholdet (eller noe annet)? Dette kalles bekonstruksjonsvaliditet .
Hvis du finner bevis for alle disse validitetsmålene i vurderingene du forbereder for elevene dine, kan du anse dem som en gyldig metode for å teste elevenes kunnskap.
Hvordan vet du om en test er pålitelig?
Når du har fastslått at vurderingen din er gyldig, er neste test om den fungerer bra når den brukes i forskjellige scenarier, for eksempel med forskjellige grupper, eller over forskjellige tidspunkter. Dette er essensen av pålitelighet.
Det finnes tre måter å undersøke påliteligheten til en test på, og disse kan besvares ved å stille følgende spørsmål:
- Er resultatene av testen din replikerbare? Med andre ord, oppnås lignende resultater hvis en gruppe elever tar testen to ganger? Dette kalles test-retest-reliabilitet .
- Oppnås lignende resultater hvis lignende vurderinger tas innen kort tid? Dette refererer til likhet mellom poengsummer så vel som posisjoner, og er kjent som alternativ form for reliabilitet .
- Er testen internt konsistent? Dette måler hvordan innholdet i en vurdering fungerer sammen for å evaluere forståelsen av et konsept, og er kjent som intern konsistensreliabilitet .
Hvis du finner bevis for alle disse pålitelighetsmålene i vurderingene du forbereder for elevene dine, kan du anse dem som en pålitelig metode for å teste elevenes kunnskaper.
—
Validitet og pålitelighet utgjør til sammen de viktigste faktorene for å bedømme om en vurdering gir et nøyaktig mål på en testdeltakers kunnskaper eller ferdigheter innen et gitt fagområde. En test er gyldig hvis tolkningen av en testdeltakers poengsummer kan relateres direkte til hva testen er utformet for å måle, og den er pålitelig hvis dette er tilfelle over flere anvendelser av testen – både for forskjellige testdeltakere og for den samme testdeltakeren som tar testen til forskjellige tider. Med andre ord er disse to konseptene viktige hensyn når du forbereder tester, og det er avgjørende å bruke dem som målestokker for å sikre kvaliteten på vurderingene du bruker med studentene dine.
