Teori om svar på objektet - Ansökningar och test

Teori om svar på objektet - Ansökningar och test / Experimentell psykologi

Inom området för Teorin om psykometriska test Olika beteckningar har dykt upp som för närvarande heter "Theory of Item Response" (F. M. Lord, 1980). Denna beteckning visar några skillnader i förhållande till den klassiska modellen: 1.- Relationen mellan det förväntade värdet av ämnets poäng och egenskapen (karakteristiken som är ansvarig för värdena) är vanligtvis inte linjär. 2.- avser att göra individuella förutsägelser utan att behöva hänvisa till den normativa gruppens egenskaper.

Du kanske också är intresserad av: Klassisk testteori Index
  1. Teori av svaret på objektet eller modellerna av latent egenskap i teorin om testen
  2. Modeller av objektresponsteori (tri)
  3. Beräkning av parametrar
  4. Provkonstruktion
  5. Tillämpningar av artikelresponsteori
  6. Tolkning av poäng

Teori av svaret på objektet eller modellerna av latent egenskap i teorin om testen

Vi ser då att denna reaktionsteori till objektet ger möjlighet att beskriva varorna såväl som individerna separat; Den anser också att svaret från ämnet beror på den kompetensnivå som har funnits inom området. Uppkomsten av dessa modeller beror på Lazarsfeld, 1950, som introducerade termen "latent drag" .

Härifrån anses det att varje individ har en individuell parameter som är ansvarig för ämnets egenskaper, även kallad "egenskap". Denna funktion är inte direkt mätbar, varför den enskilda parametern heter latent variabel. När du använder testen kan du få två olika saker, det sanna värdet och träningsskalan; Detta uppnås om vi skickar två tester på samma träning till samma grupp.

I latent egenskapsteori eller teori om svaret på objektet Den sanna poängen är det värde som förväntas från den observerade poängen. Enligt Herren är den sanna poängen och träningen samma sak men uttryckt i olika mått.

Modeller av objektresponsteori (tri)

Binomiella felmodeller: infördes av Lord (1965), vilket antar att det observerade resultatet motsvarar antalet korrekta svar som erhållits i testet (vars föremål har samma svårighet och har lokalt oberoende, det vill säga sannolikheten att svara korrekt på ett objekt påverkas inte av svaren på andra objekt).

Poisson modeller: Dessa modeller är lämpliga för de test som har ett stort antal objekt och där sannolikheten för korrekt eller felaktigt svar är liten. Inom denna grupp har vi i sin tur olika modeller:

  1. Poisson Rasch-modell, vars hypoteser är: varje test har ett stort antal binära objekt som är lokalt oberoende. sannolikheten för fel i varje objekt är liten. Sannolikheten för att ämnet gör ett fel beror på två saker: provets svårighet och ämnets förmåga. svårighetsgradens additivitet, förstås som ett resultat av att blanda två ekvivalenta test i ett enda test vars svårighet är summan av svårigheterna med de två första provningarna.
  2. Poisson modell för att utvärdera hastigheten: Denna modell föreslogs också av Rasch och kännetecknas av att hastigheten i utförandet av testet beaktas. Modellen kan ställas på två sätt: räkna antalet fel som begås och ord läs i en tidsenhet. räkna antalet fel som begåtts och tiden för att slutföra läsningen av texten. Sannolikheten att realisera ett visst antal ord av ett test (i) av ett ämne (j) under en tid (t)
  3. Ojiva Normal Modeller: är en modell som föreslagits av Lord (1968), som används i tester med dikotomartiklar och med endast en variabel gemensamt. Diagrammet skulle vara följande: De grundläggande antaganden som karaktäriserar denna modell är:
  • Den latenta variantens utrymme är endimensionell (k = 1).
  • lokalt oberoende mellan intems.
  • metriska för latent variabel kan väljas så att kurvan för varje objekt är det normala warhead.

Logistikmodeller; Det är en modell som är mycket lik den tidigare men det har också fler fördelar jämfört med sin matematiska behandling. Den logistiska funktionen har följande formulär: Det finns olika logistikmodeller beroende på antalet parametrar som har:

  • 2 parametrar logistikmodell, Birnbaum 1968, bland dess egenskaper nämner vi att det är endimensionellt, det finns lokalt oberoende, elementen är dikotom, etc.
  • 3 parametrar logistikmodell, Herre, kännetecknas av att sannolikheten att gissa rätt är en faktor som påverkar testets prestanda. 4,3. 4-parameters logistikmodell: modell som föreslogs av McDonald 1967 och Barton-Lord 1981, vars syfte är att förklara de fall där ämnen som har en hög konditionnivå inte svarar korrekt på föremålet.
  • Raschs logistikmodell: Denna modell är den som har genererat störst antal jobb trots att det har en nackdel, det är att dess anpassning till reella data är svårare. Men i motsats till detta är den fördel som gör den så använd, att den inte kräver stor Provstorlekar för din justering.

Beräkning av parametrar

Den metod som har använts mest är Maximal sannolikhet, förutom denna metod används numeriska approximationsprocedurer, som Newton-Raphson och Scoring (Rao). Maximal sannolikhetsmetod är baserad på principen att erhålla estimatorer av de okända parametrar som maximerar sannolikheten för att erhålla nämnda prover. Förutom den maximala sannolikheten används Bayesian Estimation också baserat på Bayes teorem, som består av att inkorporera all känd information, som tidigare är relevant för processen att göra slutsatser. En mer ingående studie av Bayesian metod för uppskattning av fitnessparametrar är den som gjordes av Birnbaum (1996) och Owen (1975). .

INFORMATION FUNKTIONER

Det bästa testet som kan byggas är det som ger mest information om latent drag. Kvantifieringen av denna information görs via "informationsfunktionerna". Formeln för informationsfunktionen, Birnbaum 1968, är följande: Det måste beaktas att den information som erhållits i ett test är summan av informationen för varje objekt, förutom att varje objekts bidrag inte beror på resten av föremålen som utgör testet. Generellt sett kan vi säga att informationen, i alla modeller:

  • varierar med träningsnivåer.
  • Ju större kurvan är, desto mer information.
  • beror på varianterna av poängen, ju högre detta är desto mindre information.

Provkonstruktion

Den första uppgiften och en av de viktigaste vid konstruktionstiden är valet av föremålen, tidigare ackord för de teoretiska antagandena som måste definiera den funktion som testet avser att mäta. Begreppet "objektanalys" avser uppsättningen formella förfaranden som utförs för att välja de objekt som till slut kommer att utgöra testet. Den information som anses mest relevant med avseende på föremålen är:

  1. Problemets svårighet, andelen personer som korrigerar det.
  2. Diskriminering, korrelation av varje objekt med det totala poänget på testet.
  3. Distraktorer eller felanalyser, dess inflytande är relevanta, påverkar objektets svårighet och gör underskattning av diskrimineringsvärdena.

Vid upprättandet av indikatorer för de olika indexen används vanligtvis statistik eller index som är mest använda:

Index of difficulty Index of diskriminering Tillförlitlighetens index Giltighetsindex Kända index som måste beaktas för valet av de objekt som kommer att utgöra testet, vi kommer att se vilka steg som krävs för att bygga ett test:

  1. Specifikation av problemet.
  2. Ange en bred uppsättning artiklar och felsöka dem.
  3. Val av modell.
  4. Testa de valda objekten.
  5. Välj de bästa objekten.
  6. Undersök provets egenskaper
  7. Fastställa tolkningsnormerna för det slutliga provet som erhållits.

Från de tidigare punkterna bör det noteras att valet av modellen, punkt 3, kommer att bero på de mål som eftersträvas med testet, uppgifterna och kvaliteten på uppgifterna och de tillgängliga resurserna. När en modell är vald, med tanke på de teoretiska förhållandena i vilka den kan appliceras, nej trots dess dygder måste analyseras i varje enskilt fall och specifika omständigheter. Egenskaperna hänförliga till de modeller som utgör Responsens teori till varan (TRI), kan påverkas av:

  • testets dimensionering den knappa tillgängligheten av provbrist på datorresurser Det finns ett antal preferenser när man använder en eller annan modell, låt oss se dem: Normala warhead-modeller används vanligtvis inte i applikationer, deras värde är teoretiskt.
  • Rasch: lämplig för horisontell jämförelse (jämförbara prov på svårighetsgrader med liknande träningsfördelningar). att ha olika former av samma test. * 2 och 3 parametrar: är de som bäst passar olika problem.
  • att upptäcka felaktiga svarmönster. för vertikal utjämning av test (jämför test med olika svårighetsgrad och olika fördelningar för fitness).

1 och 2 parametrar:

  • lämplig för att bygga en enda skala, så att du kan jämföra kompetensen på olika nivåer.

Valet av modell, utöver det slutförda ändamålet, kan påverkas av provets storlek. Om provet är stort och representativt kommer det inte att vara något problem vare sig den klassiska modellen eller latent egenskap. Men i TRI ( artikelresponsteori ) ett litet prov tvingar dig att välja modeller med ett litet antal parametrar, till och med uniparametermodellen.

Tillämpningar av artikelresponsteori

Låt oss se vilka vanligaste tillämpningar: a) Equalization of tests, ibland är det nödvändigt att relatera poängen som har erhållits i olika tester, med två möjliga ändamål:

  • Horisontell utjämning: Det försöker få olika former av samma test.
  • Vertikal Equalization: Syftet är att bygga en enda skala av lämplighet med olika svårighetsgrader. När det gäller utjämning av test introducerar Lord (1980) begreppet "equity", vilket innebär att för varje ämne kan två tester vara utbytbara eftersom det tillämpas att den ena eller den andra inte kommer att ändra nivån på lämplighet som uppskattats. för ämnet.

Studie av föremålens förspänning, ett föremål är skevt när det i genomsnitt ger signifikant olika poäng i specifika grupper som ska ingå i samma population.

Test anpassade eller genomsnittliga , Genom TRI kan individuella tester konstrueras som medger att på ett mer precist sätt utgå från det sanna värdet av det aktuella draget. Föremålen kommer att administreras sekventiellt, förinställningen av ett objekt eller en annan kommer att bero på svaren ovan. Det finns olika typer av anpassade tester, vi påpekar följande:

  • tvåstegsförfarande, lord 1971; Bertz och Weiss 1973 - 1974. Ett test passeras först och beroende på resultaten administreras ett andra test.
  • Förfarandet i flera steg, är detsamma som det föregående, bara processen innehåller fler steg.
  • Fast förgreningsmodell, Lord 1970, 1971, 1974; Mussio 1973. Alla ämnen löser samma sak, beroende på svaret, är en uppsättning artiklar löst.
  • Variabel förgrenad modell baseras på oberoende mellan objekten och egenskaperna hos de maximala sannolikhetsbedömarna.

Bank av objekt, Att ha en stor uppsättning saker är något som kommer att förbättra testkvaliteten, men för det här måste objekten genomgå en felsökningsprocess först. För att klassificera objekten är det nödvändigt att ta hänsyn till vilken funktion som är avsedd att mäta det test som detta objekt kommer att ingå i..

Tolkning av poäng

skalor: Dess syfte är att erbjuda ett kontinuum för att beställa, klassificera eller veta vad som är den relativa storleken på den utvärderade funktionen; Detta kommer att göra det möjligt för oss att fastställa skillnader och likheter hos människor i förhållande till detta drag. Vågen som används i psykologi är: nominella, ordinära, intervall och orsak; dessa vågar är konstruerade från resultaten av testen, resultaten kallas "direktresultat" .

typify : att typifiera ett test är att omvandla direktresultat till andra som är lätt tolkbara eftersom den typifierade poängen kommer att avslöja ämnets position i förhållande till gruppen och tillåter oss att göra inter- och intersubject-jämförelser. Det finns två typer av skrivning:

  1. Linjär, behåll distributionsformen och ändra inte storleken på korrelationerna.
  2. Icke-linjär, de bevarar inte distributionen eller storleken på korrelationerna .

FITNESS SCALE I TRI är skalan som byggs den skala som motsvarar träningsnivåerna. Denna skala karakteriseras eftersom uppskattningarna och referenserna görs direkt med avseende på förmåga och dess skala. Vidare beror denna förmåga som uppskattas enbart av formen på objektens karakteristiska kurva. Inom de möjliga vågorna indikerar vi två:

  1. Scale, föreslagen av Woodcock (1978) och definieras av följande formel:
  2. WITS-skala, föreslagen av Wright (1977), denna skala är en modifikation av den föregående och ges av följande förhållande: