Klassisk teori om test
Ett test är a vetenskapligt instrument i den utsträckning det mäter vad det avser, det vill säga det är giltigt och det mäter väl, det vill säga det är exakt eller tillförlitligt. Om vi hittar ett instrument som vi inte kan lita på de åtgärder de tillhandahåller, eftersom de varierar från tid till annan när vi mäter samma objekt så kommer vi att säga att det inte är tillförlitligt. Ett instrument att mäta korrekt något måste vara exakt, för annars mäter du vad du mäter, mäter det fel. Att vara exakt är därför ett nödvändigt men inte tillräckligt villkor. Dessutom måste det vara giltigt, det vill säga vad det mäter exakt är vad det är tänkt att mäta, och inget annat.
Du kanske också är intresserad: Item Response Theory - applikationer och testtillförlitlighet:
Absolut och relativ tillförlitlighet: Vi kan ta itu med problemet med testets tillförlitlighet på två olika sätt, även om de sammanfaller i bakgrunden.
Tillförlitlighet som oriktigheten av dess mätningar: När ett ämne svarar på ett test får han ett empiriskt betyg, vilket påverkas av ett fel. Om det inte fanns något fel skulle ämnet få sin sanna poäng. Testet är okreciserat eftersom det empiriska resultatet inte matchar det sanna sanna värdet. Denna skillnad mellan båda poängen är provtagningsfelet, mätfelet. den typiskt måttfel kommer att vara standardavvikelsen för mätfel. den typiskt måttfel indikerar testets absoluta precision eftersom det gör det möjligt att uppskatta skillnaden mellan den erhållna mätningen och den som skulle erhållas om det inte fanns något fel.
Tillförlitlighet som mätningens stabilitet: Ett test blir mer tillförlitligt desto mer konstant eller stabilt resultaten ger när det upprepas. Ju mer stabila resultaten är vid två tillfällen, desto större är sambandet mellan dem. Denna korrelation kallas tillförlitlighetskoefficient. Detta uttrycker oss, inte mängden av felet, men testets sammanhang med sig själv och beständigheten av den information som den erbjuder. den tillförlitlighetskoefficient uttrycker testets relativa tillförlitlighet.
Tillförlitlighetskoefficienten och pålitlighetsindex: - Tillförlitlighetskoefficienten av ett test är korrelationen av testet med sig, erhållet t ex i två parallella former: rxx. - Precisionsindexet är korrelationen mellan empiriska poäng av ett test och dess sanna poäng: rxv Precisionsindexet kommer alltid att vara större än pålitlighetskoefficienten För att ta reda på tillförlitlighetskoefficienten är dessa tre klassiska metoder värda att nämna:
- Hitta korrelationen mellan testet och dess repetition: Metoden för repetition eller test-retest-metod: Det består av att samma test tillämpas på samma grupp vid två tillfällen och korrelationen mellan de två serierna beräknas. Denna korrelation är pålitlighetskoefficienten. Denna metod ger vanligtvis en högre tillförlitningskoefficient än de som erhålls genom andra förfaranden och kan vara förorenad av störande faktorer.
- Hitta korrelationen mellan två parallella former av testet: Metoden för parallella former: Förbered två parallella former av samma test, dvs två likvärdiga former som ger samma information och gäller för samma grupp av ämnen. Korrelationen mellan de två formerna är tillförlitlighetskoefficienten. Med denna metod, genom att inte upprepa samma test, undviks störande källor för re-test-tillförlitlighet.
- Hitta korrelationen mellan två parallella halvor av testet: Metoden med två halvor: Dela testet i två ekvivalenta halvor och hitta korrelationen mellan dem. Det är den föredragna metoden, eftersom det är enkelt och ignorerar begränsningarna i de tidigare förfarandena. Du kan välja de udda delarna av testet, för att utgöra en halv och de jämnaste elementen för att utgöra den andra.
Tillförlitlighetskoefficienten och korrelationen mellan parallella test
den tillförlitlighetskoefficient av ett test anger den andel som den verkliga variansen är av den empiriska variansen: gráfico33 Tillförlitlighetskoefficienten för ett test varierar mellan 0 och 1. Till exempel: om korrelationen mellan två parallella tester är rxx´ = 0,80, innebär att 80% av provets varians beror på den verkliga mätningen, och resten, det vill säga 20% av testets variation beror på felet. den tillförlitlighet index av ett test är korrelationen mellan dess empiriska poäng och dess sanna poängsäkerhetsindex = Reliabilitetsindexet är lika med kvadratroten av pålitlighetskoefficienten
När två parallella former av ett test har utvecklats tillämpas variansanalysförfarandet för att kontrollera homogeniteten av avvikelserna och skillnaden mellan åtgärderna. Om variationerna är homogena är skillnaden mellan organen inte signifikant och de två formerna är konstruerade med samma antal element av samma typ och psykologiskt innehåll, det kan sägas att de är parallella. Om inte, måste du reformera dem tills de är. Bristen på tillförlitlighet identifieras med rxx-värdet´= 0 4.- Det typiska felmåttet: Skillnaden mellan det empiriska och det verkliga värdet är det slumpmässiga felet, kallat mätfel. Standardavvikelsen för mätfel kallas det typiska mätfelet. den typiskt måttfel tillåter att göra uppskattningar om testets absoluta tillförlitlighet, det vill säga att uppskatta hur mycket mätfel som påverkar ett resultat.
Tillförlitlighet och längd: Testens längd avser antalet element. Tillförlitlighet beror på denna längd. Om ett test består av tre element kan ett ämne en gång få en poäng på 1 och i en annan, eller parallellt, ett poäng av
Från ett tillfälle till en annan har poängen varierat med en punkt; en punkt över tre är en variation på 33%, en stor variation. Om ämnena erhåller slumpmässiga variationer av denna typ, kommer korrelationen av testet med sig eller med de två parallella formerna av testet att minskas kraftigt och kan inte vara högt. Om testet är mycket längre, om du till exempel har 100 poster kan ett ämne få 70 poäng vid ett tillfälle och 67 på en parallell basis. Från en till en annan har det ändrats 3 poäng; Det är en relativt liten varians i förhållande till det totala testet, speciellt 3%. Dessa små tillfälliga förändringar av denna storlek, som förekommer i ämnespoängen, när de går från en form till nästa, är relativt obetydliga och kommer inte att minska så mycket som före korrelationen mellan båda.
Tillförlitningskoefficienten blir mycket högre än i föregående fall. Spearman-Brown-ekvationen uttrycker förhållandet mellan pålitlighet och längd. Precisionen för ett test är noll när längden är 0 och den ökar när längden ökar. Även om ökningen är relativt mindre eftersom längden av vilken del är större. Det innebär att precisionen växer mycket i början och relativt mindre senare. När längden tenderar att vara oändlig tenderar tillförlitlighetskoefficienten att
Att öka längden på ett test ökar dess noggrannhet eftersom det ökar den sanna variansen med en högre hastighet än felavvikelsen. Detta innebär att testets noggrannhet ökar eftersom andelen av variation som beror på felet minskar. Rulon formel och formel Flanagan och Guttman, är speciellt tillämpliga när tillförlitligkoefficient beräknas genom metoden av de två halvorna. Dessa är formler som används för att beräkna pålitlighetskoefficienten.
Tillförlitlighet och konsistens: Tillförlitlighetskoefficienten kan också hittas på annat sätt, det är den så kallade alfakoefficient eller generaliserbarhetskoefficient eller representativitet (Cronbach). Denna alfakoefficient indikerar noggrannheten som vissa saker mäter en aspekt av personlighet eller beteende. Det kan tolkas som: En uppskattning av den genomsnittliga korrelationen mellan alla möjliga objekt i en viss aspekt. En mätning av testets noggrannhet i enlighet med dess samstämmighet eller interna konsistens (sambandet mellan dess element, i vilken utsträckning testelementen mäter alla samma) och dess längd. Indikerar testets representativitet, det vill säga den mängd i vilken provet av objekt som komponerar det är representativt för befolkningen av möjliga föremål av samma typ och psykologiskt innehåll. den alfakoefficient reflekterar huvudsakligen två grundläggande begrepp i ett tests noggrannhet: 1. Sambandet mellan dess element: i vilken utsträckning de alla mäter samma sak.
Testens längd: Genom att öka antalet fall i ett prov och om systematiska fel elimineras representerar provet bättre den population från vilken den extraheras och det är mer osannolikt att oavsiktligt fel är inblandat. Om testobjekten är dikotom, (ja eller nej, 1 eller 0, överenskommelse eller meningsskiljaktighet etc.), förenklas alfakoefficientens ekvation, vilket ger upphov till ekvationerna för Kuder-Richardson (KR20 och KR21). Med tanke på ett visst antal artiklar kommer ett test att vara mer tillförlitligt, när det är mer homogent. Alfakoefficienten berättar pålitligheten eftersom den representerar homogenitet och konsistens eller intern konsistens av elementen i ett test.
Standarder och pålitlighetskriterier
Enligt modellen för provutrymmet för objekt är testets syfte att uppskatta den åtgärd som skulle erhållas om alla objekt i provutrymmet användes. Denna åtgärd skulle vara den sanna poängen, till vilken de verkliga åtgärderna approximativt mer eller mindre. Beroende på i vilken grad ett exemplar av objekt korrelerar med de sanna poängen är testet mer eller mindre tillförlitligt. I denna modell är matrisen av korrelationer mellan alla objekt i provutrymmet centralt. Denna provmodell insisterar mer direkt på intern konsistens, och i den mån det uppnår det, garanterar indirekt stabiliteten..
Den linjära modellen för parallella test insisterar mer på stabiliteten i poängen, och i den mån det uppnår stabilitet, favoriserar den indirekt intern konsistens. Om vi tillämpar ett test för att fastställa individuella diagnoser och prognoser måste pålitlighetskoefficienten vara från 0,90 till över. I prognoser och kollektiva klassificeringar är efterfrågan inte så mycket, även om det inte är bekvämt att komma undan mycket från 0,90 till 0,80..
Ibland är det i vissa typer av tester, såsom personlighetsprov, svårt att uppnå koefficienter på mer än 0,70. Om parallella former, eller parallella halvor, appliceras, efter ett mer eller mindre stort intervall, kan de slumpmässiga felen vara talrika än de som påverkar alfakoefficienten. Detta beror på att det som sänker korrelationen inte bara är de slumpmässiga fel som ligger till grund för testet och vid ett enda tillfälle, som är de som tar hänsyn till alfakoefficienten, utan också påverkar alla fel som kan komma från de två olika situationerna , som kan skilja sig åt i många detaljer. Därför är alfakoefficienten vanligtvis högre än de andra koefficienterna.
Med undantag för koefficienten som upptäcks genom att upprepa samma test, eftersom det är mer sannolikt att de slumpmässiga felen i den första applikationen upprepas i det andra och istället för att minska korrelationen mellan de två ökar de den. Det måste säkerställas att den andra applikationen är helt oberoende av den första. Om vi uppnår detta kommer det att vara den enklaste och billigaste metoden och tillrådligt när vi försöker uppskatta stabiliteten i poängen, särskilt under långa perioder och med komplexa tester. > Nästa: Giltigheten av testen