De fyra skillnaderna mellan tillförlitlighet och validitet (i vetenskap)
Eftersom de i samtalsspråk har mycket liknande betydelser, är det lätt att förväxla villkoren för tillförlitlighet och validitet när vi talar om vetenskap och speciellt om psykometri..
Med denna text avser vi att klargöra stora skillnader mellan pålitlighet och validitet. Förhoppningsvis tycker du att det är användbart att klargöra detta vanliga tvivel.
- Relaterad artikel: "Psychometrics: studerar det mänskliga sinnet genom data"
Vad är tillförlitlighet?
I psykometri, begreppet "tillförlitlighet" refererar till ett instruments noggrannhet; Specifikt informerar pålitlighetskoefficienterna om konsistensen och stabiliteten hos de åtgärder som vidtagits med verktyget.
Ju större tillförlitlighet ett instrument desto lägre är antalet slumpmässiga och oförutsägbara fel som kommer att uppstå när den används för att mäta vissa attribut. Tillförlitligheten utesluter förutsägbara fel, det vill säga de som är föremål för experimentell kontroll.
Enligt den klassiska testteorin är tillförlitligheten andelen av variansen som förklaras av de sanna poängen. Således skulle den direkta poängen i ett test bestå av summan av det slumpmässiga felet och det sanna värdet.
De två viktigaste komponenterna i tillförlitligheten De är tillfällig stabilitet och intern konsistens. Det första konceptet indikerar att poängen ändras litet när de mäts vid olika tillfällen, medan den interna konsistensen avser graden till vilken de objekt som utgör testmåttet är samma psykologiska konstruktion.
Därför indikerar en hög tillförlitningskoefficient att poängen på ett prov fluktuerar lite internt och som en funktion av tiden och sammanfattningsvis instrumentet saknar mätfel.
- Kanske är du intresserad: "Typer av psykologiska tester: deras funktioner och egenskaper"
Definition av giltighet
När vi talar om validitet hänvisar vi till huruvida testet korrekt mäter konstruktionen den avser att mäta. Detta begrepp definieras som förhållandet mellan poängen erhållen i ett test och en annan relaterad åtgärd; graden av linjär korrelation mellan båda elementen bestämmer validitetskoefficienten.
I vetenskaplig forskning anger också en hög validitet i vilken grad resultaten som erhållits med ett givet instrument eller i en studie kan generaliseras.
Det finns olika typer av validitet, vilket beror på hur det beräknas. Detta gör det till en term med mycket olika betydelser. I grund och botten kan vi skilja mellan innehållsvaliditet, kriterium (eller empirisk) validitet och konstruera validitet.
Innehållsvaliditet definierar i vilken utsträckning objekten i ett psykometrisk test är ett representativt urval av de element som utgör konstruktionen som ska utvärderas. Instrumentet måste innehålla alla grundläggande aspekter av konstruktionen; Till exempel, om vi vill göra ett adekvat test för att mäta depression måste vi nödvändigtvis inkludera saker som bedömer humör och minskar nöjen.
Kriteriegiltighet mäter instrumentets förmåga att förutsäga aspekter relaterade till funktionen eller intresseområdet. Slutligen är konstruktionsgiltigheten avsedd avgöra om testet mäter vad det avser att mäta, till exempel från konvergensen med de poäng som erhållits i liknande tester.
Skillnader mellan pålitlighet och validitet
Även om dessa två psykometriska egenskaper är nära besläktade, är sanningen att de avser tydligt differentierade aspekter. Låt oss se vad dessa skillnader är.
1. Föremålet för analys
Tillförlitlighet är ett kännetecken för instrumentet, i den meningen att det mäter egenskaperna hos de föremål som består av det. Å andra sidan refererar giltigheten inte exakt till instrumentet men till de generaliseringar som görs av resultaten erhållen genom denna.
2. Den information de tillhandahåller
Även om det är ett något förenklat sätt att uttrycka det, är det i allmänhet ofta sagt att validitet indikerar att ett psykometriskt verktyg faktiskt mäter konstruktionen som den avser att mäta, medan pålitligheten hänvisar till huruvida det mäter det korrekt utan fel.
3. Hur de beräknas
Tre procedurer används i grunden för att mäta tillförlitligheten: Metoden för de två halvorna, den ena av parallella former och test-retest. Den mest använda är proceduren för de två halvorna, där föremålen delas in i två grupper när testet är besvarat; då analyseras korrelationen mellan de två halvorna.
Metoden för parallella eller alternativa former består i att skapa två likvärdiga test för att mäta i vilken utsträckning de korrelerar objekten mellan dem. Testetestest baseras helt enkelt på att passera testet två gånger, under förhållanden som är lika lika som möjligt. Båda förfarandena kan kombineras, vilket ger upphov till testetestest med parallella former, vilket består i att lämna ett tidsintervall mellan den första formen av testet och den andra.
För sin del gäller giltigheten det beräknas på olika sätt beroende på typ, men i allmänhet är alla metoder baserade på jämförelsen mellan poängen i objekttestet och andra data för samma ämnen i förhållande till liknande egenskaper; Målet är att testet kan fungera som en prediktor av egenskapen.
Bland de metoder som används för att utvärdera giltigheten finner vi den faktoriella analysen och tekniken för multi-method-multi-trait matriser. Även innehållsvaliditet bestäms ofta av rationella, icke-statistiska analyser. till exempel innehåller den den uppenbara giltigheten, som hänvisar till experternas subjektiva bedömning om testets giltighet.
4. Förhållandet mellan båda begreppen
Tillförlitligheten hos ett psykometriskt instrument påverkar dess validitet: ju mer tillförlitligt det är desto större är dess giltighet. Därför är giltighetskoefficienterna för ett verktyg alltid lägre än pålitlighetskoefficienterna, och validiteten indirekt informerar oss om tillförlitligheten.