北大2010年心理測量學(xué)串講(五)
來源:網(wǎng)絡(luò) 發(fā)布時(shí)間:2010-08-05
第5章 信度
1、 信度是指:測量結(jié)果的可靠性和一致性。因?yàn)樾睦頊y驗(yàn)通常測量人的行為,行為會由于各種各樣的原因,因時(shí)、因事、因地而產(chǎn)生變動,這些因素有些是偶然的,有些是固有的,人在完成心理測驗(yàn)時(shí)的行為也會受上述因素的影響,從而使測驗(yàn)結(jié)果與真實(shí)結(jié)果不完全一致,所以我們要用信度來衡量測驗(yàn)的可靠性和一致性。
2、 信度的操作化定義:
�。�1) 誤差理論認(rèn)為:一個(gè)人的測驗(yàn)分?jǐn)?shù)X是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩部分構(gòu)成的,公式是X = T + E。
�。�2) 因此信度就被定義為:一組測量分?jǐn)?shù)的真實(shí)方差與實(shí)得方差的比,或者是指真實(shí)方差占總方差的百分比。公式為:rxx = 1-SE 2/SX 2
(3) 根據(jù)統(tǒng)計(jì)學(xué)理論,真實(shí)方差與實(shí)得方差的比是一個(gè)相關(guān)系數(shù)的平方,所以我們把這種相關(guān)系數(shù)的平方叫做信度系數(shù)。
(4)計(jì)算公式為:rxx = ST2/SX2
3、 由于誤差的來源信度的可分為:這種分類是基于信度的傳統(tǒng)定義-真分?jǐn)?shù)理論。
(1) 重測信度:考慮的誤差來源是時(shí)間取樣。
�。�2) 復(fù)本信度:考慮的誤差來源是內(nèi)容取樣。
�。�3) 分半信度:它考慮的誤差來源也是內(nèi)容取樣,它與復(fù)本信度的差別是:分半信度考查一個(gè)測驗(yàn)內(nèi)容的兩半題目測量的是否是同一個(gè)心理特點(diǎn)行為。
�。�4) 同質(zhì)性信度(內(nèi)部一致性系數(shù)):考慮的是測驗(yàn)內(nèi)容是否異質(zhì)。
�。�5)評分者信度:考慮的誤差來源是評分者間的差別。
4、 信度的表示方法:
�。�1) 信度系數(shù)和信度指數(shù):
1 信度系數(shù):rxx = rx2T = S2T/S2
2 信度指數(shù):rXT = ST/SX
(2) 測量標(biāo)準(zhǔn)誤:SE = SX 1-rxx
5、 信度的意義:
(1) 信度系數(shù)可以解釋為樣本測驗(yàn)分?jǐn)?shù)的總方差中有多少比例是真分?jǐn)?shù)方差,也就是測驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。它直接告訴我們測量的誤差有多大。
�。�2) 測量的標(biāo)準(zhǔn)誤可以告訴我們有多大可能性真實(shí)分?jǐn)?shù)在某一分?jǐn)?shù)范圍內(nèi),并且可以預(yù)測實(shí)得分?jǐn)?shù)再測時(shí)可能的變化情況。
6、 信度的作用:
�。�1) 解釋預(yù)測個(gè)人分?jǐn)?shù)的意義。
�。�2) 解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系,明確告訴我們測驗(yàn)誤差大小。
�。�3) 新編的測驗(yàn)信度應(yīng)高于原有的同類測驗(yàn)或相似測驗(yàn)。
�。�4)下結(jié)論說某測驗(yàn)比較可靠,必須是依據(jù)情境的,經(jīng)多次證實(shí)的。
�。�5) 它是確定測驗(yàn)好壞的一個(gè)指標(biāo)。一般的原則是:
1 當(dāng)rxx< 0.70時(shí),測驗(yàn)不能用于對個(gè)人作出評價(jià)或預(yù)測,而且不能做團(tuán)體間比較。
2 當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較。
3 當(dāng)rxx ≥0.85時(shí),才可以用來鑒別或預(yù)測個(gè)人成績或作用
7、 重測信度:有時(shí)也叫穩(wěn)定性,主要針對時(shí)間變量。
�。�1) 重測信度采集數(shù)據(jù)得方法是:對同一組被試間隔一定的時(shí)間重復(fù)測試一次。
�。�4) 重測信度的計(jì)算方法是積差相關(guān)法,因而rxx就是皮爾遜的積差相關(guān)系數(shù)。
(7) 重測信度的時(shí)間間隔選擇依測驗(yàn)性質(zhì)和目的而定,如果測驗(yàn)是用于長期預(yù)測,則測量間隔長一些。對兒童的智力測驗(yàn)一般是兩周到四周為宜。對成年人,間隔可到半年,很少超過6個(gè)月。
�。�13)使用重測信度應(yīng)注意:不是所有測驗(yàn)都可以計(jì)算重測信度。并且重測信度只是反映了隨機(jī)誤差的影響,而不是反映被試心理特點(diǎn)的長期變化。
8、 復(fù)本信度:又叫等值性系數(shù)。
�。�1) 數(shù)據(jù)采集方法是:給被試施測兩個(gè)內(nèi)容等值但題目不同的測驗(yàn),求兩組數(shù)值的相關(guān)。計(jì)算方法常見的也是積差相關(guān)法。
�。�2) 復(fù)本信度的高低反映了兩個(gè)互為復(fù)本的測驗(yàn)等價(jià)的程度,而不是反映一個(gè)測驗(yàn)本身受隨機(jī)誤差影響的大小。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗(yàn)的選擇,因而施題目取樣問題,或者說是測驗(yàn)的內(nèi)容取樣問題。
�。�3)復(fù)本信度優(yōu)于重測信度的地方是:避免了重測帶來的記憶效應(yīng)和練習(xí)效應(yīng);可用于長期追蹤研究前后測量;減少了作弊的可能性。
�。�4)復(fù)本信度的缺點(diǎn):有些測驗(yàn)的復(fù)本很難找到;有些測驗(yàn)因正遷移效應(yīng)使測驗(yàn)性質(zhì)改變;如測量的內(nèi)容很容易受練習(xí)的影響,復(fù)本信度也無法清除這種練習(xí)效應(yīng)。
�。�5)重測復(fù)本信度,即再不同的時(shí)間里施測兩個(gè)等值的測驗(yàn)(復(fù)本),得到的相關(guān)就是重測復(fù)本信度,也叫穩(wěn)定等值系數(shù)。它比單一的重測信度或復(fù)本信度都要嚴(yán)格、全面一些。
9、 斯皮爾曼-布朗公式:rnn = nrtt/1 +(n-13、 1)rtt,14、 rnn是校正以后的相關(guān)系數(shù),15、 rtt是實(shí)得的相關(guān)系數(shù),16、 n為rnn對應(yīng)的測驗(yàn)長度與rtt 對應(yīng)的測驗(yàn)長度之比。分半時(shí),17、 n = N/(N/2)= 2(N為測驗(yàn)全長),18、 所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh為兩半測驗(yàn)的相關(guān)系數(shù)。
�。�1) 盧倫公式:rxx = 1-Sd2/Sx2 其中Sd2是兩半測驗(yàn)分?jǐn)?shù)之差的方差,Sx2為總方差。
(2) 從理論上分析,分半信度反映的實(shí)際上是兩半測驗(yàn)?zāi)軌驕y量相同內(nèi)容或心理特點(diǎn)的程度。
10、 內(nèi)部一致性信度(同質(zhì)性信度):同質(zhì)性是指測驗(yàn)的所有題目間性質(zhì)的一致性,即測的是同一種心理特質(zhì)或行為。同質(zhì)性是測量單一特質(zhì)的必要條件。這里講的同質(zhì)性是指測驗(yàn)題目得分反映的心理特質(zhì)一致,同質(zhì)性的判別標(biāo)準(zhǔn)是:題目間呈高正相關(guān),如果相關(guān)很低或是呈負(fù)相關(guān),則題目為異質(zhì)。
�。�1) 庫德和里查德森提出的K-R20公式只適合預(yù)測題目是二分法計(jì)分的。克倫巴赫α系數(shù)適合于非二分法計(jì)分的測驗(yàn)的內(nèi)部一致性信度估計(jì)法。
(2) 從同質(zhì)性信度的含義我們不難看出,分半信度是求測驗(yàn)兩半之間的一致性或同質(zhì)性,而同質(zhì)性是求所有題目間的一致性。因此分半信度實(shí)際上是同質(zhì)性信度的一種,可以作為測驗(yàn)同質(zhì)性評價(jià)的粗略估計(jì)指標(biāo)。因?yàn)榭梢愿鶕?jù)測驗(yàn)得分來推論或驗(yàn)證某種概念或理論構(gòu)思,因此同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度,它實(shí)際上介于信度與效度之間。
11、 評分者信度:有些心理測驗(yàn)的得分不是根據(jù)客觀的計(jì)分系統(tǒng)計(jì)分的,是由評分者來給被試打分,因此,這樣的測驗(yàn)的可靠性如何取決于評分者評分的一致性和穩(wěn)定性如何。
評分者信度因評分者人數(shù)不同而估計(jì)方法不一樣。如果是兩個(gè)評分者,獨(dú)立對被試的反應(yīng)評分,則可以用積差相關(guān)來計(jì)算,或用斯皮爾曼等級相關(guān)法計(jì)算。如果評分者在三人以上,而且是等級評分,則可以用“肯德爾和諧系數(shù)”(W)來求評分者信度。
12、 以測量標(biāo)準(zhǔn)誤表示信度的好處是:
(1) 信度的單位與測驗(yàn)分?jǐn)?shù)的單位相同,因此解釋個(gè)人分?jǐn)?shù)時(shí)非常直接,能直接指出允許測驗(yàn)分?jǐn)?shù)變化的范圍。
�。�2) 測驗(yàn)同質(zhì)與否并不影響測量標(biāo)準(zhǔn)誤的大小。測量標(biāo)準(zhǔn)誤的不足之處時(shí):無法比較不同測驗(yàn)間的信度高低。比較不同測驗(yàn)的信度用信度系數(shù)(rxx)解釋個(gè)人分?jǐn)?shù)時(shí)用測量標(biāo)準(zhǔn)誤(SE)。
13、 常見的影響信度的因素有:樣本特征、測驗(yàn)的長度、測驗(yàn)的難度、測量的時(shí)間間隔等。
14、 我們做信度考驗(yàn)時(shí),常常選取一個(gè)與常模樣本性質(zhì)相同的樣本施測,根據(jù)被試得分求出信度系數(shù)。
�。�1) 樣本團(tuán)體得分分布的影響:求信度的樣本團(tuán)體得分分布如果比較窄小的話信度就低。
�。�2) 樣本團(tuán)體異質(zhì)性的影響:樣本團(tuán)體異質(zhì)的話,測驗(yàn)分?jǐn)?shù)的分布就比同質(zhì)樣本的要廣,分?jǐn)?shù)的離差就大,樣本的方差就大,信度就高。實(shí)際上,高信度可能是假性高信度,是由樣本團(tuán)體的異質(zhì)造成的。但如果常模總體要求各種各樣的人,則異質(zhì)的信度樣本求得的信度就是真信度。這時(shí),相反的情況就需要校正信度。
(3)樣本團(tuán)體平均能力水平的影響。由于信度也會因樣本間團(tuán)體平均能力水平的不同而不同,因此在求信度時(shí),一定要注意信度樣本與常�?傮w間是否一致。
15、 測驗(yàn)的長度:在其他條件均等的情況下,測驗(yàn)越長,信度越高。原因在于:
�。�1) 測驗(yàn)越長,即題目越多,測驗(yàn)的內(nèi)容取樣就越有可能有代表性。
�。�2) 測驗(yàn)越長,被試的猜測因素影響就越小。
16、 測驗(yàn)的難度:難度對信度的影響之存在于某些測驗(yàn)中,如智力測驗(yàn)、成就測驗(yàn)、能力傾向測驗(yàn)、教育測驗(yàn)等。測驗(yàn)的難度對信度有間接影響,因?yàn)槿绻麥y驗(yàn)過難,被試的得分會集中在低分區(qū)。過于容易,分?jǐn)?shù)則集中在高分區(qū)。兩種情況都使信度樣本的得分范圍變窄,變異量降低,從而低估測驗(yàn)信度。
17、 測驗(yàn)的時(shí)間間隔:這一因素之對重測信度和不同時(shí)測量時(shí)的復(fù)本信度有影響,對其余的信度來說不存在時(shí)間間隔問題。