題的記憶,以及被試力求兩次測驗表現一致的願望。
內部一致性(internal consistency)檢驗,在可信度較好的測驗中,這兩部分的成績相當,這時可稱為內部一致性較好,具有分半信度(split…half reliability)。
不僅測量工具本身要可信,運用工具的方法也要可信,主試必須學會以一種可信的方式,採用同一個區分系統來施測。
(2)效度
測驗的效度(validity)是指測驗能夠測得的它要測定的東西的程度。
有效性反映了測驗對行為或結果(與測驗目的或設計相關)進行準確預測的能力。有三種重要的效度:表面效度、效標效度和結構效度。
如果測驗專案看起來與感興趣的特性直接相關,那麼測驗具有表面效度(face validity)。表面效應並不能保證測量的準確性。
效標效度(criterion validity,也稱為預測效度),將某一個人的測驗成績與他或她在其他標準(與測驗相關)上的成績相比較。
一種測驗是否有效的條件是特定的,因此對一種測驗要考慮基於何種目的它是有效的。
信度是某一測驗與其自身的相關程度,而效度是測驗與外部的相關程度。不可信的測驗也沒有效度,很可能具有較高信度的測驗沒有效度。
(3)常模和標準化
說明你所得分數的意義,你會將你的成績統計常模(norm)做比較。透過檢視測驗的常模,你會知道分數的大致範圍,以及在你的年齡和性別範圍內的平均數是多少。這會有助於評價你在正態人群中的相對位置。常模使一個人的分數可以同與其年齡、性別和文化相當的人的平均分相比。
標準化(standardiztion)是指在同一條件下對所有人、以同樣的方式實施測驗。
對任何測驗,你應該根據測驗的信度和效度,操作的常模以及測驗環境的標準化程度等來評價測驗分數。
二、智力測量
1、智力測驗的起源
智力是一種一般的心理能力,與其他事物一樣,包含推理、計劃、問題解決、抽象思維、理解複雜思想、快速學習和從經驗中學習等能力。
1905年,第一次出版了關於可實施的智力測驗的出版物。阿爾弗雷德?比奈(Llfred Binet)…西奧菲勒?西蒙(Theophile Simon)量表。
不同年齡的正常兒童的平均分數被計算出來,測驗的結果以達到某一特定分數的正常兒童的平均年齡來表示,這就稱之為心理年齡(mental age)。
比奈的方法有4個重要特點。首先,它將測驗的分數解釋為對當前操作的評估,而不是對天生智力的測量。第二,他想使測驗分數應用於確認需要特殊幫助的孩子,而不是汙衊