題的記憶，以及被試力求兩次測驗表現一致的願望。

內部一致性（internal　consistency）檢驗，在可信度較好的測驗中，這兩部分的成績相當，這時可稱為內部一致性較好，具有分半信度（split…half　reliability）。

不僅測量工具本身要可信，運用工具的方法也要可信，主試必須學會以一種可信的方式，採用同一個區分系統來施測。

（2）效度

測驗的效度（validity）是指測驗能夠測得的它要測定的東西的程度。

有效性反映了測驗對行為或結果（與測驗目的或設計相關）進行準確預測的能力。有三種重要的效度：表面效度、效標效度和結構效度。

如果測驗專案看起來與感興趣的特性直接相關，那麼測驗具有表面效度（face　validity）。表面效應並不能保證測量的準確性。

效標效度（criterion　validity，也稱為預測效度），將某一個人的測驗成績與他或她在其他標準（與測驗相關）上的成績相比較。

一種測驗是否有效的條件是特定的，因此對一種測驗要考慮基於何種目的它是有效的。

信度是某一測驗與其自身的相關程度，而效度是測驗與外部的相關程度。不可信的測驗也沒有效度，很可能具有較高信度的測驗沒有效度。

（3）常模和標準化

說明你所得分數的意義，你會將你的成績統計常模（norm）做比較。透過檢視測驗的常模，你會知道分數的大致範圍，以及在你的年齡和性別範圍內的平均數是多少。這會有助於評價你在正態人群中的相對位置。常模使一個人的分數可以同與其年齡、性別和文化相當的人的平均分相比。

標準化（standardiztion）是指在同一條件下對所有人、以同樣的方式實施測驗。

對任何測驗，你應該根據測驗的信度和效度，操作的常模以及測驗環境的標準化程度等來評價測驗分數。

二、智力測量

1、智力測驗的起源

智力是一種一般的心理能力，與其他事物一樣，包含推理、計劃、問題解決、抽象思維、理解複雜思想、快速學習和從經驗中學習等能力。

1905年，第一次出版了關於可實施的智力測驗的出版物。阿爾弗雷德？比奈（Llfred　Binet）…西奧菲勒？西蒙（Theophile　Simon）量表。

不同年齡的正常兒童的平均分數被計算出來，測驗的結果以達到某一特定分數的正常兒童的平均年齡來表示，這就稱之為心理年齡（mental　age）。

比奈的方法有4個重要特點。首先，它將測驗的分數解釋為對當前操作的評估，而不是對天生智力的測量。第二，他想使測驗分數應用於確認需要特殊幫助的孩子，而不是汙衊

第8部分 (第5/5頁)