基本學力測驗量尺
舊制聯考的成績都是依題目類型配分來計算,不同類型的題目或不同題目的配分給定的標準並沒有明確的理論基礎。以這樣的分數來量化一個人的能力是容易產生很大的誤差,況且不同分數之間的測量誤差也不相同。
基本學力測驗的分數,稱做量尺,它是經由測驗學者、專家根據統計學上的實質意義所運算建立來的,不同分數點的測量誤差幾乎相等,分數比較能夠反應受測者的真實程度,使用量尺進行個體的比較或分發是比較有理論根據與實質意義的。
根據測量誤差(standard error of measurement. SEM)與測驗信度(p)以及群體分數標準差的(SD)關係公式:
SEM = SD ×
$\sqrt{1-p}$。
一份 40道題左右的基本學力測驗,其測驗信度估計在 0.85 左右。並採用
Kelley對測量標準誤差分數的建議,他認為以 3 分為一個測量標準誤差單位較為理想,如此所計算出來的群體分數的標準差(SD)=$\frac{3}{\sqrt{1-0.85}}$≒7.75。
根據常態分布機率,正負四個標準差幾乎涵蓋全部考生的
99.99% 。為了涵蓋所有的群體,量尺分數就必須要有62分(
7.75×4×2 )。而為了使用上的方便,而將量尺分數定成 1~60
分,這就是基本學力測驗分數(量尺)的由來。
一位考生的基本學力分數是30分,而測量標準誤(standard error of measurement)為 3 ,則
30±3(即 27到 33 )就是這一位考生的 68%
信賴區間,也就是該考生的分數帶。在統計上,我們可以自信的說在受測者身心狀況一樣的條件之下,如果該考生重複地考那份測驗 100 次的話,約有68次的得分會在 37 到 43
分之間。也可以說,我們有自信該生的真實分數約有 68% 的機會是在 37 到 43
分之間。
當一個考生的基本學力分數是36分,測量標準誤差還是3分,比30分的人多了兩倍的測量誤差,我們就有更高的自信(約為90%)認為後者的分數比前一個人高。而這樣的比較是建立在各個分數的測量誤差是相同的基礎之下。這解決了舊制聯考因每個人的測量誤差不同,無法比較出每個受測者真實能力的問題。
如何計算得知量尺分數呢?
其實,必需等完成測驗後,再依各科「題數」、「全體考生平均答對題數」、「標準差
」來計算。
某一科試題共有40道題,根據測驗結果,計算出了母群體平均答對數是22題,同時也算出群體的標準差是5題,有一位學生答對30題,則他的學力測驗分數是幾分?
如果母群體的標準差是7.75,平均分數是30分。
$\frac{30-22}{5}$=1.6(個標準差),
下表是89學年度第一次基本學力測驗數學科量尺分數和達對題數對照表
題數 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
量尺分數 |
1 |
1 |
1 |
3 |
6 |
8 |
10 |
11 |
13 |
15 |
17 |
18 |
20 |
21 |
23 |
24 |
題數 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
量尺分數 |
26 |
27 |
29 |
30 |
32 |
33 |
35 |
36 |
38 |
40 |
44 |
46 |
48 |
51 |
54 |
60 |
Copyright ©昌爸工作坊
all rights reserved.