系統公告
個人檔案
個人圖檔
ID:a97420062
暱稱:張庭綺

贊助商連結
a97420062的最新回應
  • 目前沒有留言
輕旅行
人氣指數
當日人次:
累積人次:
我推薦誰
目前無名單
誰推薦我
誰來我家
超級冷笑話猜謎
贊助商連結
RSS 訂閱
RSS2
ATOM
其它資訊
本部落所刊登之內容,皆由作者個人所提供,不代表 yam天空部落 本身立場。
POWERED BY
POWERED BY
會員登入免費註冊
June 6, 2010

第一節–信度的意義


‧任何測驗都含有誤差
。誤差:評量結果(實得分數)和真實分數之間的差距
。無法得知真實分數,只能估計或推論
。實得分數=真實分數+誤差分數



 
‧誤差的種類
。系統誤差
。隨機誤差



 
‧系統誤差
。偏離真實分數的現象在每次測量均會發生
。影響是一致、固定的
-恆定誤差:會影響到所有觀察結果的誤差
-偏誤:因觀察對象的特性不同而有不一樣的誤差結果


 

‧隨機誤差
。沒有規則
。隨機產生
。出現的機率不可預測

 


‧信度
。指測量結果的一致性程度
。反映評量結果受隨機誤差影響的程度
 



‧信度的特性
。信度是估計的
。並非全有或全無,是程度的問題
。一致性:理論上是指完全相同的情況下,兩組測量結果相符的程度

 


‧透過對評量工具的效度檢驗,可將系統誤差減小
 



‧系統誤差小,則效度高;隨機誤差小,則信度超

 


‧常模參照的信度
。根據評量目的和考慮隨機誤差的因素,以選擇合適的分析
。考慮隨機誤差的來源有:時間誤差、內容取樣誤差、內容異質性誤差、評分者誤差
。種類:
-再測信度
-複本信度
-內部一致性信度
-評分者信度
-概化係數
 



‧再測信度(重測信度)
。考慮時間誤差
。再測信度係數(穩定係數):在不同時間,重複實施同一評量工具。一群受試者兩次施測所得分數的相關係數
。目標在評估測量結果能類化到不同時間點的程度(時間誤差的影響)
。估計穩定係數時,須納入考量的因素:
-重測的時間間隔不能太長(很少超過半年)
-測量表現受到記憶效果的影響程度
-某些評量工具的性質會因再測而發生質變
-不同特質所發生改變所需時間的異變性
-較適用於動作技能方面的測驗,而認知與情義則較不適合



 
‧複本信度
。考慮內容取樣誤差
。所關心的誤差來源為內容取樣誤差:因為題目選擇的隨機因素所造成的分數異變
。須用兩個不同題本,但內容相同的評量工具。稱之為:複本或平行版本
→複本:不論在題數、題目形式、內容、題目的難易度、施測的指導語、時間限制等與評量相關的特性,均與原評量工具相同
→平行版本:
@心理學的定義
@同一個人在兩個測驗有相同的真分數
@兩個測驗誤差彼此獨立,且誤差異變相等
。複本信度係數
(1)等同信度或複本立即信度
-同一時間施測兩分題本,所得分數的相關係數即是等同係數。
-僅反映內容取樣誤差的影響
(2)穩定且等同係數或複本延宕信度
-先施測一個題本,等間隔一段時間再施以複本,所得分數相關即是穩定及等同係數
-同時反映時間誤差和內容取樣誤差的影響
 



‧內部一致性信度
。考慮內容取樣誤差和內容異質性
。內部一致性信度係數
-關心受試者在各評量項目上的表現一致的程度
-內部一致性係數的大小反映內容取樣的誤差,以及題目的同質性成度。
-優點:只需一個題本和一次測量結果,便能估計信度
→內容取樣誤差:折半信度係數、可再以斯布公式校正
→KR-20係數、Alpha係數
 



‧折半信度
。考慮內容取樣誤差
。將一份試題在分析時拆成兩半
-折半的方式:奇偶折半、難易度排序後奇偶折半、隨機
-求折半相關:兩半測驗結果的相關係數
 



‧斯布公式
。預測增加或減少試題後,測驗信度的改變
 



‧α係數
。考慮內容異質性誤差
 



‧庫李係數(KR-20係數)
。考慮內容異質性誤差
。僅適用於二元計分的測驗
 



‧內部一致性係數
。考慮內容取樣誤差和內容異質性
。限制:不能用來估計速度測驗
 



‧評分者信度
。考慮不同評分者產生的誤差
。在估計不同評分者,對同一表現評分的一致性程度
。通常由兩名(或以上)的評分者獨立評分一群受試者的表現
。計算這群受試者從評分者所獲得的分數相關(相關係數),或是計算評分者給予相同分數的百分比(符合度)
。符合度:
-重視所給的絕對分數是否相同
-能夠反映評分者給分嚴苛程度的一致性
。相關係數:
-著重評分者對於受評量者所表現的排序是否相同
-不同評分者間作比較(評分者間信度)
-同一評分者給分的比較或同一被評者得分的比較(評分者內信度)

 


‧概化係數(參考)
。概化理論:提供了同時估計各種類型誤差對信度影響的基礎。即考慮不同誤差組合中,各類誤差對信度影響的程度。
。透過適當的研究設計,此一理論能利用異變數分析的方法,將各種誤差異變加以分割,配合實際應用的需要。
。適用在評量情境複雜、非標準化測驗、和難以在短時間完成的測驗或評量



誰推薦這篇文章
引用 (你可以針對此文寫一篇屬於自己的blog/想法,並給作者一個通告)
引用
留言 (0筆) (登入後, 即可開始發表留言)
檢視行動版網頁  |  檢視正常版網頁