2009年11月17日星期二

卡方檢定

【編  碼】
SPSS-I-003-卡方檢定


【重點觀念】
卡方檢定適用於處理人數、次數等類別變項資料,調查研究常用此方法。


【主題概念】
研究上,常須檢定研究宣稱的期望值是否為真,例如,某公司宣稱其產品僅有0.5%為不良品,5%修補後即可合乎標準,其餘為良品,卡方考驗即可判定此公司宣稱的數據是否成立;又如,婦產科醫師宣稱台灣夏天氣候炎熱,婦女會避免在夏季生產,因此每個月產婦人數的分佈不相同,並提出一理論數據,卡方考驗皆可判定醫師所宣稱的數據是否成立,由此可見,卡方檢定可說是各行各業(不論在管理、經濟、社會、教育、心理、生物、醫學、農業…等),實務研究上相當好用的分析工具(周文賢,2000)



類別變項除了次數分配表及列聯表的呈現外,可進一步以卡方考驗(chi-square test)來進行推論統計檢定,因為卡方考驗以細格次數來進行交叉比較,俗稱交叉分析,且由於列聯表中的細格不是次數便是百分比,因此卡方考驗又可稱為百分比考驗,其檢定原理是考驗「樣本的觀察次數(或百分比)」與「理論或母群體的次數(或百分比)」之間是否有顯著的差異(邱皓政,2002)



卡方考驗可以適用於不同的推論統計的檢定




適合度考驗

當研究者關心一個自變項(例如:性別、年齡、社經地位、身心特徵…),或是教學法等「處理變項」將自變項加以分類,然後考驗其分配狀況是否與某個理論(或母群)分配相符合,便可以卡方考驗進行統計檢定,這種考驗稱為適合度考驗(goodness-of-fit test)(林清山,2000)。由於適合度考驗僅涉及一個自變項,可稱為單因子分類考驗(one-way classification test) (林清山,2000;邱皓政,2002)

適合度考驗的目的,在於檢測單一自變項(X)的實際觀察次數分配與某理論次數分配是否相符合;若統計量考驗(即卡方值)未達顯著差異,則稱樣本在該自變項的分佈與理論母群無異;反之,則說樣本在該自變項的測量上與母群體不相同,或者可說是一個特殊的樣本(邱皓政,2002)

例如:考驗某國立大學的學生性別之比例是否為21 即可運用「適合度考驗」。



獨立性考驗

要同時檢測兩個類別變項(XY)之間的關係時,例如:某樣本的社經水準分佈與學歷分佈的關係,可以卡方考驗進行的統計檢定,稱為「獨立性考驗(test of independence)」。其目的是檢定樣本的二個變項觀察值,是否具有特殊的關聯,如果二個類別變項沒有互動關係(也就是卡方值不顯著),則可說二變項相互獨立;相對的,當二個變項有相互作用(當卡方值達顯著時),則可說二個變項是不獨立的(或有關聯) (林清山,2000;邱皓政,2002)

由於XY兩個變項代表兩個不同的概念(或母體),獨立性考驗必須同時處理雙變項的母群特性,因此可稱為「雙因子考驗」或「雙母數考驗」,且此時雙母數指的是兩個變項所代表的概念母數,而非人口學上的母體(邱皓政,2002)

例如:某研究者利用50名學生為受試者,每人都接受二種測驗(A測驗和B測驗),考驗二種測驗之間是否獨立,即可運用「獨立性考驗」。



百分比同質性考驗

進行卡方考驗時所搜集到的資料可以設計為個橫列和個緃行的表格,稱為「交叉表」或「列聯表(contingency table)」,使用卡方考驗進行百分比同質性考驗(test for homogeneity)的目的,在於考驗受試的組樣本在個反應中選擇某一選項的百分比是否有顯著差異(林清山,2000)

前述獨立性考驗是同一個樣本二個變項的關聯情形的考驗,同質性檢驗則是二個樣本同一個變項的分佈狀況的檢驗;例如:公、私立大學學生性別分佈的比較,從兩個樣本背後所代表兩個母群體(公立與私立大學)在自變項(性別)是否有類似的分佈模式,或是否具有相同的性別特質(邱皓政,2002)

從統計原理來看,同質性考驗與獨立性考驗皆為雙母群體樣本,但是同質性考驗的雙母數,係指兩個樣本所代表的母群體,卡方值所考驗的內容是此二樣本(自變項)在另一個類別變項(依變項)上的變動,前者是研究者所操弄的變項,又稱為設計變項(design variable),依變項則為反應變項,形成一種有特定先後關係的非對稱性關係(邱皓政,2002)

例如:某國中學生輔導室調查N1名國一學生、N2名國二學生、和N3名國三學生,「有」或「無」閱讀過武俠小說的經驗。考驗三個年級學生閱讀過武俠小說的人數百分比是否相同,即可運用「百分比同質性考驗」(林清山,2000)




McNemar改變顯著性考驗

當研究者對同一批受試者進行前後兩次調查,想瞭解這些受試者對同一事件前後的反應態度是否產生改變時,McNemar改變顯著性考驗就是一個很好的選擇(黃國光,2000)。因為同一群受試者中的每個人均接受前、後二次測量,因此,相當於重複量數設計;換言之,McNemar改變顯著性考驗適用於兩個相依樣本問題。當列聯表是2*2形式的時候,可使用本統計方法;但是,若列聯表大於2*2時,則改以包卡爾對稱性考驗較為恰當(黃國光,2000)






圖:SPSS-I-003-01(黃國光,2000)



卡方考驗的適用情況比較




適用情況
母群與變數
目的與說明SPSS分析技術】
適合度考驗
一個母群
一個變數
檢測單一變項(X)的實際觀察次數分配與某理論次數分配是否符合,如果考驗的統計數(即卡方值)未達顯著差異,我們稱該樣本在該變項的分佈與該理論母群無異。
分析 / 無母數分析 / 卡方分配
獨立性考驗
同一母群
二個獨立變數
檢測從樣本得到的兩個變項的觀察值,是否具有特殊的關聯。如果兩個類別變項沒有互動關係(卡方值不顯著),稱兩個變項相互獨立,例如不同性別在學歷的分佈沒有不同。
【分析 / 敘述統計 /交叉表】
同質性考驗
不同母群
同一個變數
檢定不同人口母群體,在某一個變項的反應是否具有顯著差異,如果考驗的統計數(即卡方值)未達顯著差異,表示兩人口樣本沒有差異,我們稱此兩個母群是同質的。
【分析 / 敘述統計 /交叉表】
改變顯著性考驗
同一母群
二個相依變數
同一批受試者進行前後兩次調查,想瞭解這些受試者對同一事件前後的反應態度是否產生改變。
【分析 /無母數檢定 /二個相關樣本】




【軟體版本】
SPSS 17.0 中文版
【範例檔案】


【報表範本】
【參考文獻】
周文賢(2000)。統計學。台北:智勝。
林清山(2000)。心理與教育統計學(十刷)。台北:東華書局。
林曉芳(2008)。統計學SPSS之應用。台北:鼎茂。
邱皓政(2002)。量化研究與統計分析。台北:五南。
黃國光(2000)SPSS與統計原理剖析。台北:松崗。




【操作程序】



適合度考驗

    1.   
問題:研究者想要考驗學生喜愛的上網時段和上網地點是否相同?






圖:SPSS-I-003-02




    2.   
點選【分析 / 無母數分析 / 卡方分配】。






圖:SPSS17menu-分析-16無母數檢定-01卡方分配




    3.   
上網時段上網地點二個變項設在【檢定變項清單】欄中,點選【選項】勾選描述性統計,按【確定】執行。






圖:SPSS-I-003-03




    4.   
由分析報表資料可見,上網時段上網地點二個變項的卡方值均很大,其漸近顯著性值都小於顯著水準(.05),故拒絕虛無假設,即「學生喜愛的上網時段不相同」、「學生喜愛的上網地點不相同」。






圖:SPSS-I-003-04





百分比同質性考驗

    5.   
問題:研究者想要考驗不同性別的學生喜愛的上網時段上網地點是否相同?






圖:SPSS-I-003-02




    6.   
點選【分析 / 敘述統計 /交叉表】開啟交叉表分析視窗。






圖:SPSS17menu-分析-02敘述統計-04交叉表




    7.   
將變項分別設在【列】和【欄】中;點按【統計量】鈕開啟【交叉表:統計量】視窗,勾選【卡方分配】;接著,點按【儲存格】鈕開啟【交叉表:儲存格顯示】視窗,勾選需要觀察的百分比儲存格;按【確定】執行。






圖:SPSS-I-003-05




    8.   
分析報表資料:【性別*上網時段】的Person卡方值為10.963,其漸近顯著性值.052大於顯著水準(.05),故接受虛無假設,即「不同性別的學生喜愛的上網時段相同」。






圖:SPSS-I-003-06




    9.   
分析報表資料:【性別*上網地點】的Person卡方值為3.645,其漸近顯著性值.602大於顯著水準(.05),故接受虛無假設,即「不同性別的學生喜愛的上網地點相同」。






圖:SPSS-I-003-07


注意:


1.進行百分比同質性考驗,「方向性量數」與「對稱性量數」兩個表格中統計量數可以忽略(林曉芳,2008),因為同質性考驗只判斷二個類別變項的百分比分配是否同質,而「方向性量數」與「對稱性量數」則在於進一步追踨二個類別變項的相關性及其預測效果。


2. 本分析結果有多個儲存格的個數都少於5,所以,需要調整細格的類別。





獨立性考驗

10.   
問題:研究者想要考驗學生喜愛的上網時段上網地點是有關聯?






圖:SPSS-I-003-08




11.   
點選【分析 / 敘述統計 /交叉表】開啟交叉表分析視窗。






圖:SPSS17menu-分析-02敘述統計-04交叉表




12.   
將變項分別設在【列】和【欄】中;點按【統計量】鈕開啟【交叉表:統計量】視窗,勾選【卡方分配】;接著,點按【儲存格】鈕開啟【交叉表:儲存格顯示】視窗,勾選需要觀察的百分比儲存格;按【確定】執行。






圖:SPSS-I-003-09




13.   
分析報表資料:【上網時段*上網地點】的Person卡方值為21.066,其漸近顯著性值.012小於顯著水準(.05),故拒絕虛無假設,即「學生喜愛的上網時間和地點有關聯」。





圖:SPSS-I-003-10






「對稱性量數」用來進一步探討二個類別變項之間的關連程度與性質。關連性指標有三種:phi值、Cramer’ V值和列聯係數,三種係數的適用情況不同(林曉芳,2008)
(1)   phi值:用來表示二個類別變項的關連程度。
(2)   Cramer’ V值:適用於列數與行數不相等的交叉列聯表(如:3x4, 4x6…)的關連。
(3) 列聯係數:適用於2x22x2以上的方形交叉列聯表(如:3x3, 4x4…)的關連。


「方向性量數」進一步說明關連性指標的預測效果。如本例以上網時段預測上網地點Lambda值為.351,漸進顯著性值為.000,達顯著水準,表示以上網時段預測上網地點的效果成立,其預測能力達35.1%


反之,以上網地點預測上網時段Lambda值為.149,漸進顯著性值為.001,亦達顯著水準,表示以上網地點預測上網時段的效果也成立,其預測能力達14.9%












圖:SPSS-I-003-10A


圖:SPSS-I-003-10B


注意:


本分析結果有多個儲存格的個數都少於5,所以,需要調整細格的類別。





改變顯著性考驗

14.   
問題:研究者想要考驗顧客想要購買產品的想法,在明星代言產品前、後是否有顯著性改變?






圖:SPSS-I-003-11




15.   
因為,資料是已經預先統計人數,所以,點選【資料 / 加權觀察值】開啟加權觀察值視窗來設定加權計算功能。






圖:SPSS17menu-資料-19-加權觀察值




16.   
在【加權觀察值】視窗中,將加值的變數【人數】設在【次數變數】欄中。






圖:SPSS-I-003-12




17.   
點選【分析 /無母數檢定 /二個相關樣本】開啟分析視窗。






圖:SPSS17menu-分析-16無母數檢定-07二個相關樣本




18.   
將二個相依變項(代言前、代言後),分別設在【變數1】和【變數2】欄位中;勾選【McNemar】,按【確定】執行。






圖:SPSS-I-003-13




19.   
分析報表資料:【代言前 & 代言後】的卡方值為28.350,其漸近顯著性值.000小於顯著水準(.05),故拒絕虛無假設,即「顧客想要購買產品的想法,在明星代言產品前、後,有顯著性改變」。






圖:SPSS-I-003-14







2 則留言:

  1. 您好,我是一個不懂統計的人,現有一個長官交辦的滿意度調查案,調查結果已輸入spss17,對於完成報告我有諸多的問題,不知您是否可得到您的指導,若方便的話,是否可得到您的email,我把相關資料寄給您,再針對我百般的困難及疑惑逐一向您請教

    回覆刪除