列聯表/交叉表

類別資料之差異理論檢定

Chi-square Analysis for

Contingency table/ Cross tab

神掌打通任督二脈‧易筋經以簡馭繁

符號意義:統雄快訣統雄快訣 延伸閱讀延伸閱讀 進階議題進階議題 警示訊息警示訊息

SPSS基礎篇

列聯表/交叉表簡介

卡方分析簡介

卡方分配

自由度

SPSS 範例檔案下載

雙向卡方分析應用範例

卡方分析的假設檢定第一式
卡方分析的假設檢定第二式
卡方分析的顯著水準
細格校正

Exact Method 直接機率(精確)檢定法

批次卡方分析

多向卡方分析

應變項分析

多維列聯表

多層次卡方檢定

假性顯著解決方案

單向卡方檢定

水準間差異

2組資料間差異

統計研討篇


資料分析的程序:卡方分析適用列聯表Contingency table,或稱交叉表Cross tab中類別資料之差異理論檢定。可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。介述卡方分配、自由度、卡方分析的假設檢定第一式、假設檢定第二式、顯著水準、細格校正。下載SPSS範例,進行實作。


列聯表Contingency table/交叉表Cross tab

以類別陣列呈現的表格,特稱為列聯表Contingency table,或稱交叉表Cross tab。分析行列間差異或關聯的統計工具有很多,其中最常用、也最適用的就是卡方分析。由於研究目的包括:探索行與列是否呈「自變項à應變項」關係;或可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。

In statistics, a contingency table (also referred to as cross tabulation or cross tab) is a type of table in a matrix format that displays the (multivariate) frequency distribution of the variables. The term contingency table was first used by Karl Pearson in "On the Theory of Contingency and Its Relation to Association and Normal Correlation", part of the Drapers' Company Research Memoirs Biometric Series I published in 1904. 

類別資料差異:卡方分析Chi-square

理論類型:差異/雙變項分析或多變項分析均可

資料型態:類別資料

目的:(1)列聯表內細格的次數分配是否相同?(2)2個以上的類別變項是否彼此獨立?-無差異即為獨立。

列聯表通常以自變項為列,應變項為欄(SPSS稱為直行);但有時資料無法區別自變項、應變項,而是分析2變項是否互相獨立,即分析目的2。

 

核心觀念:卡方值

統雄數學神掌

O: 觀察值

E: 期待值

統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。 到底是什麼意思?

與變異數同理,避免總加後為0,所以平方。

概念上的「絕對比」概念上的「絕對比」(統計書上沒有這個詞,但卻是理解的關鍵。)

因屬於類別資料-即次數,故只有正值。

 

卡方分配

Chi-squareCurves

卡方分配屬於Gamma分配的一種。

自由度(df)

(r-1)*(c-1)

為什麼?

大風吹原理(df愈大,愈接近常態分配)

應用觀念和常態分配一樣,譬如在K=1時(即2*2列聯表),95% 的 χ2 <3.84,而當K=3時,95% 的 χ2 <7.82。

卡方分配檢定,若用手算太複雜,練習時可以採用:

推論實作練習線上卡方分配計算器 


SPSS 範例檔案下載

以下介紹使用SPSS達成所有分析步驟的過程。

下載SPSS範例資料下載SPSS範例資料(右鍵下載)

下載SPSS範例資料下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.sav


雙向卡方分析應用 Two-way Chi-square Analysis

「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形。

問題:本公司電子商務產品策略,是否要考慮性別因素?

研究問題的「理論建構」化

以上問題是個「品質型」問題,且具備雙變項,所以必須先發展成可計量的「理論建構」型式。

應變項:是否要考慮性別因素的原因,就是要知道是否男女買氣不同,故其可計量的變項就是「上網行為」。

自變項:性別

理論建構可以用「 理論敘述」或是「假設檢定」的方式呈現如下:

統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。

理論敘述

網路上網行為是否有性別差異?

假設檢定

H0 為 Null Hypothesis, H1 (有些書作 HA) 為 Alternative Hypothesis

假設第一式

設  i:性別, i=1,2 j:網路上網行為 j=1,2
H0 : Pi1= Pi2,
H1 : 至少有1個i 的 Pi1、 Pi2  是不相等的

或假設第二式

H0 : 性別與網路上網行為是彼此獨立的
H1 : 性別與網路上網行為不是彼此獨立的
註:第一式稱為 test of goodness-of-fit,第二式稱為 the chi-square test of independence。第一式必須增加檢驗卡方值是否趨近於0,不過,對於初學者,可視為相同。

 

〉分析

〉描述性統計

〉交叉表

統雄數學神掌

以 自變項為列,應變項為欄(直行)

〉統計量

〉選擇「卡方分析」

其他多種統計量,一般作為「無母數統計」範疇再使用。 

統雄數學神掌

〉格

選擇〈觀察值〉,即次數,與3種百分比。

「列」百分比最重要,但3種百分比,可展現全面涵義。

統雄數學神掌 卡方分析的目的是「百分比的差異」,但「計算對象是次數,不是百分比」。 

統雄數學神掌

報表輸出與詮釋

統雄數學神掌

檢定可只報告:經由 Pearson 卡方檢定,性別在上網行為上,未達到顯著差異。

如要節省空間,可只報告「次數」「列百分比」。 


統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。顯著性差異

顯著不一定重要

重要的是「差異的大小」

顯著更不表示有「因果」關係

「顯著」只表示,差異不是誤差造成的-亦即,樣本數夠大而已。樣本數大,一定顯著。

差異「未達顯著水準」,就沒有列表、闡述的必要。差異「達到顯著水準」,還必須進一步分析。

統雄數學神掌 註: Two-tailed test 中譯常作「雙尾檢定」,對常態分配尚易理解;對卡方分配則常令學生不解,其實其意義應為「無大小、方向性檢定」,若達到顯著水準,僅證實 Pi1 ≠ Pi2 ,而不論何者為大。

統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。 細格校正/重要趨勢

細格次數不宜 < 5,不得 = 0。

細格次數如果 < 5 ,處理方案演變

(1)以抄寫剪貼為主的教科書記載:若為2×2 表格,且不超過1格,應使用 Yates 連續性校正檢定;此說已在1980年代後被推翻,當前應避免使用Yates 校正。

Yates 校正其實只是在卡方公式中,以人為方式把分子減0.5,亦即卡方值變小,避免產生假性顯著。但後來更多研究發現,此方法造成應該顯著,卻假性不顯著,亦即推論錯誤類型2的問題更大。(詳見Sokal, Robert R. & F. James Rohlf; The principles and practice of statistics in biological research; New York : Freeman, 1981)

(2)現在多主張「合併變項類別」 ,使所有(或至少〉20%) 之細格次數﹦〉5。

亦即樣本數不能太少,在細格愈多時,樣本必須愈多。

(3)使用 Fisher's Ezact 精確檢定。

Exact Method 直接機率(精確)檢定法

SPSS 報表附有「Fisher's 精確檢定」,其翻譯得有點奇怪,Exact probability test 是「直接機率檢定」的意思,就是在 2×2 ,且小樣本(<30)時,直接從最基本機率(即排列比)計算起,解決 c2 在小樣本會膨脹的問題;並不是別的檢定法就「不精確」。

統雄老師一再指出:行為研究之樣本宜大於200,若少於30。生物研究或許還可以改用「直接機率檢定」以取代卡方檢定,但對行為研究已幾乎無意義,不如只用百分比作「質的比較」。

統雄數學神掌 註: SPSS 新版,已將Exact Method 獨立為介面的一個選項。


批次卡方分析

卡方分析可以批次進行,一次作若干個雙向分析,如下所示。

應變項:有無上網、有無從事某種網路使用行為

自變項;性別、教育程度

批次卡方分析

產生的報表,是多個雙向卡方分析的報表,與「多向卡方分析」的巢狀表格不同。

多向卡方分析在分類上,屬於多變項分析。但在 SPSS 中使用同一程式,且分析觀念沒有太大跳躍,所以在教學考量上,接續介述。


統雄數學神掌 統雄數學樂學/統計神掌易經筋-問卷

回頁首 Up to page head 至頁尾 Down to page bottom
上一頁 Back to previous page 回頁首 Up to page head 下一頁 Go to nex page
 

統雄數學神掌系列目錄
分享意見反映
統計教學的內涵與取向
高考統計考題的解析
微積分精華篇
微積分思想篇
微積分進階精華篇
統計符號與英讀
資料型態與視覺呈現
敘述統計
機率論與機率分配
推論統計學精華篇
推論統計‧理論建構
資料分析程序與SPSS基礎
SPSS 轉換:Recode 重新編碼
SPSS 轉換:Compute 建構新變項
樣本代表性檢定
單變項:類別_二元資料/詮釋
單變項:類別_二元資料/應用
單變項分析:連續資料
卡方分析(雙向)
多向卡方分析
單向卡方分析
變異數分析(單因子)
雙因子/多因子變異數分析
簡單迴歸/相關分析:詮釋
簡單迴歸/相關分析:應用
對數/邏輯相關分析
測量工具信度/效度分析
量表信度檢定
因素分析_EFA
因素效度分析_CFA
多變項分析精華篇
多元迴歸分析
一般線性模型精華篇
廣義線性模型
調節模型分析
共變模型/共變數分析
中介模型分析
因徑/SEM:模型詮釋與因果邏輯
因徑/SEM:探索式因徑模型建構
因徑/SEM:驗證式結構方程解析
多變項分析實例SEM
多變項分析實例SEM+調節篇
因徑/結構方程SEM:反省
無母數統計
統計研討篇
專題-卜豐投針實驗
專題-機率與統計悖論
1類知識計量工具
2類知識計量工具
3類知識計量工具
非等機率知識體系建構
TX空時座標建構
一般取用測量
信仰取用測量
研究方法/民調市調系列
請點這裡看所有留言分類 Please click here to view categories of comments
同類別內相關主題