應變項連續資料差異分析 詮釋篇
One-way ANOVA: Interpretation

神掌打通任督二脈‧易筋經以簡馭繁

符號意義:統雄快訣統雄快訣 延伸閱讀延伸閱讀 進階議題進階議題 警示訊息警示訊息

SPSS基礎篇

下載範例資料

變異數分析簡介

變異數的分解與組合

統雄老師的變異數分析概念表現式

自由度(df)

變異數分析的均方與F

F分配

變異數同質性檢定

變異數同質性檢定不通過‧後續處理

多重比較 Multiple Comparison

ANOVA 比對 Planned contrast 的趨勢分析 Trend Analysis

單因子變異數分析的應用範例與理論敘述

多因子變異數分析

統計研討篇


資料分析的程序:變異數分析適用連續資料之差異分析,雙變項分析或多變項分析均可。介述:F分配、單因子變異數分析的理論敘述、差異的假設檢定、ANOVA的報告方法、顯著水準是什麼意思、多重事後比較(Multiple post hoc comparison)。以及:雙因子/多因子變異數分析、什麼是 Corrected Model、什麼是 Corrected Total、什麼是固定效果模式、與什麼是隨機效果模式。下載SPSS範例,進行實作。


SPSS 範例檔案下載

以下介紹使用SPSS達成所有分析步驟的過程。

下載SPSS範例資料下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe

下載SPSS範例資料下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar

下載SPSS範例資料下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z

下載SPSS範例資料下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe

下載SPSS範例資料下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe


連續資料差異:變異數分析ANOVA

理論類型:差異/雙變項(單因子)分析或多變項(雙因子/多因子)分析均可

資料型態:連續資料

目的:將自變項分作2組(組的術語稱為「水準」)或以上,檢定各組是否來自不同母群?-亦即組間平均數是否不同?

本項分析方法最早是配合「實驗法」而發展,目前已廣泛使用在調查法與其他各種研究方法。

如實驗法為非隨機分派設計,或自變項非獨立變項,受到其他共變項影響,就要改用共變項分析(ANCOVA)。

高階與多變項分析,多是變異數的分解、組合與比較。
以「面積」分析「線性關係」。

 

變異數的分解與組合

各組合計之變異數總和為:

統雄數學神掌

統雄數學神掌

統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。統雄老師的變異數分析概念解說

變異數分析的運算公式如上所示,但在以背誦為主的教育習慣下,許多人看見2個 ΣΣ 就失去興趣,不想搞懂了。

統雄老師建議不要慌,先改寫為以下式,其中2個 ΣΣ,只是表示先總加組內樣本,再總加組間樣本而已。

統雄老師的變異數分析概念表現式

X:各樣本觀察值

樣本總平均數:樣本總平均數

組內平均數:組內平均數

 

右側第一項,為 組內變異數之和:「樣本-組內平均數」,

右側第二項,為 組間變異數之和:「組內平均數-總平均數」。

左側為右2項相加,為總變異數:即「樣本-總平均數」

變異數分析的目的,是探索組間的「平均數」有沒有差異?

如果各組間的平均數沒有差異,即組內平均數樣本總平均數,右側第2項為0。

則總變異數等於右側第1項,亦即分不分組都沒有差異。

統計是一種「逆向思考」,所以,當右側第1項很小時,右側第2項就很大,也就是總變異數是由組間的差異所造成的。

統雄老師的變異數分析概念表現式統雄老師的變異數分析概念表現式這項概念說明,在未來講授多變項分析之「一般線性模型(GLM)」時,可協助學生更容易瞭解:為何GLM可以整合變異數分析與相關分析、合併處理類別資料與連續資料。

自由度(df)

總自由度﹦組間自由度+組內自由度

組間自由度﹦組數-1

組內自由度﹦(組內樣本數-1)之各組總和

為什麼?

大風吹原理(df愈大,愈接近常態分配)

應用觀念和常態分配、卡方分配一樣。 

變異數分析的均方與F

均方為變異數除以自由度,故 SS/ df = MS

SS: Sum of squares:變異數

MS: Mean square 稱為「均方」,即每單位的變異數。

統雄數學神掌

統雄神掌系列的目的是:快懂、易學、打通思想脈絡,不是抄寫教科書,很多地方和教科書不一樣。不一樣是為了簡化、概念化的教學目的,而非否定教科書。到底是什麼意思?

概念上即「組間變異數」與「組內變異數」之比

亦即:若「組間變異數」>「組內變異數」,則組間有差異。

只有正值

F 計算的對象是「變異數」,但「『分析目的』的對象是平均數 F計算的對象是「變異數」,但「『分析目的』的對象是平均數是否有差異,不是變異數」。

 

F分配


變異數同質性檢定

變異數分析的前提為假設各組內變異數相等,亦稱各組必須具備同質性。

這項假設的原因,在提升變異數分析的品質效果。

注意:變異數分析的目的,實為分析比較平均數。

譬如:如果發現衣索比亞的平均國民所得,比瑞士高,且達顯著水準;其原因其實是因為衣索比亞的貧富太懸殊,而瑞士貧富差距不大所造成的。這樣的「數量」發現,並不能證明「衣索比亞的平均國民所得比瑞士高」的品質結論。

貧富太懸殊(變異數大)與貧富差距不大(變異數小),就是兩者不同質。

所以,變異數分析後必須再加:變異數同質性檢定、又稱為 Levene 各組內變異數相等檢定 Levene's Test of Equal Variances。

變異數同質性檢定的程序,也是一種變異數分析。

Levene 同質性檢定公式

Levene 同質性檢定公式 W 看起來相當複雜。

Levene 同質性檢定公式

以上第1條公式,是 Levene 的原始公式,是以「平均數」為計算對象。

第2條公式,是 Brown–Forsythe 所發展,是以「中數」為計算對象,亦即可以拓展運用到等序資料、無母數統計的範疇,亦稱 Brown–Forsythe 檢定。

Levene 同質性檢定公式

W 的顯著性檢定,就是使用 ANOVA 檢定,即等同:

Levene 同質性檢定公式

k-1: 組間自由度

N-k: 組內自由度

Levene 同質性檢定神掌

Levene 同質性檢定神掌Levene 同質性檢定的道理很簡單:就是把各組組內:

觀察值 - 組平均數

之值,全部改為絕對值(改負為正),再對新值(絕對值)作一次ANOVA。

如果組間(分子)大於組內(分母)、且達顯著水準,就是各組不具備同質性。

「離均差」絕對值的平均數「離均差」絕對值的平均數

但多數文獻、包括以上連結,均未說明為何這個方法可以證明各組內變異數相等。

統雄老師解釋如下:

這個方法就是比較各組、各觀察值在組內「離均差」絕對值的平均數。

而「離均差」的平方,就是變異數。

也就是比較了各組內變異數是否相等。

這個思想方法,和「中央極限定理」是異曲同工的。

變異數同質性檢定不通過‧後續處理

變異數同質性檢定不通過的原因,第一個是樣本不具隨機性,自然沒有推論意義。

如果樣本具備隨機性,變異數同質性檢定仍然不通過,經常是某組內出現特異值(outlier)的狀況。

在此條件下仍擬分析,後續處理就是檢查與排除特異值(outlier)。

以衣索比亞的平均國民所得分析為例,其特異值(outlier)可能是該國統治集團的財富,故將該統治集團的財富剔除後,便可能獲得具變異數同質性下的差異分析,反映衣索比亞的平均國民所得低於瑞士的事實。

其次,可能是分組不恰當。組內可能包括了2個以上平均數有差異的「子組」,造成擴大組內變異數。

還可能有其他原因,應視個案而處理。 

當然,也有組間變異數不同質,但仍可有差異比較的個案。

譬如:如果發現美國的平均國民所得高、變異數大;而斐濟的平均國民所得低、變異數小;兩者雖不同質,但均呈常態分配。這樣的條件下,還是可證明「美國的平均國民所得比斐濟高」的推論。

獨立樣本 t 檢定中,「不假設變異數相等」方法 註:在獨立樣本 t 檢定中,有「不假設變異數相等」的方法,但統雄老師在「人類行為研究」分析中,不推薦 t 檢定的相關方法,理由請參考「計量思想的發展與前瞻」。


多重比較 Multiple Comparison

如果組別超過(含)3組,有進一步作「多重比較 」的必要。

又分作:

計畫事前比對 planned contrast,簡稱比對 contrast,與多重事後比較 post hoc test。

以上兩者 2 選 1 即可,其差別如下。

  比對 Planned contrast 多重事後比較 Post-hoc test
常用於 實驗法 調查法
目的 驗證性研究
Part of a strategy of confirmatory data analysis
探索性研究
Part of an exploratory data analysis strategy
時機 事前比較檢定
A contrast that you decided ttest prior tan examination of the data.
Sometimes called a priori tests
事後比較檢定
A contrast that you decide ttest only after observing all or part of the data.
Sometimes called a posteriori tests
強調 理論導向
These comparisons are theory driven
資料導向
These comparisons are data driven

 

ANOVA 比對 Planned contrast 的趨勢分析 Trend Analysis

ANOVA 的計畫事前比對 Planned contrast,同時可以作趨勢分析 Trend Analysis。

亦即在實驗設計時,各組必須具備「等序」性質。

譬如在新藥實驗時,設定:

1:控制組:服用安慰劑。

2:實驗組A:服用新藥低量劑。

3:實驗組B:服用新藥高量劑。

則可檢定,是否有量劑愈高、效果愈佳的「趨勢」。


F分配屬於Gamma分配的一種F分配屬於Gamma分配的一種。

F分配檢定,若用手算太複雜,練習時可以採用:

推論實作練習線上F分配計算器 

分子 numerator 就是組間,影響形狀,愈大愈接近常態分配。

分母 denominator 就是組內,其實等同樣本數,愈大愈容易顯著。

線上變異數分析ANOVA視覺學習器線上變異數分析ANOVA視覺學習器


管理研究統計課程-問卷 統雄數學樂學/統計神掌易經筋-問卷

 

回頁首 Up to page head 至頁尾 Down to page bottom
上一頁 Back to previous page 回頁首 Up to page head 下一頁 Go to nex page  

統雄數學神掌系列目錄
分享意見反映
統計教學的內涵與取向
高考統計考題的解析
微積分精華篇
微積分思想篇
微積分進階精華篇
統計符號與英讀
資料型態與視覺呈現
敘述統計
機率論與機率分配
推論統計學精華篇
t分配與 t檢定
推論統計‧理論建構
資料分析程序與SPSS基礎
SPSS 資料清理
SPSS 轉換:Recode 重新編碼
SPSS 轉換:Compute 建構新變項
SPSS 選擇觀察值_SPSS 資料庫管理
樣本代表性檢定
單變項:類別_二元資料/詮釋
單變項:類別_二元資料/應用
單變項分析:連續資料
單變項連續資料視覺檢視與清理
卡方分析(雙向)
多向卡方分析
單向卡方分析
變異數分析(單因子):詮釋
變異數分析(單因子):應用
簡單迴歸/相關分析:詮釋
簡單迴歸/相關分析:應用
對數/邏輯相關分析
測量工具信度/效度分析
量表信度檢定
因素分析_EFA
因素效度分析_CFA:詮釋
因素效度分析_CFA:應用
多變項分析精華篇
多元迴歸分析:詮釋
多元迴歸分析:應用
一般線性模型精華篇
廣義線性模型
雙因子/多因子變異數分析
調節模型與交互作用詮釋
調節模型分析與建構
SPSS 統計圖應用:調節模型檢定
共變數分析/詮釋
共變模型建構/應用
因果模型與因果邏輯
中介模型分析
因徑/SEM:模型詮釋與因果邏輯
因徑/SEM:探索式因徑模型建構
因徑/SEM:驗證式結構方程解析
多變項分析實例SEM
多變項分析實例SEM+調節篇
因徑/結構方程SEM:反省
無母數統計
統計研討篇
專題-卜豐投針實驗
專題-機率與統計悖論
1類知識計量工具
2類知識計量工具
3類知識計量工具
非等機率知識體系建構
TX空時座標建構
一般取用測量
信仰取用測量
研究方法/民調市調系列
請點這裡看所有留言分類 Please click here to view categories of comments
同類別內相關主題