吳統雄
English
履歷
研究
教學
服務
榮譽
人文素養
數位音樂
討論區目錄
站務與協助

內容網站:提供與分享各種知識、資訊、作品。互動群組:社員可以討論、展示、交流、企畫、分工、管理、投票決策。合作群組:Web2.0的民主自治精神,社員可以參與決定群組的內容與表現形式。

吳統雄的音樂-Sean TX Wu's Music  笑話中學美語-Humor and American English Learning   私人來信-Write a private mail to Sean TX Wu  留言與討論 Leave Comments/ Forum 吳統雄的相簿-Sean TX Wu's Album

只在「統雄社群」內查詢以下主題 Search in TXCommunity

 

Factor Analysis by SPSS

神掌打通任督二脈•易筋經以簡馭繁

因素分析簡介

因素分析的樣本數

探索式因素分析(EFA): SPSS 應用

主成分分析

轉軸法

建構新構念(因素)變項

因素負荷量

因素分析的報表

相關係數矩陣

可行性檢定

共同性

因素數目取捨

陡階檢定

構念量表建構與因素命名

構念變項分數

因素分析真實個案解析:政治態度分析

因素萃取與命名

淨化項目與建構量表

理論應用:政治態度三角理論

檢討:因素存在之可遇不可求

因素分析之GIGO

因素效度/驗證式因素分析(CFA) 


因素分析簡介

因素分析是多變項萃取與分類統計工具,又分為2類:第一類稱為探索式因素分析exploratory factor analysis, EFA),目的在萃取構念(construct)-或稱隱性因素(latent factor),並用以建構量表。建構的程序為:

1.設計題庫與原始測量工具-最常見的是「總加量表」。

2.因素萃取-譬如使用SPSS

3.根據理論邏輯進行因素命名-亦可視為「構念」命名。

4.淨化量表項目以建構具備信度的量表。

第二類為驗證式(confirmatory factor analysis, CFA),是檢驗「因素效度」-或稱「因素組合」-確認構念存在、以及應用構念發展理論的方法。

因素分析是相關分析與變異數分析的綜合進階應用。

因素分析的樣本數

能否作EFA的前提與樣本數密切相關。樣本數當然是愈多愈好,但底限呢?文獻有3種主張:

1.樣本數絕對值:雖然有出現過底限100的記錄,一般仍以200為底限。

2.[樣本/項目]比:從主張5;1 到 20:1 的都有。

3.依據各種相關指標(如 Communality, KMO...詳後),對個案作反復評估。(Zhao, MacCallum et al.)

從知識立場,當然是第三種途徑最完整,但此一途徑,許多目的是希望能以較少樣本,也能執行因素分析,若不周全,其實風險較高。在各方考量下,對非統計專業者,就不知如何著手作因素分析了。

統雄老師推算過研究人類行為的最低樣本數為200,所以建議準用這個樣本數為最低限。


下載SPSS範例

下載SPSS範例資料下載SPSS範例資料(右鍵下載)

下載SPSS範例資料下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.sav


 

探索式因素分析(EFA): SPSS應用

應用範例

範例目的:網路使用沉迷行為分析
這是一個習題,不是真正的研究。

題庫:52題(即項目,或狹義的變項)

擬萃取出若干獨立而互斥的構念(因素),以解釋網路使用行為。

〉資料縮減

〉因子

(EFA): SPSS 應用

選擇要萃取的項目(變數)

選擇要萃取的項目

SPSS 使用shift 拉變項的時候,有可能會掉,要小心檢查。本例是C1~D26。

選擇要萃取的項目

〉描述性統計量

描述性統計量

主成分分析

萃取的方法有多種,最常用的為:

主成分法(Principal Component Analysis):以變異數分析為基礎。

其次為:

狹義的主因素法(Principal Factor Analysis):以共變數分析為基礎。

主成分分析

>萃取

特徵值(Eigenvalue):每因素所含各項目所貢獻的量。

每1個項目的最高特徵值是1,總特徵值數,就是項目數,所以本例就是52。通常認為1個因素的貢獻要超過1個項目才有意義,所以預設為1以上,才進行萃取。

另一個選項〈因子個數〉,預設為不選,而採用反復萃取,至選定之特徵值為準。

若是選擇此項,是由研究者決定萃取的因素個數,通常是第二輪以後的作法,或是進行「驗證式因素分析」時,強迫建構因素使用。

收斂最大疊代(Maximum Iterations for Convergence):意指最多反復萃取幾次,預設25為最高。

轉軸法

因素必須追求「獨立而互斥」,其在幾何上的意義,就是資料在「2個獨立而互斥因素」構成的直角平面座標上,會形成迴歸直線。有時資料會受到第3個以上因素的影響,直接視覺並無直角平面、也無直線,但旋轉後,會接近此前提之要求。

轉軸可以增加因素內項目的貢獻度、不同因素之間的獨立性,建議必選。

轉軸法

建構新構念(因素)變項

照常用的量表就是總加量表,傳統上在經過因素分析、取捨項目後,就是將淨化後的項目總加,作為建構新構念(因素)變項的分數。

現在因素分析可以提供更細致的權重方法,譬如迴歸法就是以項目對因素的迴歸係數來權重後再總加。

建構新構念(因素)變項

因素負荷量

在因素分析中,Missing Value 的處理,為避免項目間不平衡產生的誤差,應該選擇 Listwise。

因素負荷量就是項目對因素的標準迴歸係數,介於0~1之間。其意義評估與相關分析同。

預設為0.1以下就不顯示了,當然,0.3以下就幾無重要性了。

系統預設報表為按照變項輸入順序排序,在後續建構量表時,閱讀較不順,所以改選按相關程度排序。

因素負荷量

因素分析的報表

基本資料

因素分析的報表

相關係數矩陣

觀察項目間的相關程度。

相關係數矩陣

可行性檢定

因素分析繼續往下作有沒有意義?

KMO

以相關分析的形式,從共變項分析反映樣本數是否足夠,區間為0~1,作者建議宜大於0.6。 

0.6的意思,就是其平方值為.36,解釋力為3分之一。但統雄老師一貫建議,要0.7以上,亦即解釋力近半比較好。

Bartlett 球型檢定

類似卡方分析概念,如果各項目落點平均分配(像球型),即不顯著,就是缺乏因素間的獨立互斥。所以本項檢定必須顯著才可通過。

可行性檢定

共同性

共同性(Communality),即項目可貢獻至因素之程度。

共同性

因素數目取捨

根據預設捨棄Eigenvalue<1 的因素,本例剩餘12個因素。

平方和負荷量:即判定係數。

變異數的%:反映各因素可解釋總變異量的百分比。

對人類行為而言,真正獨立互斥之因素很少多於7個,所以必須再進一步取捨。

從平方和負荷量總和發現,第5因素與前後因素尚有差距,而第6因素以後,因素間差距變小,稱為發生「陡階(Scree)」現象。

因素數目取捨

陡階檢定

根據陡階圖,決定選擇前5項因素。

陡階檢定

構念量表建構

這是轉軸前,各因素所含之項目分析。

構念量表建構

因素命名

通常會以轉軸後,各因素所含之項目分析為準,並進行命名。

本例可分別命名為:情色行為、交友行為、收集資訊行為、遊戲行為、禮儀行為。

構念量表建構

構念變項分數

在「變數檢視」可以發現自動產生新構念變項。

構念變項分數

在「資料檢視」則可發現各樣本的構念變項分數。

構念變項分數 

權重分數呢?還是原始分數?權重分數呢?還是原始分數?權重分數呢?還是原始分數?

SPSS 自動產生的構念變項分數是權重分數,而一般量表在統計時,都是使用原始分數總加?

這兩者之間有優劣嗎?

這好比1份25題的考卷,原始總加量表就是每題平均4分;而權重量表,則是收回全體考卷後,再統計比較多人會答的題目,評分高一點;而較少人會答的題目,評分低一點,這就是權重分數。

權重分數的效果,可能會使觀察對象之間的差異較小;而原始分數的效果,可能會使觀察對象之間的差異較大。

所以,採用那一種分數,還是要從理論基礎、研究的特殊目的,再加斟酌。

回頁首 Up to page head 至頁尾 Down to page bottom

因素分析真實個案解析:政治態度分析

「統雄神掌」系列的特色,不僅是介述使用統計軟體,更強調的是導引思想方法與知識探索,所以以下的分享應更重要。

背景與目的

吳統雄(1983a) 在民國七十一年臺灣選舉期間,研究選民對當前政治論題的看法,主要研究問題是:

(1)臺灣的選民關心什麼 問題,這些問題可以歸納為哪些類型?-政治態度分類、因素萃取與量表建構

(2)那些選民對那些類型的問題看法不同?為什麼不同?-選民間政治態度分類分析

(3)選民的觀點和候選人的觀點異同之處為何?何以有所異同?-選民、候選人間分類分析

測量工具

測量工具為六刻度的總加量表。
據以往研究事前設計量表項目共三十八道。

方法與程序

(1)列出三十八道題項目的平均數及標準差。
(2)將此三十八個項目進行因素分析,得3個主要的因素(表1至3)。因素所包含的項目,以「因素負荷量」大於或近於).5為準。

因素萃取與命名

因素分析報表在1983年,尚無SPSS PC 等軟體工具,因素分析必須自己寫電腦程式,輸出介面不易完整。但在今日的條件下,因素分析報表必須完整。

決定 因素個數

根據「陡階檢驗」法,前3個因素的可解釋變異量百分比分別為:33.1,16.5,11.9,而第4個便陡降至4.6,且只包含1個項目,故僅萃取前3個因素。前3個因素可解釋變異量百分比分之和為61.5。

表1. 公共政策因素

編號

項目

因素負荷量

保護環境

.57934

改善交通

.49519

改善公職人員品質

.57585

11

工業與勞工問題

.70457

15

加強教育

.54925

16

農業與農民問題

.64522

17

國營企業問題

.52626

18

醫療服務

.59810

19

就業輔導

.61743

20

改善公共設施

.61710

23

漁業與漁民問題

.52290

25

國民住宅

.59557

27

加強體育

.73673

28

都市計畫

.57000

29

社會福利

.56409

32

婦女問題

.64990

34

開發觀光

.56349

35

軍公教人員福利

.55808

Eigenvalue=9.07164 Pct. of Val.=33.1

表.2 政治規範因素

編號

項目

因素負荷量

36

加強政治制衡力量

.76033

37

強化地方自治力量

.64371

30

綠卡問題

.59409

38

加強維護人權,取消戒嚴法

.57896

10

銀行呆帳問題

.46979

Eigenvalue=4.525 Pct. of Val.=16.5

表3. 政治認同因素

編號

項目

因素負荷量

中共對臺灣的威脅

.72079

12

物價上漲,通貨膨脹

.50356

臺獨對臺灣的威脅

.48309

22

復興文化問題

.49664

實踐三民主義

.40940

Eigenvalue=3.25366 Pct. of Var.=11.9


根據研究理論•命名提出的因素

在因素的命名方面,從政治發展的角度,學者指出,當前中國政治體有三方面的問題:第一是「認同」的問題,即政治體系中成員相互接納合作的根本問題,而與種族、地緣及文化等種種原因有關。

第二是「制度與規範」的部分,即行使統治權的規範,其中又包含四項內容:政治體系中成員權力的平等、政治權力的來源、統治權的範圍、和統制權的制衡。

第三則是「政策」的部分,其中的問題又可細分為兩方面:一是政府因應生活環境與生活資源的變化,所調整修訂的施政方案是否能解決人民生活的基本需求,也就是所謂「公共政策」public policy )的問題;其二是施政的權威當局,他們的能力和表現,是否令人滿意,也就是「公職人員品質和行政效率」的問題胡佛,1982;臺大政治系,1981)。

前述所抽出的第一個因素,其中包含的項目多與人民的基本生活需求有關(表1),因此命名為「公共政策」因素。與這個因素也有相當密切關係的項目還有:低收入者福利、中小企業融資、賦稅與預算、防洪、攤販問題以及簡化行政手續等。   

第二個因素中的變項:加強政治制衡力量、加強維護人權並取消戒嚴法、加強地方自治力量,均與制衡「統治權力」或要求增加參與政治的機會有關,屬於政治體系中「規範」的範疇。而「銀行呆帳」與「綠卡問題」是臺灣的兩個特殊現象。因為當時臺灣的銀行均由政府經營,某些政治階層中的成員便可利用微妙的政治關係,從銀行取得特別的貸款,進一步轉為無法核銷的呆帳造成國庫的損失。這個問題可以說與政治體系中的成員,彼此權力是否平等有關。另外,在台灣的政治圈中有一種傳說,認為某些階層中的人物,或是他們的親戚,擁有第二國─尤其是美國─的國籍,從而懷疑他們是否仍然適合擁有政治的權力。這兩種現象也與政治的規範有關,因此,把第二個因素命名為「政治規範因素」。

第三個因素的內容,反映了選民對中共與臺獨戒懼的態度,也就是與政治上的基本「認同」問題有關。將它命名為「政治安全因素」、以表現這個因素的具體層次是追求安定,而它的抽象層次則是在認同上發生歧見。這個因素中還有「物價上漲,通貨膨脹」一項,在民國三十八年前後,中國大陸大動亂時期,「物價上漲,通貨膨脹」是反映政治危機最明顯的現象,在歷史記憶中,通貨膨脹與政治危機密切相關,因此「反膨脹」也反應了追求政治安定的意義。
第三個因素同時包含「復興文化問題」與「實踐三民主義」2個項目。對中國政治文化深入研究的白魯恂 (Pye,1968,1981 )數度指出中國政治制度有兩個最深刻的特徵:階層制度和「定於一」的意識型態,這兩者幾乎支配了傳統中國政治文化的每一個層面。時至今日,這兩者的外顯形式雖已改變,但基本的特質仍然不變,其中「定於一」的意識型態從前是儒家思想的文化,今天則是三民主義。而如果沒有一種一元化的意識型態,許多人都會深刻感到不安。這種傾向說明中國人強調適應與和諧,不容許駁雜 (diversity) 的傳統。這個因素中「實踐三民主義」一項的因素負荷量 (factor loading) 雖然只有.4094,但仍然把它列入,因為一則這個變項在諸多因素之間,與這個相關系數最大,其次這個變項得分最高,故由研究者自行(arbitrary)決定列入。
以上的3個因素可以說大體解釋了選民所關切的主要問題,以及問題的類型。

淨化項目與建構量表

刪除不明確的項目

因素分析後,發現有10道項目,和前途3個因素相關均不密切,因此 把他們從量表中剔除,以免妨害整個量表的鑑別力。
這些項目是:第(2)(4)(6)(13)(14)(21)(24)(26)(31)及(33)項。

重整項目,建構量表

由於研究的目的不是觀察各項目之間枝節關係,而是探討某些抽象觀 念如選民對「公共政策」的看法等等。因此根據「總加量表」的編製理 論,可以把這個構念相關的項目分數加起來,
它們的平均分數即可視為這個構念的分數。
因此,每一位受訪問者的資料可以重新組成3個新量表,它們的名稱及測量值如下:
公共政策量表a=[(3)+(7)+(9)+(11)+(15)+(16)+(17)+(18)+(19)+(20)+(23)+(25)+(27)+(28)+(29)+(32)+(34)+(35)]/18
政治規範量表=[(10)+(30)+(36)+(37)+(38)]/5
政治認同量表=[(1)+(5)+(8)+(12)+(22)]/5

理論應用:政治態度三角理論

吳統雄以上的發現,可以命名為「政治態度三角理論」。

「政治認同、政治規範、公共政策」此3因素似可「獨立而互斥」的描述人類政治態度形成的內涵。

在臺灣自1980至當前的環境中,「政治認同、政治規範」更可區別不同政治態度的群體。相對於其他國家地區,「公共政策」如全民健保、移民政策…是足以影響政治態度的一環。吳統雄過去的研究資料中,臺灣人民過去在公共政策上並無重大差異。但隨著國際經濟、政治大環境的變遷,如ECFA等原屬公共政策的議題,是否會和政治認同糾結,逐漸也成為影響政治態度的因素,值得觀察。

吳統雄在早期也曾經應用「政治認同、政治規範」作為自變項,預測選民的投票行為,獲致相當成功的效果。唯必須以更深入的歷史、與實證經驗作完整的闡述與理解。


因素存在之可遇不可求檢討:因素存在之可遇不可求

吳統雄在前例之後,在多次再作因素分析經驗中,逐漸領悟:要用此方法找到「具備理論正確性、實證可行性、預測實用性」的因素,實在是可遇不可求。

其一,應該是計量方法的原因。因素分析的萃取,是線性方法。而吳統雄逐漸發現,人類的行為幾乎沒有線性發展的,工具本身並不具最適性。

同時,刻意(知道因素萃取的原理)或無意/無知(譬如想知道「智育」的內涵因素,出了1張測驗題,即使題目很多,卻只包含加減2種題型。)都可能產生:人為的、偏頗的、非科學邏輯性的…但形式報表上卻可出現的因素。

其二,更基礎的原因還是「理論建構」。吳統雄後來逐漸發現,「政治認同、政治規範、公共政策」存在更基礎的原因,可能是「TX 取用模式」所描述的人類基本行為。

「公共政策」反映的是「一般取用模式」中,人類對取用物的生理需求。

「政治規範」反映的是「信仰性取用模式」中,人類對「社會形象」的接受。

「政治認同」反映的則是「信仰性取用模式」中,人類「個人的意識型態」。

所以「政治態度三角理論」實在是「TX 取用模式」中特定領域:政治行為-的應用。

可能因為「TX 取用模式」的存在,所以即使採用不是最佳工具的因素分析,也得以發現「政治態度三角理論」。

因素分析之GIGO因素分析之GIGO

因素分析很可能發生「垃圾進出」現象。

前述範例習題「網路使用沉迷行為分析」通過一切檢定考驗,就形式來看,是一個完整的正式研究。但就事實來看,其實是一個倒果為因的例子。

這是因為委託研究單位主觀要求5個研究向面,受託研究者只好「變」出來,並不是網路行為真的可在知識上畫分為這5個構念。

這是當前(還是歷史之不變?)的學術生態,為服務、為生存、為預設結論而作儀式研究。

本範例習題之研究者還屬「自知、自覺」型。當前全球有多少論文是在不自覺下之GIGO,誠屬可警惕之事!


因素效度/驗證式因素分析(CFA)因素效度/驗證式因素分析(CFA)

note 管理研究統計課程-問卷

回頁首 Up to page head 至頁尾 Down to page bottom
上一頁 Back to previous page 回頁首 Up to page head 下一頁 Go to nex page
 請點這裡看所有留言分類 Please click here to view categories of comments

統雄社群-相關主題

上層主題
數學樂學/統雄數學神掌目錄
統計教學的內涵與取向-數學樂學•統雄神掌簡介
高考統計考題的解析-數學樂學•統雄神掌簡介
統雄-微積分神掌 易筋經
統雄-微積分神掌 思想篇
統雄-微積分神掌 進階篇
統雄-統計神掌 易筋經
統雄-統計神掌 統計符號與英讀
統雄-統計神掌 統計資料型態與呈現篇
統雄-統計神掌 統計量與敘述統計篇
統雄-統計神掌 統計機率與分配篇
統雄-統計神掌 理論建構篇
統雄-統計神掌 資料分析程序與 SPSS 基礎
統雄-統計神掌 SPSS 樣本代表性檢定
統雄-統計神掌 SPSS 單變項 類別資料/百分比分析篇
統雄-統計神掌 SPSS 單變項 連續資料/描述估計分析篇
統雄-統計神掌 SPSS 卡方分析/雙向篇
統雄-統計神掌 SPSS 多向卡方分析篇
統雄-統計神掌 SPSS 單向卡方分析篇
統雄-統計神掌 SPSS 單因子變異數分析篇
統雄-統計神掌 SPSS 雙/多因子變異數分析篇
統雄-統計神掌 SPSS 簡單迴歸/相關分析 詮釋篇
統雄-統計神掌 SPSS 簡單迴歸/相關分析 應用篇
統雄-統計神掌 SPSS 量表信度檢定篇
統雄-統計神掌 SPSS 因素分析篇
統雄-統計神掌 SPSS 因素效度分析/CFA篇
統雄-統計神掌 多變項分析易筋經
統雄-統計神掌 SPSS 多元迴歸篇
統雄-統計神掌 一般線性模型易筋經
統雄-統計神掌 SPSS  廣義線性模型篇
統雄-統計神掌 SPSS 調節模型_交互作用分析篇
統雄-統計神掌 SPSS 共變數分析篇
統雄-統計神掌 SPSS 中介變項_中介模型分析
統雄-統計神掌 SPSS 因徑/SEM:模型詮釋與因果邏輯
統雄-統計神掌 SPSS 因徑/SEM:探索式因徑模型建構
統雄-統計神掌 Amos 因徑/SEM:驗證式結構方程解析
統雄-統計神掌 SPSS 因徑分析/結構方程反省篇
統雄-統計神掌 多變項分析實例:調節模型與子孫引用
統雄-統計神掌 多變項分析實例:因徑/結構方程模型與統計工具適配
統雄-統計神掌 無母數統計/非機率分配統計
統雄-統計神掌 統計研討篇
統雄-統計神掌 專題-卜豐投針實驗篇
統雄-統計神掌 專題-機率悖論篇


創用 CC 授權條款
此作品衍生自統雄網路社群 http://tx.liberal.ntu.edu.tw 吳統雄 Sean TX Wu 製作,以創用CC 姓名標示-非商業性-相同方式分享 3.0 Unported 授權條款釋出。此條款的授權同時適用於 http://tx.liberal.ntu.edu.tw 下,與 http://tx.shu.edu.tw 下,除特別標明外,所有媒體形式之著作物。
本網群為公益服務,瀏覽者須接受以下聲明,方可瀏覽。著作權聲明-Copyright ©吳統雄申請引用資訊-免責聲明-鳴謝:本網路社群之硬體設備由臺灣大學獎助提供,相關研究亦曾受國內外機構補助。