Data Types and Its Presentation

神掌打通任督二脈‧易筋經以簡馭繁

符號意義:統雄快訣統雄快訣 延伸閱讀延伸閱讀 進階議題進階議題 警示訊息警示訊息

統計精華

統計量

統計資料的型態

敘述統計

常用統計量

類別資料

中數,Median

眾數,Mode

連續資料

變異數與標準差

標準差的決策應用

機率分配

統計與理論建構篇

統計方法SPSS應用篇


統計量

統計量(statistic)包括2個意義:測量資料某種特徵的「測量方法」,與測量到的「值」。

A statistic (singular) is a single measure of some attribute of a sample (e.g. its arithmetic mean value). It is calculated by applying a function (statistical algorithm) to the values of the items comprising the sample which are known together as a set of data.

More formally, statistical theory defines a statistic as a function of a sample where the function itself is independent of the sample's distribution; that is, the function can be stated before realization of the data. The term statistic is used both for the function and for the value of the function on a given sample.

統計資料的型態

統計量基於資料的型態,可簡分為2大類:

 

1.類別資料

 

2.連續資料


敘述統計

測量與報告樣本統計量的程序-而不推論母群的情形-稱為敘述統計。

母群真正的特徵值,另稱為母群參數(parameter)。

A statistic is distinct from a statistical parameter, which is not computable because often the population is much too large to examine and measure all its items. However a statistic, when used to estimate a population parameter, is called an estimator. For instance, the sample mean is a statistic which estimates the population mean, which is a parameter.

另外,政府統計-尤其是普查資料,就是母群統計量,但其應用與敘述統計相同。而其參數則是其他相關樣本調查,較可靠的母群參數。

當然,政府統計也有2類,1類是普查資料,另1類也是經由調查所推論出來的資料。


常用統計量

 

類別資料

次數分配,n

百分比,%

類別資料

中數,Median

中數(median) 也稱中位數,就是所有觀測值依大小排起來,中間的那個數,若是偶數個數就是兩個中間數的平均數。
中位數的優點,是不受少數極端值的影響。

雖然中位數 觀念可能早已有之,但是遲至1883年才經由統計學的先驅高爾頓把它學理化,成為除了平均數外,常用的統計量之一。

眾數,Mode

眾數就是在資料集中出現次數最頻繁的數值,於1894年左右由卡爾.皮爾遜所介紹。

不過,如果兩個或兩個以上的數值出現次數相同,眾數就不太有意義了。


 

連續資料

平均數:表現集中

連續資料中最重要之一是對於集中趨勢的測度。最早的集中趨勢的測度實際上可追溯至古希臘,就是算術平均數,簡稱平均數mean

變異數-標準差:表現分散

標準差是對連續資料分散度(dispersion) 的測量,它是數據以平均數為準對於分散程度的測度。最早大概是貝塞(Bessel)於1815年用於有關天文學問題的「可能誤差」。目前通用的名詞「標準差」σ,是1894年卡爾.皮爾遜所創。

標準差的計算,必須先介紹變異數的觀念。統雄數學神掌

請問:

「表現分散」為什麼不直接用樣本與平均數差距的正負值表示?而要用以下的面積方式表現? 


變異數-標準差

變異數是一般生活直覺中,不容易自動產生的概念。

許多統計公式都是變異數的分解、比較、組合。

變異數的定義為:

變異數的定義

即觀察值減平均數平方之總和,再除以樣本數。

但統計書上常看到的展開式是:

Variance

σ2 表示母群,而 s2 則指樣本。當要「推論」時,如果樣本數少,會低估變異,稱為偏誤(biased),而分母減1則可校正,稱為「不偏」。

估計偏誤估計偏誤

估計值與真實值的差距,稱為估計偏誤,為避免正與負的影響,而以平方誤差來衡量其大小。
若估計式的平均期望值等於母群參數值(即其差為0),則該估計式為不偏估計式,否則為偏誤估計式。

估計偏誤

n 很大時注意: n 很大時,(n-1)≒n

標準差的公式,統計書上寫:

即變異數的開根號,為曲線函數x軸的標準單位。


平均數與標準差的決策應用

以下是3種治感冒的新藥,在5家醫院試用,可以在3天內治癒的百分比。

請問,那一種藥最好?

  醫院甲 醫院乙 醫院丙 醫院丁 醫院戊
新藥A 86 88 87 88 86
新藥B 87 94 94 75 85
新藥C 60 70 80 90 100

請先計算平均數,並作以下觀察:

新藥C可以百分之治癒。

新藥C可以治癒之平均百分比,低於新藥A、新藥B。

新藥A、新藥B治癒之平均百分比相同,但新藥A有3家低於新藥B。

所以,那一種最好?

敘述統計最佳決策:平均數最高‧標準差最低

在「只比較樣本」-即「只比較觀察對象、不涉及未觀察對象時」,A是最佳決策選擇。

統計最佳決策進階:描述與推論不同時

以上決策程序,僅限於在樣本內選擇。

如果要推論全體,必須使用多因子實驗設計多變項分析,並經過顯著性考驗。 

顯著性考驗實則為樣本數考驗。

統計最佳決策進階:對象不同時

高考的統計「實務考題」:第4題。


統計神掌 統計與理論建構篇

統計神掌 基本統計方法應用-SPSS

統計符號 http://cnx.org/content/m16302/latest/
世界統計 http://www.worldometers.info/tw/

回頁首 Up to page head 至頁尾 Down to page bottom
上一頁 Back to previous page 回頁首 Up to page head 下一頁 Go to nex page  

統雄數學神掌系列目錄
分享意見反映
統計教學的內涵與取向
高考統計考題的解析
微積分精華篇
微積分思想篇
微積分進階精華篇
統計/數學符號與其英語讀法
資料型態與視覺呈現
敘述統計
機率論與機率分配
推論統計學精華篇
t分配與 t檢定
推論統計‧理論建構
資料分析程序與SPSS基礎
SPSS 資料清理
SPSS 轉換:Recode 重新編碼
SPSS 轉換:Compute 建構新變項
SPSS 選擇觀察值_SPSS 資料庫管理
樣本代表性檢定
單變項:類別_二元資料/詮釋
單變項:類別_二元資料/應用
單變項分析:連續資料
單變項連續資料視覺檢視與清理
卡方分析(雙向)
多向卡方分析
單向卡方分析
變異數分析(單因子):詮釋
變異數分析(單因子):應用
簡單迴歸/相關分析:詮釋
簡單迴歸/相關分析:應用
對數/邏輯相關分析
測量工具信度/效度分析
量表信度 檢定
量表效標關聯效度 檢定
因素分析_EFA
因素效度分析_CFA:詮釋
因素效度分析_CFA:應用
多變項分析精華篇
多元迴歸分析:詮釋
多元迴歸分析:應用
一般線性模型精華篇
廣義線性模型
雙因子/多因子變異數分析
調節模型與交互作用詮釋
調節模型分析與建構
SPSS 統計圖應用:調節模型檢定
共變數分析/詮釋
共變模型建構/應用
因果模型與因果邏輯
中介模型分析
因徑/SEM:模型詮釋與因果邏輯
因徑/SEM:探索式因徑模型建構
因徑/SEM:驗證式結構方程解析
多變項分析實例SEM
多變項分析實例SEM+調節篇
因徑/結構方程SEM:反省
無母數統計
統計研討篇
專題-卜豐投針實驗
專題-機率與統計悖論
1類知識計量工具
2類知識計量工具
3類知識計量工具
非等機率知識體系建構
TX空時座標建構
一般取用測量
信仰取用測量
研究方法/民調市調系列
請點這裡看所有留言分類 Please click here to view categories of comments
同類別內相關主題