圖片取自:Zazzle(網拍)
竟然會有人想把ANOVA印到衣服上~~~實在中毒太深了XDD
由於論文的關係,讓這組課堂心得停擺了一年(金拍謝^^)
這次呢~從最常見的ANOVA來跟大家見面!!
如果還記得之前談的卡方與T 檢定的特性的話,
要記住現在這個ANOVA就容易了,不過我猜這種事是不太可能的(大笑)
所以就沿用了寶煖老師整理的的表格供大家參考~
自變數 | 依變數 | 統計分析方法 |
類別 | 類別 | 交叉表(卡方) |
類別 | 連續 | T-test:1~2個樣本 ANOVA:2個以上樣本 |
連續 | 連續 | 相關分析 |
連續 | 類別 | 迴歸分析 |
所以這裡我們可以建立一個簡單的概念:
ANOVA是用來檢定平均數之間是否有顯著差異(significant differences)
如同表格所示,如果我們的樣本只比較兩組平均數
那不管你用ANOVA的結果和獨立樣本(比較兩個不同群體)
或成對樣本(比較一組觀察值的兩個變數)T檢定是一樣的喔!!
換句話說,只要超過兩個以上的獨立樣本要比較其間的平均數差異時
就必須要利用1923年Fisher所創用的ANOVA了!!
「明明就是比較平均數,為啥要叫作什麼變異數分析勒?」
因為呢,我們實際在檢定平均數的統計顯著性時
其實是在關心那些變異數(variances)的部分,
就是計算全體樣本在依變數的分數變異情形,
並著重在兩個項目去計算「組內差異(自變項變異)」與「組間差異(誤差變異)」
恩~到這裡,我們稍微建立一下簡單的概念,我們常常會對ANOVA有些恐懼,
像是什麼總是搞不懂單因子、雙因子之類的,一冒出來總是想一下它指得是什麼 ?
回到上面那張圖一下,ANOVA的自變項是類別變項,而這個自變項就是「因子」
因子包括的可能數值 就是水準(level),如因子=性別, 2 level = male or female
所以阿~是有所謂的ANOVA家族的!
當研究的是一個自變項(記得是類別變項喔!)對依變項平均數的影響時
不管該因子內有多少水準,所進行的就是單因子變異數分析(One Way ANOVA);
若是同時考慮兩個自變項時,就是二因子變異數分析(Two Way ANOVA);
若是同時考慮多個自變項時,就是多因子變異數分析(Factorial Analysis of ANOVA)
另外還有一些更複雜的情況...
當研究者意欲控制某連續變項時,去除第三變項的混淆效果
以瞭解自變項對某特定連續變項的效果時,叫做共變分析(ANCOVA, Analysis of Covariance)
以及當依變項數目增加時的多變量變異數分析(Multivariance analysis of variance)
不過,這邊主要還是給大家一個概念去思考這些分析的意義
因為這些家族的出發點都還是以ANOVA的核心概念去延伸自變項、依變項而已
以下我們會以最常見的單因子與二因子ANOVA來解釋與舉例之~
單因子變異數分析(one-way ANOVA)
就是指只有一個自變項的變異數分析,如- 製作甜甜圈時使用不同的食用油是否會影響甜甜圈的油脂吸收
類別:不飽和油脂= 花生油、葵花油;飽和油脂=豬油
連續:油脂吸收量 - 不同領域的學生對資訊素養目標的看法
類別:人文、社會、自然、工程、醫學(5 level)
連續:資訊素養目標(用問卷量尺)
務必把握magic7的原則,不要太多,太多就適度的合併吧!
再來就是研究假設,變異數分析所檢驗的虛無假設是:
所有樣本所來自之母群體之平均數都相等,
- 虛無假設(H0):u1 = u2 = u3 =……= uk
- 對立假設:u1、u2、u3、……、uk至少有一個不等
只要拒絕虛無假設,則表示對立假設可以成立
所以只要至少有一個平均數是和其他平均數有顯著差異就可以了!
至於那個顯著差異的狀況到底存在於哪些平均數之間?
那就是ANOVA結束後,事後追蹤的事情了(成對檢定)
前面曾談過ANOVA的根據是資料的變異狀況,其來源有二:
- 組間變化(Variance between groups)
組間變異數,組與組之間有系統的差異,可用實驗處理來解釋 - 組內變化(Variance within groups)
組內變異數,是個體間的隨機差異,與實驗處理無關,一定會存在的!
所以ANOVA就是利用樣本的租間與組內的變異數比值來作為拒絕虛無假設的根據
知道原理就好了,公式我就跳過~(想知道的人麻煩WIKI)
反正實際運算時,我想大部分的人都是用SPSS軟體去算啦XD
要進行One way ANOVA前,記得你的樣本是獨立的還是相依的樣本喔!
因為會影響你在SPSS上的操作,前者表示你的樣本值彼此沒有相關與影響,後者相反
例如我們要做不同廣告通路的效果,有web、email與DM,
獨立樣本可能會各找100位受試者,相依樣本則會用同一群100人做而已
最後呢老師提醒大家一些研究上的細節,
- 統計檢定時是否考慮平衡設計?
就是各組觀察值都要相等啦(影響統計力,就是推論的說服性) - ANOVA是有一些假設前提的:
- 常態分配(影響較小)
- 來自母群體的變異數均相等(樣本數有顯著差別,違反變異數同質性檢定時會出錯)
所以要執行ANOVA大概就去找:
- 「比較平均數法」->「單因子變異數分析」(獨立樣本)
- 「一般線性模式」->「單變量」(獨立樣本)
- 「一般線性模式」->「重複量數」(相依樣本)
- 研究假設
- 變異數同質性檢定(獨立樣本) or 球型檢定(相依樣本)
- Post-hoc檢定
- 解釋說明
範例 (獨立樣本) 承接上次的範例,已知公立大學和私立大學圖書館的圖書藏量是有顯著差異的。可是如果只是將大專院校區分為公立和私立,似乎太過於直接或籠統,事實上打從高等教育蓬勃發展之後,公立和私立的區分方式已不若之前顯著,有很多私立大學獲得的資源和對圖書館的經營可能遠高於若干公立大學圖書館,我們就來想想看該怎麼區分大專院校圖書館比較適當。附檔libcollection.sav蒐集國內90多所大學校院圖書館之館藏,請問大學、科技大學、學院、技術學院之間的館藏是否有顯著差異? 根據題意, 設為:大學、科技大學、學院、技術學院在圖書館館藏上沒有顯著差異; 設為:大學、科技大學、學院、技術學院在圖書館館藏上具有顯著差異 首先在Levene檢定的結果中(F = 11.327, p = .000 < .001),顯示四種樣本的變異性具有顯著差異;而ANOVA的結果亦顯示四種學校類型的圖書館館藏量具有顯著差異(F = 6.568, df = 3, p < .001)。故支持:「大學、科技大學、學院、技術學院在圖書館館藏上具有顯著差異」(見下表) 在變異數不同質的情況下,Post-hoc檢定時選擇Games-Howell。透過多重比較後,再重新檢視描述性的統計量,即可發現:大學圖書館的館藏量(49萬冊)明顯高於科技大學(20萬冊, P< .05)、學院(16萬冊, P< .05)、技術學院(14萬冊, P< .01);科技大學圖書館館藏量(20萬冊)也明顯高於技術學院(14萬冊, P< .001) 。 |
「為什麼又跑出一個Post-hoc test?前面都沒講到阿!!」
哈哈就叫做留一手XDD 因為直接跟你講它是什麼,你也會看得霧煞煞...
當我們做完ANOVA,判斷出平均數之間的確存有顯著差異以後
必須透過Post hoc多重比較才可以決定到底是哪些平均數不一樣!!
下圖就是在做剛剛的範例時會操作到的介面,當我們發現平均數的顯著差異以後
通常就會馬上進行Post hoc,但是...「怎麼這麼多東西要勾選呀?」
簡單來說它就是分了兩群,根據Levene的變異數同質性檢定的結果來選
- 變異數同質:勾選「假設相同的變異數」那邊
- 變異數不同質:勾選「為假設變異數同質」那邊
詳情是談不完的,每個都可以去wiki出一篇故事哦
所以老師給我們一些簡單的概念:
- 變異數同質:根據檢定嚴謹程度(Scheffee > Bonferroni > Tukey > LSD)
- 變異數不同質:常用的Tamhanes T2或Games-Howell
但是陽光宅男還是要提醒你,如果碰到研究樣本是相依樣本時
則必須使用Mauchly球型檢定,就稍微翻一下書吧~這裡就不贅述了XDD
再來就試試看更複雜的Two Way ANOVA吧!
二因子變異數分析(two-way ANOVA)
其實大部分的研究都會超過一個自變項...你想想看大部分的現象並不會只有單一因素去決定的,通常是多個因素作用的結果
所以我們這邊再跟大家介紹~二因子變異數分析!
二因子變異數分析是承襲單因子而來,所以其實特性都相同,免驚啦~
在一個實驗研究中,同時操弄兩個自變項(兩個因子),觀察對一個依變項的影響
這種實驗設計就稱作「二因子實驗設計」,分析統計方法就是「二因子變異數分析」
例如以「性別與教學方法對學業成績的影響」為研究主題,探討重點在於:
- 主效果(main effect):瞭解因子與依變項之間是否真有關係存在
- A因子:性別對學業成績的影響
- B因子:教學方法對學業成績的影響 - 單純效果:檢定A因子中某個Level在B因子每一個level之間的效果差異
或是檢定B因子中某個Level在A因子每一個level之間的效果差異
- 如男生(某A)在各種教學方法(所有B)下的學業成績是否有差異 - 交互作用:當A因子的單純效果在B因子的各level有所不同時,
表示存在交互作用,這時候必須進一步檢視「單純效果」!
看過例子應該就搞清楚二因子變異數分析在做什麼了吧!
最後我們在來看一下Two Way ANOVA的流程:
- 判斷樣本
獨立樣本:一般線性模式->單變量
相依樣本:一般線性模式->重複量數 - 檢定過程
獨立樣本:變異數同質性檢定
相依樣本:球型檢定 - 事後成對比較
其實就跟單因子差不多,只是當你發現兩個因子有交互作用時,就必須像範例那樣
一個一個去分析它的單純效果,最後再將結果整理並做出結論!
操作SPSS的部分或每個細節的原因我就無法多做說明啦~
畢竟這只是個課堂心得麻XDD
只是老話一句!希望對ANOVA沒概念或是要複習它的人有所幫助^ ^
20 則留言:
您好,我在搜尋變異數分析的資料時,無意間進入您的部落格,在看了您這篇變異數分析的心得後,讓我對於變異數分析有了較清楚的概念,感謝您,另想請問一下,您提到『寶煖老師告訴我們在設定level時
務必把握magic7的原則』,我想知道magic7的原則到底是什麼,能否請您說明清楚一下,謝謝您的分享!
你好,這裡指的「Magic 7」是一種指我們在設計問卷量表時,經常設定的程度(level)數量。一般來說,我們常看到的是五或七,如非常滿意、滿意、普通、不滿意、非常不滿意等,這就是5 level的量表!當然老師這裡的意思還是要研究者根據自己的研究取向來設計,只是因為超過「七」以後,你大概可以想像一下,填問卷者通常會有所猶豫要怎麼勾吧XD(如:很同意、非常同意、完全同意等)
您好~! 我遇到一個問題,不知您能否幫我解答~
http://tw.knowledge.yahoo.com/question/question?qid=1011041303291
我在奇摩知識家上發問!
基本上我是初學者,有很多不懂的地方,我看到您二因子變異數分析的筆記真的很棒!但我最中的疑惑始終沒解開,是不是混合式二因子設計中,相依樣本水準數要在三個以上呢?我做兩個,那球型檢定的顯著性就是沒跑出來(T_T)
你好,一般來說球型檢定是檢驗相依樣本之間的同質性(兩兩配對相減所得的差的變異數相等)。若是球型檢定不顯著,表示可以接受「球型假設」的結果。假如顯著,就是違反這個假設,則需要用SPSS的epsilon做校正。另外,水準數兩個或三個我倒是沒有試過,你可以多玩玩看(如果你只有兩個,就多複製一份在旁邊當作第三的水準來試試看)
好快就回復了0.0
真的非常感謝您的解答唷!
你好請問一下 因為最近在跑SPSS有點疑問想請教一下
當我再跑兩個因子對於依變項是否有交互作用產生,利用ANOVA結果P值為0.012小於0.05達顯著,但是在近一步繪製交互作用圖的時候發現沒有任何一條線是與其他線段是有交集的 這樣算是正常的嗎?
抱歉這麼久才看到來回覆!當兵期間實在很少時間來維護啦Orz...你談到的兩個自變數是否有交互作用的檢視部份,如果anova的交互部份已經是顯著的話,表示兩者之間會互相影響。通常在圖上會看到你說那種明顯的交集,另外就是即便沒有交集也應該可以看出他們的趨勢,比如說A因子的level變了,B因子就有上揚或下降,表示有所影響,只是沒有到兩者會交叉的程度而已,依然算是有影響=有交互作用。
如果是平行、各走各的,就是沒有交互作用了,那在理論上anova的交互作用P值也應該不會顯著了。
很棒的教學!推
這邊有雙因子變異數的文章教學(SPSS)
單因子變異數的文章教學。
請參考,謝謝。
http://a7654311.pixnet.net/blog/post/47447922
您好!按照您的說明步驟一一看完, 也對變異數分析的概念更加了解, 真的很謝謝您的分享. 另想請教您, 關於變異數分析中的F檢定, 請問該如何解釋F-test的定義, 且清楚區分ANOVA和F-test的不同? 先跟您說聲謝謝.
你好,F檢定的目的是去判斷這些母群體的平均值是否相等(判定我們做的虛無假設),當F值越大時拒絕虛無假設的機率則越高,反之則相反。
而ANOVA分析是指整個測量變異來源,瞭解是否有顯著差異的統計分析方法,可以說是一整套流程,而F檢定則是扮演一個在ANOVA統計推論上重要的決策依據(產出的F值)。
希望有回答到你的問題,如果對F檢定的公式與定義有興趣可以搜尋Wiki或Google︿︿
非常謝謝您的幫忙!!
不好意思, 還有一疑問想請教您: 為何求組間變異和組內變異的比值, 便可以知道平均數是否有差異呢?
你好!因為組間變異與組內變異就是ANOVA分析的著力點,為了推測母體的變異數是否均等,只能從我們得到的樣本估計值去推算,而者兩個獨立的估計值就是主要來源,組內變異數、組內(殘差)變異數。
所以當組間差異夠明顯時(組間變異大於組內差異),就會很容易推翻虛無假設,表示平均數真有差異。
舉例來說,我今天想知道補習組(A)跟沒補習組(B)的課業成績到底有沒有差。我會去計算他們的組間變異(有沒有補習的分數差別會在這個值反映出來)、組內變異(每人會有的正常分差,可能老師給分給得平均,也可能高得給人高低的給很低)
計算完以後,我發現組間差異根本沒多大,A跟B的差異程度,跟原本大家彼此間存在的分數差異程度差不多,那就可以說明補習與否效果是影響不大的。但如果是組間差異明顯,A組平均高於B組15分,而一般平均大家的分差只有3~5分。那是不是很明顯就可以拒絕虛無假設,表示有補習真的有用了!
希望有回答到你的問題。
很謝謝您的用心解說!! ^_^ 有越來越清楚明瞭了
您好,我在搜尋ANOVA交互作用資訊時恰巧進入此部落格,有一個概念想要請問您:在我用SPSS跑混和設計的二因子ANOVA後,發現交互作用不顯著,然而圖形卻有明顯的交叉,請問您是否知道可能的原由呢?唐突發問還請見諒,感謝您的分享!
若二因子分析不同值時
有無方法?
您好
請問「一般線性模式-單變量」與「比較平均數法-單因子變異數分析」是一樣的分析嗎?
您好,謝謝精彩的解析,
不過二因子ANOVA的例子應該是獨立樣本。
畢竟網路搜尋能力強就不會弱,
去圖書館分三組的人也是不重疊的,
應該是下標下錯吧?
老師您好,如果我是用二因子 變異數分析,並且在同質性上達顯著,之後應該用什麼統計跑呢?
您好,很感謝您對變異數分析的解釋喔,讓我收穫不少。想請教一下,我最近想使用二因子混合設計ANOVA來分析資料,但因為有共變數存在,所以可以進行二因子混合設計的共變數分析嗎?有這種分析嗎?
謝謝您喔!
你的表格迴歸那邊寫錯了 迴歸分析是自變數是連續應變數也是連續,如果是自變數連續應變數是類別那是類別分析,主要用於做分類問題
張貼留言