2010年10月30日 星期六

[課堂心得]量化研究與統計分析-變異數分析(ANalysis Of VAriance, ANOVA)

T-shirt
圖片取自:Zazzle(網拍)
竟然會有人想把ANOVA印到衣服上~~~實在中毒太深了XDD
由於論文的關係,讓這組課堂心得停擺了一年(金拍謝^^)
這次呢~從最常見的ANOVA來跟大家見面!!



如果還記得之前談的卡方T 檢定的特性的話,
要記住現在這個ANOVA就容易了,不過我猜這種事是不太可能的(大笑)
所以就沿用了寶煖老師整理的的表格供大家參考~

自變數 依變數 統計分析方法
類別 類別 交叉表(卡方)
類別 連續 T-test:1~2個樣本
ANOVA:2個以上樣本
連續 連續 相關分析
連續 類別 迴歸分析


所以這裡我們可以建立一個簡單的概念:
ANOVA是用來檢定平均數之間是否有顯著差異(significant differences)



如同表格所示,如果我們的樣本只比較兩組平均數
那不管你用ANOVA的結果和獨立樣本(比較兩個不同群體)
或成對樣本(比較一組觀察值的兩個變數)T檢定是一樣的喔!!


換句話說,只要超過兩個以上的獨立樣本要比較其間的平均數差異時
就必須要利用1923年Fisher所創用的ANOVA了!!



明明就是比較平均數,為啥要叫作什麼變異數分析勒?
因為呢,我們實際在檢定平均數的統計顯著性時
其實是在關心那些變異數(variances)的部分,
就是計算全體樣本在依變數的分數變異情形,
並著重在兩個項目去計算「組內差異(自變項變異)」與「組間差異(誤差變異)」



恩~到這裡,我們稍微建立一下簡單的概念,我們常常會對ANOVA有些恐懼,
像是什麼總是搞不懂單因子、雙因子之類的,一冒出來總是想一下它指得是什麼 ?
回到上面那張圖一下,ANOVA的自變項是類別變項,而這個自變項就是「因子」 
因子包括的可能數值 就是水準(level),如因子=性別, 2 level = male or female


所以阿~是有所謂的ANOVA家族的!
當研究的是一個自變項(記得是類別變項喔!)對依變項平均數的影響時
不管該因子內有多少水準,所進行的就是單因子變異數分析(One Way ANOVA)
若是同時考慮兩個自變項時,就是二因子變異數分析(Two Way ANOVA);
若是同時考慮多個自變項時,就是多因子變異數分析(Factorial Analysis of ANOVA)
另外還有一些更複雜的情況...
當研究者意欲控制某連續變項時,去除第三變項的混淆效果
以瞭解自變項對某特定連續變項的效果時,叫做共變分析(ANCOVA, Analysis of Covariance)
以及當依變項數目增加時的多變量變異數分析(Multivariance analysis of variance)



不過,這邊主要還是給大家一個概念去思考這些分析的意義
因為這些家族的出發點都還是以ANOVA的核心概念去延伸自變項、依變項而已
以下我們會以最常見的單因子與二因子ANOVA來解釋與舉例之~


單因子變異數分析(one-way ANOVA)

就是指只有一個自變項的變異數分析,如
  • 製作甜甜圈時使用不同的食用油是否會影響甜甜圈的油脂吸收
    類別不飽和油脂= 花生油、葵花油;飽和油脂=豬油
    連續:油脂吸收量
  • 不同領域的學生對資訊素養目標的看法
    類別:人文、社會、自然、工程、醫學(5 level)

    連續:資訊素養目標(用問卷量尺)
看了上面的例子應該很快就能進入狀況,寶煖老師告訴我們在設定level時
務必把握magic7的原則,不要太多,太多就適度的合併吧!



再來就是研究假設,變異數分析所檢驗的虛無假設是:
所有樣本所來自之母群體之平均數都相等,

  • 虛無假設(H0):u1 = u2 = u3 =……= uk
  • 對立假設u1、u2、u3、……、uk至少有一個不等


只要拒絕虛無假設,則表示對立假設可以成立
所以只要至少有一個平均數是和其他平均數有顯著差異就可以了!
至於那個顯著差異的狀況到底存在於哪些平均數之間?
那就是ANOVA結束後,事後追蹤的事情了(成對檢定



前面曾談過ANOVA的根據是資料的變異狀況,其來源有二:
  • 組間變化(Variance between groups)
    組間變異數,組與組之間有系統的差異,可用實驗處理來解釋
  • 組內變化(Variance within groups)
    組內變異數,是個體間的隨機差異,與實驗處理無關,一定會存在的!
相較於組內變異數,如果組間變異數越大時,拒絕虛無假設的機率也就越高~
所以ANOVA就是利用樣本的租間與組內的變異數比值來作為拒絕虛無假設的根據



知道原理就好了,公式我就跳過~(想知道的人麻煩WIKI)
反正實際運算時,我想大部分的人都是用SPSS軟體去算啦XD



要進行One way ANOVA前,記得你的樣本是獨立的還是相依的樣本喔!
因為會影響你在SPSS上的操作,前者表示你的樣本值彼此沒有相關與影響,後者相反
例如我們要做不同廣告通路的效果,有web、email與DM,
獨立樣本可能會各找100位受試者,相依樣本則會用同一群100人做而已

最後呢老師提醒大家一些研究上的細節,
  1. 統計檢定時是否考慮平衡設計?
    就是各組觀察值都要相等啦(影響統計力,就是推論的說服性)
  2. ANOVA是有一些假設前提的:
    - 常態分配(影響較小)
    - 來自母群體的變異數均相等(樣本數有顯著差別,違反變異數同質性檢定時會出錯)
那我們還是趕緊來看一下範例吧! 因為每個版本的SPSS有些許出入
所以要執行ANOVA大概就去找:

  • 「比較平均數法」->「單因子變異數分析」(獨立樣本)
  • 「一般線性模式」->「單變量」(獨立樣本)
  • 「一般線性模式」->「重複量數」(相依樣本)
一般來說,ANOVA檢定的程序不外乎:
  1. 研究假設
  2. 變異數同質性檢定(獨立樣本) or 球型檢定(相依樣本)
  3. Post-hoc檢定
  4. 解釋說明

範例 (獨立樣本)


承接上次的範例,已知公立大學和私立大學圖書館的圖書藏量是有顯著差異的。可是如果只是將大專院校區分為公立和私立,似乎太過於直接或籠統,事實上打從高等教育蓬勃發展之後,公立和私立的區分方式已不若之前顯著,有很多私立大學獲得的資源和對圖書館的經營可能遠高於若干公立大學圖書館,我們就來想想看該怎麼區分大專院校圖書館比較適當。附檔libcollection.sav蒐集國內90多所大學校院圖書館之館藏,請問大學、科技大學、學院、技術學院之間的館藏是否有顯著差異

根據題意,
clip_image002為:大學、科技大學、學院、技術學院在圖書館館藏上沒有顯著差異;
clip_image004為:大學、科技大學、學院、技術學院在圖書館館藏上具有顯著差異
首先在Levene檢定的結果中(F = 11.327, p = .000 < .001),顯示四種樣本的變異性具有顯著差異;而ANOVA的結果亦顯示四種學校類型的圖書館館藏量具有顯著差異(F = 6.568, df = 3, p < .001)。故支持clip_image004[1]:「大學、科技大學、學院、技術學院在圖書館館藏上具有顯著差異」(見下表)
image

在變異數不同質的情況下,Post-hoc檢定時選擇Games-Howell。透過多重比較後,再重新檢視描述性的統計量,即可發現:大學圖書館的館藏量(49萬冊)明顯高於科技大學(20萬冊, P< .05)、學院(16萬冊, P< .05)、技術學院(14萬冊, P< .01);科技大學圖書館館藏量(20萬冊)也明顯高於技術學院(14萬冊, P< .001) 。



為什麼又跑出一個Post-hoc test?前面都沒講到阿!!
哈哈就叫做留一手XDD 因為直接跟你講它是什麼,你也會看得霧煞煞...
當我們做完ANOVA,判斷出平均數之間的確存有顯著差異以後
必須透過Post hoc多重比較才可以決定到底是哪些平均數不一樣!!



下圖就是在做剛剛的範例時會操作到的介面,當我們發現平均數的顯著差異以後
通常就會馬上進行Post hoc,但是...「怎麼這麼多東西要勾選呀?」


image
簡單來說它就是分了兩群,根據Levene的變異數同質性檢定的結果來選
  • 變異數同質:勾選「假設相同的變異數」那邊
  • 變異數不同質:勾選「為假設變異數同質」那邊
哦~這樣就看懂了吧!至於要選哪些檢定麻…
詳情是談不完的,每個都可以去wiki出一篇故事哦
所以老師給我們一些簡單的概念:

  • 變異數同質:根據檢定嚴謹程度(Scheffee > Bonferroni > Tukey > LSD)
  • 變異數不同質:常用的Tamhanes T2或Games-Howell
故事講得差不多啦,這樣下次出現One Way ANOVA應該嚇不倒你吧
但是陽光宅男還是要提醒你,如果碰到研究樣本是相依樣本時
則必須使用Mauchly球型檢定,就稍微翻一下書吧~這裡就不贅述了XDD
再來就試試看更複雜的Two Way ANOVA吧!

二因子變異數分析(two-way ANOVA)

其實大部分的研究都會超過一個自變項...你想想看
大部分的現象並不會只有單一因素去決定的,通常是多個因素作用的結果


所以我們這邊再跟大家介紹~二因子變異數分析!

二因子變異數分析是承襲單因子而來,所以其實特性都相同,免驚啦~
在一個實驗研究中,同時操弄兩個自變項(兩個因子),觀察對一個依變項的影響
這種實驗設計就稱作「二因子實驗設計」,分析統計方法就是「二因子變異數分析」



例如以「性別教學方法學業成績的影響」為研究主題,探討重點在於:
  • 主效果(main effect):瞭解因子與依變項之間是否真有關係存在
    - A因子:性別對學業成績的影響
    - B因子:教學方法對學業成績的影響
  • 單純效果:檢定A因子中某個Level在B因子每一個level之間的效果差異
    或是檢定B因子中某個Level在A因子每一個level之間的效果差異
    - 如男生(某A)在各種教學方法(所有B)下的學業成績是否有差異
  • 交互作用:當A因子的單純效果在B因子的各level有所不同時,
    表示存在交互作用,這時候必須進一步檢視「單純效果」!
這樣可能還是不夠具體,所以我們來看一個有交互作用的範例吧~仔細注意敘述喔
範例 (相依樣本)


一大學圖書館網站改版,希望了解學生利用館藏目錄查找館藏的利用率,設計測試書目清單,請受試同學利用館藏目錄查找清單中之書目資訊。由於館藏目錄的利用能力會受到學生利用圖書館的能力網路搜尋能力的影響,所以同時設計問項測試學生之圖書館利用能力和網路利用能力,將受試同學依其圖書館利用能力和網路利用能力加以分組。圖書館利用能力分為三組:第一組通常到圖書館K書,第二組的學生通常到圖書館來借還書和翻閱期刊,第三組同學會利用資料庫查找資訊。網路利用能力分為佳與劣兩組,以會不會以布林邏輯組合關鍵詞組為判準。資料集:webpac
根據題意使用SPSS進行Two Way ANOVA,分析兩組自變項「使用圖書館能力」、「網路搜尋能力」對依變項「館藏目錄使用能力」的影響。
首先,Levene變異數同質性檢定顯示依變項「館藏目錄的使用能力」的誤差變異量未達顯著差異,F = 1.063, p = .387;因此接受「館藏使用能力」的誤差變異量是相等的。
image
接著在組間效果的檢定中,上表顯示「internet(網路搜尋能力)」與「library(圖書館使用能力)」兩項主效果與交互作用(internet*library)效果都達顯著水準。換言之,網路搜尋能力對館藏目錄使用有顯著差異,圖書館使用能力對館藏目錄使用能力也有顯著差異,且此兩者的交互作用效果對館藏目錄使用能力亦有顯著差異。
  • 網路搜尋能力主效果: F (1, 84) = 48.480, p = .000
  • 圖書館使用能力主效果: F (2, 84) = 80.853, p = .000
  • 網路搜尋能力 * 圖書館使用能力:F (2, 84) = 7.159, p = .001
然而,交互作用效果達顯著水準,分析主效果失去意義,因此進行「單純主效果」檢定,分析在何種情況下學生的館藏目錄使用能力會上升或下降。
這一階段開始進行單純主效果的分析與討論,故將兩個自變項分解為下A、B兩組:
A:網路搜尋能力(2 Levels)
  • 水準1:劣
  • 水準2:佳
B:圖書館使用能力(3 Levels)
  • 水準1:K書為主
  • 水準2:借書翻期刊
  • 水準3:用資料庫
首先是「網路搜尋能力(A)的單純主效果


網路搜尋能力 = 劣
image
先利用平均數圖觀察出(如上圖,只放一個,太佔篇幅以下省略XD),在學生的搜尋能力不佳時,圖書館的使用程度越高,則館藏目錄(OPAC)的使用成果也會越好;變異數分析方面,組間效果達顯著,F (2, 42) =74.072, p = .000。換言之,在學生的搜尋能力不佳時,圖書館使用程度會影響OPAC使用成果,因此需要再進一步檢視事後成對比較;變異數同質性檢定方面,未達顯著水準(p = .235 > .05),表示在搜尋能力不佳的學生中,三種程度的圖書館使用能力間沒有明顯離散,三組變異數同質。Post Hoc檢定的部分,由於變異數同質性檢定的結果不顯著(假設相同的變異數)故採用Bonferroni法進行多重比較,結果顯示三組之間都達到顯著水準。換言之,在學生的搜尋能力不佳時,會「用資料庫」的學生(m = 82.27, sd = 2.052)其OPAC使用成果明顯高於「借書翻期刊」的學生(m = 77.47, sd = 2.326, p = .000)以及「K書為主」的學生(m = 73.00, sd = 1.852, p = .000)。而「借書翻期刊」的學生也明顯高於「K書為主」的學生(p = .000)。


網路搜尋能力= 佳


同樣利用平均數圖看出,在學生的搜尋能力佳時,圖書館的使用程度越高,則館藏目錄(OPAC)的使用成果也會越好;變異數分析方面,組間效果達顯著,F (2, 42) =23.054, p = .000。換言之,在學生的搜尋能力佳時,圖書館使用程度會影響OPAC使用成果,因此需要再進一步檢視事後成對比較;變異數同質性檢定方面,未達顯著水準(p = .435 > .05),表示在搜尋能力佳的學生中,三種程度的圖書館使用能力間沒有明顯離散,三組變異數同質。Post Hoc檢定的部分,由於變異數同質性檢定的結果不顯著(假設相同的變異數)故採用Bonferroni法進行多重比較,結果顯示有兩組達到顯著水準。換言之,在學生的搜尋能力佳時,會「用資料庫」的學生(m = 83.07, sd = 2.840)其OPAC使用成果明顯高於「K書為主」的學生(m = 77.40, sd = 1.993, p = .000)。而「借書翻期刊」的學生(m = 82.40, sd = 2.586)也明顯高於「K書為主」的學生(p = .000)。
因此,在網路搜尋能力(A)的單純主效果的結果為
網路搜尋能力「劣」(clip_image002[3]= 74.072, p = .000)
  • 用資料庫 > 借書翻期刊
  • 用資料庫 > K書為主
  • 借書翻期刊 > K書為主
網路搜尋能力「佳」(clip_image002[4]= 23.054, p = .000)
  • 用資料庫 > K書為主
  • 借書翻期刊 > K書為主

再來是「圖書館使用能力(B)的單純主效果」!


圖書館使用能力= K書為主


平均數圖明確看出,在學生的圖書館使用率為K書為主時,隨著網路搜尋能力越高,則館藏目錄(OPAC)的使用成果也會越好;變異數分析方面,組間效果達顯著,F (1, 28) =39.243, p = .000。換言之,在學生的圖書館使用率為K書為主時,網路搜尋能力優劣與OPAC使用成果會有顯著差異;因此我們從檢視平均數中則可以得知,網路搜尋能力較佳的K書為主學生們(m = 77.40, sd = 1.993),其OPAC使用成果比網路搜尋能力劣者(m = 73.00, sd = 1.852)還要高。


圖書館使用能力=借書翻期刊


平均數圖明確看出,在學生的圖書館使用率為借書翻期刊時,隨著網路搜尋能力越高,則館藏目錄(OPAC)的使用成果也會越好;變異數分析方面,組間效果達顯著,F (1, 28) =30.183, p = .000。換言之,在學生的圖書館使用率為借書翻期刊時,網路搜尋能力優劣與OPAC使用成果會有顯著差異;因此我們從檢視平均數中則可以得知,網路搜尋能力較佳的借書翻期刊學生們(m = 82.40, sd = 2.586),其OPAC使用成果比網路搜尋能力劣者(m = 77.47, sd = 2.326)還要高。


圖書館使用能力=用資料庫

平均數圖明確看出,在學生的圖書館使用率為用資料庫時,隨著網路搜尋能力越高,則館藏目錄(OPAC)的使用成果也會越好;變異數分析方面,組間效果達顯著,F (1, 28) = .782, p = .384 > .05。換言之,在學生的圖書館使用率為用資料庫時,網路搜尋能力優劣與OPAC使用成果並沒有顯著差異。


因此,在圖書館使用能力(B)的單純主效果的結果為



圖書館使用能力「K書為主」

  • 網路搜尋能力「佳」 > 網路搜尋能力「劣」(clip_image002[7]= 39.243, p = .000)
圖書館使用能力「借書翻期刊」

  • 網路搜尋能力「佳」 > 網路搜尋能力「劣」(clip_image002[8]= 30.183, p = .000)
圖書館使用能力「用資料庫」

  • 網路搜尋能力「佳」 > 網路搜尋能力「劣」(ns)

結論


總結來說,經由二因子變異數分析可得知,學生的網路搜尋能力優劣對於館藏目錄的使用成果上有顯著差異(F (1, 84) = 48.480, p = .000),圖書館使用率對其館藏目錄的使用成果上有顯著差異(F (2, 84) = 80.853, p = .000),而且網路搜尋能力與圖書館使用率的交互作用效果對館藏目錄的使用成果亦有顯著差異(F (2, 84) = 7.159, p = .001)。


進一步利用單因子變異數分析檢定網路搜尋能力與圖書館使用率的單純主效果,結果發現網路搜尋能力與圖書館使用率的交互作用效果,在不同因子水準下有所不同。網路搜尋能力「劣」的學生,其圖書館使用率不同,館藏目錄的使用成果上也有顯著差異(F (2, 42) =74.072, p = .000);會「用資料庫」的學生(m = 82.27, sd = 2.052)其OPAC使用成果明顯高於「借書翻期刊」的學生(m = 77.47, sd = 2.326, p = .000)以及「K書為主」的學生(m = 73.00, sd = 1.852, p = .000)。而「借書翻期刊」的學生也明顯高於「K書為主」的學生(p = .000)。網路搜尋能力「佳」的學生,依其圖書館使用率不同,館藏目錄的使用成果上也有顯著差異(F (2, 42) =23.054, p = .000);會「用資料庫」的學生(m = 83.07, sd = 2.840)其OPAC使用成果明顯高於「K書為主」的學生(m = 77.40, sd = 1.993, p = .000)。而「借書翻期刊」的學生(m = 82.40, sd = 2.586)也明顯高於「K書為主」的學生(p = .000)。


另外圖書館使用率程度對館藏目錄使用成果的影響對「用資料庫」的學生沒有顯著差異,換句話說會用資料庫的學生在網路搜尋能力上優或劣對於館藏目錄使用成果上沒有發揮效果。不過當學生的圖書館使用率是「借書翻期刊」時,網路搜尋能力較佳的學生們OPAC使用成果比網路搜尋能力劣者明顯還要高(F (1, 28) =30.183, p = .000);當學生的圖書館使用率是「K書為主」時,網路搜尋能力較佳的學生們OPAC使用成果也是比網路搜尋能力劣者明顯較高(F (1, 28) =39.243, p = .000)。因此網路搜尋能力對圖書館使用率為「K書為主」、「借書翻期刊」的學生來說,在館藏目錄上的使用的確有幫助,但是對於「用資料庫」的學生來說,則是沒有明顯差別。
image








看過例子應該就搞清楚二因子變異數分析在做什麼了吧!
最後我們在來看一下Two Way ANOVA的流程

  1. 判斷樣本
    獨立樣本:一般線性模式->單變量
    相依樣本:一般線性模式->重複量數
  2. 檢定過程
    獨立樣本:變異數同質性檢定
    相依樣本:球型檢定
  3. 事後成對比較

其實就跟單因子差不多,只是當你發現兩個因子有交互作用時,就必須像範例那樣
一個一個去分析它的單純效果,最後再將結果整理並做出結論!


操作SPSS的部分或每個細節的原因我就無法多做說明啦~
畢竟這只是個課堂心得麻XDD
只是老話一句!希望對ANOVA沒概念或是要複習它的人有所幫助^ ^

14 則留言:

sophoia 提到...

您好,我在搜尋變異數分析的資料時,無意間進入您的部落格,在看了您這篇變異數分析的心得後,讓我對於變異數分析有了較清楚的概念,感謝您,另想請問一下,您提到『寶煖老師告訴我們在設定level時
務必把握magic7的原則』,我想知道magic7的原則到底是什麼,能否請您說明清楚一下,謝謝您的分享!

qheroq 提到...

你好,這裡指的「Magic 7」是一種指我們在設計問卷量表時,經常設定的程度(level)數量。一般來說,我們常看到的是五或七,如非常滿意、滿意、普通、不滿意、非常不滿意等,這就是5 level的量表!當然老師這裡的意思還是要研究者根據自己的研究取向來設計,只是因為超過「七」以後,你大概可以想像一下,填問卷者通常會有所猶豫要怎麼勾吧XD(如:很同意、非常同意、完全同意等)

您好! 提到...

您好~! 我遇到一個問題,不知您能否幫我解答~
http://tw.knowledge.yahoo.com/question/question?qid=1011041303291
我在奇摩知識家上發問!
基本上我是初學者,有很多不懂的地方,我看到您二因子變異數分析的筆記真的很棒!但我最中的疑惑始終沒解開,是不是混合式二因子設計中,相依樣本水準數要在三個以上呢?我做兩個,那球型檢定的顯著性就是沒跑出來(T_T)

qheroq 提到...

你好,一般來說球型檢定是檢驗相依樣本之間的同質性(兩兩配對相減所得的差的變異數相等)。若是球型檢定不顯著,表示可以接受「球型假設」的結果。假如顯著,就是違反這個假設,則需要用SPSS的epsilon做校正。另外,水準數兩個或三個我倒是沒有試過,你可以多玩玩看(如果你只有兩個,就多複製一份在旁邊當作第三的水準來試試看)

您好! 提到...

好快就回復了0.0
真的非常感謝您的解答唷!

匿名 提到...

你好請問一下 因為最近在跑SPSS有點疑問想請教一下
當我再跑兩個因子對於依變項是否有交互作用產生,利用ANOVA結果P值為0.012小於0.05達顯著,但是在近一步繪製交互作用圖的時候發現沒有任何一條線是與其他線段是有交集的 這樣算是正常的嗎?

qheroq 提到...

抱歉這麼久才看到來回覆!當兵期間實在很少時間來維護啦Orz...你談到的兩個自變數是否有交互作用的檢視部份,如果anova的交互部份已經是顯著的話,表示兩者之間會互相影響。通常在圖上會看到你說那種明顯的交集,另外就是即便沒有交集也應該可以看出他們的趨勢,比如說A因子的level變了,B因子就有上揚或下降,表示有所影響,只是沒有到兩者會交叉的程度而已,依然算是有影響=有交互作用。

如果是平行、各走各的,就是沒有交互作用了,那在理論上anova的交互作用P值也應該不會顯著了。

Unknown 提到...

很棒的教學!推
這邊有雙因子變異數的文章教學(SPSS)
單因子變異數的文章教學。
請參考,謝謝。
http://a7654311.pixnet.net/blog/post/47447922

匿名 提到...

您好!按照您的說明步驟一一看完, 也對變異數分析的概念更加了解, 真的很謝謝您的分享. 另想請教您, 關於變異數分析中的F檢定, 請問該如何解釋F-test的定義, 且清楚區分ANOVA和F-test的不同? 先跟您說聲謝謝.

Ken Hsieh 提到...

你好,F檢定的目的是去判斷這些母群體的平均值是否相等(判定我們做的虛無假設),當F值越大時拒絕虛無假設的機率則越高,反之則相反。
而ANOVA分析是指整個測量變異來源,瞭解是否有顯著差異的統計分析方法,可以說是一整套流程,而F檢定則是扮演一個在ANOVA統計推論上重要的決策依據(產出的F值)。
希望有回答到你的問題,如果對F檢定的公式與定義有興趣可以搜尋Wiki或Google︿︿

匿名 提到...

非常謝謝您的幫忙!!
不好意思, 還有一疑問想請教您: 為何求組間變異和組內變異的比值, 便可以知道平均數是否有差異呢?

Ken Hsieh 提到...

你好!因為組間變異與組內變異就是ANOVA分析的著力點,為了推測母體的變異數是否均等,只能從我們得到的樣本估計值去推算,而者兩個獨立的估計值就是主要來源,組內變異數、組內(殘差)變異數。

所以當組間差異夠明顯時(組間變異大於組內差異),就會很容易推翻虛無假設,表示平均數真有差異。

舉例來說,我今天想知道補習組(A)跟沒補習組(B)的課業成績到底有沒有差。我會去計算他們的組間變異(有沒有補習的分數差別會在這個值反映出來)、組內變異(每人會有的正常分差,可能老師給分給得平均,也可能高得給人高低的給很低)

計算完以後,我發現組間差異根本沒多大,A跟B的差異程度,跟原本大家彼此間存在的分數差異程度差不多,那就可以說明補習與否效果是影響不大的。但如果是組間差異明顯,A組平均高於B組15分,而一般平均大家的分差只有3~5分。那是不是很明顯就可以拒絕虛無假設,表示有補習真的有用了!

希望有回答到你的問題。

匿名 提到...

很謝謝您的用心解說!! ^_^ 有越來越清楚明瞭了

Jinni 提到...

您好,我在搜尋ANOVA交互作用資訊時恰巧進入此部落格,有一個概念想要請問您:在我用SPSS跑混和設計的二因子ANOVA後,發現交互作用不顯著,然而圖形卻有明顯的交叉,請問您是否知道可能的原由呢?唐突發問還請見諒,感謝您的分享!