検定力分析 by 葛西俊治2011

[開始3/4, 更新9/2, 2011]

分散分析 (一元配置) の検定力分析について

葛西俊治

(元・札幌学院大学心理学部臨床心理学科教授)

■ 分散分析(一元配置)の事前の分析

一元配置の分散分析とは、一つの要因があり、その要因に複数のグループ(水準・群)があるとき、各グループ毎の平均値が有意に異なっているかどうかを分析するものです。グループが二つならば「平均値の差のｔ検定」で分析しますが、三つ以上になると、グループを二つずつ取り出してｔ検定していくのでは問題があるため分散分析を用いることになります。(分散分析の多重比較がなぜ必要なのかに関わります)。
　検定力の事前の分析では、必要なデータ数Ｎを調べるために、[有意水準α、効果量ES、検定力(1-β)]の三つの数値を設定する必要があります。ここでは、有意水準αは0.05 (5%)と設定します。検定力Powerは、J.Cohenによる慣例で(1-β)=0.8 と設定します。そうすると、最後に残るのが「効果量 ES: Effect size」となります。
　J.Cohen(1992)では「効果量　小(Small)=0.1、中(Medium)=0.25、大(Large)=0.4」を慣例(convention)として提唱しています。

　 * ここで効果量の式(母集団における効果量)は以下のように示されています。
　
ｆ＝σ_m／σ
ただし、σ_mは母集団での平均値の標準偏差。σはグループに共通の母集団内標準偏差
　
実際のデータを用いて算出する標本効果量の式は次のようになっていて、各水準の平均値が相互に異なっている度合い(水準間平方和)を評価していることが分かります。(G^*Powerソフトが自動的に計算します)
　
f ＝√ [(水準間平方和)／(水準内平方和)]
　

　以下にJ.Cohenによる表を抜粋します。その下にあるのは、G^*Powerソフトで分析したもので、いずれも同じ設定における「必要なデータ数」を示しています。なお、J.Cohenの表では、常に「それぞれのグループの度数」を表示していて、G^*Powerソフトでは、全データ数(Total sample size)となっているので注意してください(参考までに各グループ毎のデータ数も括弧内に表示してあります)。

分散分析ANOVAの検定力分析：必要なデータ数
* J.Cohen (1992)のTable2から抜粋
	α＝0.05、 Power=0.80
Effect size 効果量→	Small	Medium	Large
2 groups	393	64	26
3 groups	322	52	21
4 groups	274	45	18
5 groups	240	39	16
6 groups	215	35	14
7 groups	195	32	13

分散分析に必要なデータ数 Total sample size
G^*Powerソフトによる結果
合計データ数　(各グループのデータ数)
	α＝0.05、 Power=0.80
Effect size 効果量→	Small (0.10)	Medium (0.25)	Large (0.40)
2 groups	786 (393)	126 (63)	52 (26)
3 groups	969 (323)	159 (53)	66 (22)
4 groups	1096 (274)	180 (45)	76 (19)
5 groups	1200 (240)	200 (40)	80 (16)
6 groups	1290 (215)	216 (36)	90 (15)
7 groups	1372 (196)	231 (33)	98 (14)

J.Cohenの必要なデータ数の表とG_*Powerによる分析結果では、度数に±１程度のずれが確認されますが(小数点以下の丸めの誤差)、基本的な結果は同じです。なお、J.Cohenの表はどの分析の場合も「それぞれのグループの度数」が表示されているのに対して、G_*Powerの結果は「Total sample size」であり全データ数が表示されます。
　なお、上に二つの表はいずれも、有意水準α=0.05、検定力Power(1-β)=0.8、効果量 f =010(小)、0.25(中)、0.40(大)、と設定した際に必要なデータ数の表となっています。

　G^*Powerソフトの設定方法を以下に示します。

**■ 一元配置分散分析をG^*Powerで事前分析する。**

グループ(水準)が三つある場合、それぞれの平均値のズレが中程度( f = 0.25 )の場合、各グルーブのデータ数はそれぞれ53、全部で159個のデータが必要と分かりました。ちなみに、検定力を少し下げて Power=0.70に設定してみても、必要なデータ数は三つのグループそれぞれに43、合計で129個が必要ということも算定されます。
　研究の内容上、そこまでデータ数を揃えるのが難しい場合は、効果量がもっと増えるように、水準毎の平均値の差がもう少し多くなり、同時に水準内の分散も小さくなるように、研究の設計を再検討する必要がありそうです。仮に効果量が大( f =0.4)となれば、α=0.05、Power=0.8 であっても、必要なデータ数は３グループがそれぞれ22、全部で66個で間に合うことが計算されるからです。

■ 分散分析(一元配置)の事後の分析 (Post hoc analysis)

一元配置の分散分析とは、一つの要因があり、その要因に複数のグループ(水準・群)があるとき、各グループ毎の平均値が有意に異なっているかどうかを分析するものです (２グループしかないときは平均値の差のt 検定で行い、３グループ以上あるときは一元配置の分散分析を用います)。
　事後の分析は、研究を終えた後に、用いた有意性検定にはどの程度の検定力があり、得られた結果をどの程度強く主張できるかを明確にするために行います。
　
　検定力の事後の分析では、[有意水準α、各グループのデータ数、効果量ES」の三つの数値から「検定力Power (1-β)」の大きさを割り出します。データ数は複数あるグループ毎に同じ場合とそれぞれ異なる場合がありますが、そうした実際の数値(全データ数)を用います。効果量ES (Effect Size)は、帰無仮説と対立仮説とのズレの大きさのことですが、帰無仮説「各グループの平均値はすべて等しい」と対立仮説「各グループの平均は必ずしも等しくない」を対比したときに、各平均値が相互に大きくずれていると「効果量が大」、小さなズレのときは「効果量が小」となります。
　
　分散分析の効果量ES f は、事後の分析の場合、分散分析表に表示されている数値から計算することができます。Ｆ値や(標本)相関比を用いた計算方法などの詳細は豊田秀樹『検定力分析入門』で説明されています。分散分析表に示されている「要因の平方和(水準間平方和)」と「誤差の平方和(水準内平方和)」を用いた式は「事前の分析」でも示しましたが、以下に再掲します。
　　
分散分析の効果量の指標 (Effect size index)： f ＝√ [(水準間平方和)／(水準内平方和)]

　さて、事後分析のためには、以下の三つの数値を設定する必要があります。ここでは、20人かける３グループで実験をしたと想定して以下のように設定してみます。
　有意水準αは0.01 ( 1%)と設定。全データ数(Total sample size)には60を入力 (20人×3グループ)。効果量 ES: Effect size　 f =0.474 としてみます。この効果量 f の数値は、J.Cohen(1992)の提唱する「大(Large)=0.4」を上回る数値です。

*　G^*Powerでは、メイン･ウィンドーの「全データ数 Total sample size」の数値を指定したグループ数で分割する際、「各グループのデータ数が均等」として計算を行っているようです。

ここで、効果量の算出用の計算パネルを表示して計算をしてみます。
効果量の計算には以下の二つの入力方法が用意されています。
　
- 「各グループのデータ数」「各グループの平均値」「SD σ within each group (それぞれのグループ内の標準偏差)」を入力する方法
- 分散分析表から「要因の平方和」「残差の平方和」を入力する方法
ここでは、分散分析表にある「要因の平方和」「残差の平方和」を用いる方法にしてみます。
　

* 平方和は豊田秀樹『検定力分析入門』にある数値を用いてみました。

Partial η²　は「偏相関比」ですが、一要因の場合は「相関比」として扱います。
過去の論文などで分散分析表が載っていればこの計算パネルを用いて効果量を算出して検定力を求めることができます。なお、表示がＦ値の場合は以下の式を用いて計算できます。

f ＝√ [ Ｆ値×(水準間自由度／水準内自由度) ]

■ 事後の検定力分析を「分散分析表」を用いて行う

(8/29,2011追加)

　分散分析表の数値を用いた場合の「事後の検定力分析」について実際のデータを用いてまとめておくことにします。(一要因分散分析と、後で示す二要因分散分析のどちらも同じデータを用いて例示します。)
　　ここでは例えば「要因Ａ：年代1,2,3,4,5」と｢要因Ｂ：地域1,2,3」で不安耐性について調べたとします。不安耐性の平均値が五つの年代のグループ（5水準、自由度df=(5-1)=4）と、三つの地域のグループ（3水準、自由度df=(3-1)=2）の要因によって異なるのかどうか、ということがこの「２要因分散分析」の目的となりますが、それに先だって、以下に一要因の分散分析表からG^*Powerによって検定力を求める場合について解説します。

一要因の分散分析の場合

このデータのうちの要因Ｂを無視して、要因Ａの「５つの年代」についてのデータとみなして「一要因分散分析」を行ってみます。得られた分散分析表を用いて「事後の検定力分析」を行います。
要因Ａは「５個のグループ」があり、全データ数は90個。各グループにはそれぞれ18個のデータがあります。

[ダミーデータ] (EXCElファイル)
　

　G^*Powerを起動して、次のようにメニューから選択します。
　
[F tests]　 [ANOVA: Fixed effects, omnibus, one-way ]
[Post hoc: Comute achived power - given α, sample size, and effect size] を選択します。

番号①で示したように「α err prob(有意水準)」を0.05 (5%)とし、[Total sample size]を「90」とし、[Number of groups] を「5」(「年代別」要因Ａのグループ数)と入力します。　

[G*Powerの画面]

次に番号②で示した[Determine＝＞] をクリックして、「効果量計算パネル」を表示させます。

　　　[効果量計算パネル]

分散分析表の数値を利用するので、[Effect size from variance] (効果量を分散から求める)を選択。"variance"となっていますが、ここに分散分析表から「平方和」の数値を入力します。③

[要因Ａ(年代)の分散分析表]

Variance explained by special effect:[ 14.267 ] グループ間の平方和を入力。
Variance within groups: [ 58.722 ] グループ内平方和を入力します。
　
　
④[Calculate]をクリック。効果量「Effect size : f」は 0.4929081 となりました。
　これと同時に、Partial η² も自動的に計算されて表示されています。(式は下にあります)
⑤この結果をメインのG*Powerパネル(上に表示)の「効果量」の欄に転送します。⑥

　ここでメインの画面にもどります。
⑦G*Powerパネル右下の[Calculate]をクリック。
求める「事後の検定力」Power (1-βerr prob)が 0.9692927 と出ました。
J.Cohenは検定力の目安を 0.8 としていますが、それを上回る非常に大きな検定力があることが分かりました。
　
　
グループ間平方和は、５個のグループにおける「不安耐性」の平均値がそれぞれ異なっていると大きく、平均値が似通った数値だと小さくなります。小さい場合は、要因Ａ「年代」が「不安耐性」にはあまり関係ないことになります。
　また、グループ内平方和は、５個のグループに属す18個の数値がそれぞれの平均値の周りに集まっていると小さく、その反対に数値がばらついているとグループ内平方和は大きくなります。バラツキが大きいと、「年代」というグループの中で数値がまとまっていないことになります。この点は、一要因でも２要因の場合でも同じ意味合いとなります。
　
なお、Ｆ値= 5.163 = 3.567 ／ 0.691 ですが、3.567= 14.267/ 4 (グループ間平方和を自由度4で割る)であり、 0.691= 58.722/ 85 (グルー内平方和を自由度85で割る) によって算出します。
一元配置の分散分析における効果量f はすでに示したように、以下の式で計算されます。

・効果量　f = √ (グループ間平方和 / グループ内平方和) = √ (14.267 / 58.722) = 0.4929081

・(偏)相関比の二乗は Partial η² = (グループ間平方和 / 全体平方和) = 0.1954678

これを用いると効果量 f = √(η₂ / ( 1 - η²) ) = 0.4929081 と一致します。

■効果量をＦ値から求める

(9/2, 2011)

分散分析表の平方和から検定力を求める方法は上に示しました。しかし、論文などでは分散分析表がそのまま示されているとは限らず、多くの場合はたとえばＦ(4, 85)= 5.163 のように示されます (上にある要因Ａ(年代)の分散分析表より)。ところで、Ｆ値とは次の計算式で得られる数値です。すなわち、

Ｆ(要因の自由度、誤差の自由度) = 「水準間平方和÷その自由度」／「水準内平方和÷その自由度」

ということなので、これを用いて次の効果量の式を見直してみます。
　
分散分析の効果量の指標 (Effect size index)： f ＝√ [(水準間平方和)／(水準内平方和)]

　すると、

効果量　f = √ (群間自由度 / 群内自由度 × Ｆ値 )

効果量　f = √ (水準間自由度 / 水準内自由度 × Ｆ値 )

効果量　f = √ (グループ間自由度 / グループ内自由度 × Ｆ値 )

効果量　f = √ (要因の自由度 / 誤差の自由度 × Ｆ値 )

となります。４つの式はすべて同じことを表していますが、研究者や本などによってこのように表記が異なることがあるので書いておきます。いずれにしても、分散分析の事後の効果量を分散分析表を用いて計算できることが分かります。
たとえば、論文などにＦ(4, 85)= 5.163 などのように表記されていたら、　
効果量　f = √ (4 / 85 × 5.163 ) = 0.4929144
と計算して効果量を知ることができます。こちらの方が実際的ですね。

* 上に示した「グループ間平方和 14.267」と「グループ内平方和 58.722」をG^*Powerに入力した場合の効果量 f= 0.4929081 とは計算誤差がありますが、効果量 f = 0.4929 と小数第４桁まで一致しています。

　ということで、論文にＦ値が出ていたら、これから効果量を計算してその数値を検定力分析ソフト G^*Powerに入力すると検定力が割り出せます。ところで、豊田『検定力分析入門』2009には分散分析を用いた研究について、事後の検定力分析を行っていますが、この検算のために毎回電卓のキーをたたいて計算するのが面倒になりました。ということで、分散分析表のＦ値から効果量を計算する簡単な電卓をプログラムしてみましたので紹介いたします。

　　分散分析の効果量計算電卓

　　　　

「一元配置」を選び、群間自由度 4、群内自由度 197、Ｆ値 10.37を入力して「計算実行」すると、相関比η²と効果量 f = 0.458864 が表示されます。
なお、相関比は η² の平方根なので、 √ (0.1739349) = 0.417055 となります。

* 「一元配置」とは「一要因分散分析」、「多元配置」とは「多要因分散分析」のことです。計算式が異なりますが、この効果量電卓で計算できます。

分散分析 (一元配置) の検定力分析について

■ 分散分析(一元配置)の事前の分析

■ 一元配置分散分析をG*Powerで事前分析する。

■ 分散分析(一元配置)の事後の分析 (Post hoc analysis)

■ 事後の検定力分析を「分散分析表」を用いて行う

■効果量をＦ値から求める

**■ 一元配置分散分析をG^*Powerで事前分析する。**