ここでは、「2つの群に差があるか」を検定する代表的な方法である「t検定」をまとめます。
用語: t検定とは / 臨界値 / 片側検定・両側検定 / 自由度(対応のある・ない) / 効果量 / メタ分析
t検定とは、2つの群に差があるかを平均値及び分散と「t分布」を用いて検定する方法です。
(詳細:▼ t分布 )
t検定の帰無仮説は、「2群の母集団の平均が等しい」というものです。
帰無仮説(平均が等しい時)のもとでは、「2つ群の平均差・分散・サンプルサイズから算出される t値」はt分布に従うことがわかっています。
t分布のt値に対応して得られた確率P値が有意水準より小さければ、帰無仮説は棄却され(発生する確率が低いため起こりにくいと判断)、2つの群が等しくない=「2つの群に有意な差がある」ということになります。
t検定には「スチューデントのt検定」だけでなく、「ウェルチのt検定」もあります。
スチューデントのt検定は、比較する2群の分散が等しいこと(=等分散)を前提としますが、そうでない場合に対応したt検定がウェルチの方法です。
臨界値(限界値)とは、有意水準に対応した検定統計量の値です。有意水準と自由度(≒サンプルサイズ)によって変わります(自由度とは自由にとれるデータの数で、サンプルサイズと変数の数で決まる)。
例えば、t検定における、有意水準5%、自由度60の対応する臨界値tは、t=1.671となります。
例)t検定の統計量がt=2.0であり、有意水準5%(0.05)に対する臨界値=1.671だとします。
この時統計量t=2.0は、臨界値1.671より大きいため「有意差がある」となります。
統計量t=2.0に対応したP値の値は、臨界値1.671に対応した有意水準0.05より小さくなっています。
証明する内容(対立仮説)がA群>B群のように明らかに方向性(大小)を持っている場合、帰無仮説はその逆の一方向のみで済みます。この場合を片側検定といいます。
方向性がわからない「差があるか」を検定する場合は、「両側検定」といいます。通常は、「両側検定」を行います。
t検定を行う時に利用する「t分布」は、自由度によって形が違い、臨界値も異なるため、自由度を算出する必要があります。
自由度は、「(データ数N)-1」と覚えておけば、算出できます。
検定対象となる2群には、「対応のない群(独立した群)」と「対応のある群(関連性をもつ群)」があるので、それぞれのパターンのt検定における自由度を下表にまとめます。
対応のない群(独立した群) | |
---|---|
「対応のない群」とは、サンプリングした対象をランダムに分けた2群(グループ)。
それぞれの群のデータ数をAn、Bnとすると 自由度は「(An-1)+(Bn-1)」。 |
例) ランダムにわけた学級A組とB組の人数はそれぞれ30人と32人とする。2組の物理のテスト結果をt検定するときの自由度は、 自由度=(30-1)+(32-1)=60。 |
対応のある群(同一対象者) | |
対応のある群とは、同一の対象者のデータを条件で分けた2群。
対象者の数をNとすると、それぞれの群のデータ数もNとなる。 自由度は、「N-1」。 |
例) 難易度が同じ2つの物理のテストを用意し、室温25度と35度の2つの環境で同一対象者に別のテストを受けてもらう。対象者が30人の時、2つの室温環境での物理のテスト結果をt検定するときの自由度は、 自由度=(30-1)=29。 |
対応のある群(マッチング) | |
何かしらの方法で対(ペア)にした対象を、1つは第1群に、もう1つは第2群に分けたもの。
ペアの数をNとすると、それぞれの群のデータ数もNとなる。 自由度は、「N-1」。 |
例) 数学のテストの点数が高い順番にペアを作り、2群にわけたグループ1と2の人数はそれぞれ30人とする。2グループの物理のテスト結果をt検定するときの自由度は、 自由度=(30-1)=29。 |
t検定に使用されるt値などといった検定統計量とサンプルサイズには下記の関係が成り立っています。
[検定統計量] = [効果の大きさ] * [標本の大きさ(サンプルサイズ)]
サンプルデータの数が多ければ、検定統計量は大きくなりますが、データ数に左右されない[効果の大きさ]のことを「効果量(効果サイズ)」と呼びます。
t検定では効果量は「d」という値で表記します(例:d=0.50)。別途、記載する「相関係数r」も効果量の一つと言えます。
効果量を用いることで、サンプルサイズの異なる複数の研究を比較したり、統合することが可能です。
「メタ分析(メタアナリシス:meta-analysis)」とは、複数の統計的分析のなされた研究結果を集めて統合し、それらを用いて解析を行う方法のことです。
メタ分析において、サンプルサイズ(データ数)に依存しない「効果量(効果サイズ)」が算出され、治療の効果などの評価が行われます。
「効果研究」とは、心理療法やカウンセリングの有効性を評価する研究のことです。メタ分析は、効果研究において用いられる代表的な方法です。
効果研究は、メタ分析が用いられることが多いですが、個人や数名を対象とした事例研究の効果を評価したものもあります。