Rは統計検定を行うことのできる強力なツールですが、統計検定はデータの種類や目的に応じて適切なものを選ぶことが重要です。
この記事では、論文でよく見かける単変量解析の手法をデータの特徴から選ぶ方法について紹介します。
データの特徴
検定の種類
統計検定には大きく分けて差を調べる検定と関連性を調べる検定があります。
- 差を調べる検定:例えば、t検定やANOVA(分散分析)など。
- 関連性を調べる検定:例えば、相関分析や回帰分析など。
対応の有無
データが対応(ペア)か非対応(独立)かを確認します。
例えば、同じ被験者の前後比較なら対応、異なる被験者群なら非対応です。
データの尺度
データの尺度には次の4種類があります。それぞれに適した検定が存在します。
- 名義尺度:カテゴリデータ(例:性別、血液型)
- 順序尺度:順序があるデータ(例:アンケートの満足度)
- 間隔尺度:等間隔の数値データ(例:温度)
- 比例尺度:絶対的なゼロ点がある数値データ(例:身長、体重)
母集団分布
検定には、データの母集団が正規分布に従うことを仮定したものと、そうでないものがあります。
データのヒストグラムを描いて視覚的に判断する方法や、正規性の検定によって判断する方法があります。
- パラメトリック検定:母集団が正規分布に従うことを前提(例:t検定、分散分析)。
- ノンパラメトリック検定:母集団の分布を仮定しない(例:マンホイットニーのU検定、クラスカル・ウォリス検定)。
群数
比較する群数が2群か3群以上かのどちらかで検定の方法を使い分けます。
検定手法まとめ
これまで紹介したデータの特徴から、それぞれに適した検定手法をまとめました。
![](https://masa-lab-note.com/wp-content/uploads/2024/06/b7bffe9ee75a90474209662c535de5bd-1.png)
それぞれの検定については別の記事で詳しく紹介していきます。
t検定
分散分析
Tukeyの多重比較
マンホイットニーのU検定
クラスカル・ウォリス検定
Steel-Dwass検定
この記事は統計検定の選び方についてまとめました。
次回はt検定についてRのコードを交えながら紹介していきます。
この記事が少しでもお役に立てたら嬉しいです。