【R講座】統計検定の選び方

R

Rは統計検定を行うことのできる強力なツールですが、統計検定はデータの種類や目的に応じて適切なものを選ぶことが重要です。

この記事では、論文でよく見かける単変量解析の手法をデータの特徴から選ぶ方法について紹介します。

ここで紹介している検定方法の他にもたくさんあります。それらについては専門書などを参考にしてください。

データの特徴

検定の種類

統計検定には大きく分けて差を調べる検定関連性を調べる検定があります。

  • 差を調べる検定:例えば、t検定やANOVA(分散分析)など。
  • 関連性を調べる検定:例えば、相関分析や回帰分析など。

対応の有無

データが対応(ペア)か非対応(独立)かを確認します。

例えば、同じ被験者の前後比較なら対応、異なる被験者群なら非対応です。

データの尺度

データの尺度には次の4種類があります。それぞれに適した検定が存在します。

  • 名義尺度:カテゴリデータ(例:性別、血液型)
  • 順序尺度:順序があるデータ(例:アンケートの満足度)
  • 間隔尺度:等間隔の数値データ(例:温度)
  • 比例尺度:絶対的なゼロ点がある数値データ(例:身長、体重)

母集団分布

検定には、データの母集団が正規分布に従うことを仮定したものと、そうでないものがあります。

データのヒストグラムを描いて視覚的に判断する方法や、正規性の検定によって判断する方法があります。

  • パラメトリック検定:母集団が正規分布に従うことを前提(例:t検定、分散分析)。
  • ノンパラメトリック検定:母集団の分布を仮定しない(例:マンホイットニーのU検定、クラスカル・ウォリス検定)。

群数

比較する群数が2群か3群以上かのどちらかで検定の方法を使い分けます。

検定手法まとめ

これまで紹介したデータの特徴から、それぞれに適した検定手法をまとめました。

それぞれの検定については別の記事で詳しく紹介していきます。

Tukeyの多重比較

マンホイットニーのU検定

クラスカル・ウォリス検定

Steel-Dwass検定


この記事は統計検定の選び方についてまとめました。

次回はt検定についてRのコードを交えながら紹介していきます。

この記事が少しでもお役に立てたら嬉しいです。

プロフィール
この記事を書いた人

農学の博士前期課程を修了した研究者の卵。
植物生理と環境調節をテーマに研究しています。

Masaをフォローする
R統計
Masaをフォローする
タイトルとURLをコピーしました