【R講座】マクネマー検定

研究室に配属されたばかりの新入生や、これからRで統計分析を始めたいと思っている方へ向けて、【R講座】では、RとRStudioの基本的な使い方から統計手法の選び方、基本的なデータ分析方法を解説しています。特にRが初めての方でも安心して学べるように、RStudioのクリック操作も紹介していきます。実際のコード例を交えながら進めるので、これからの研究やデータ分析に、役立てていただけたら嬉しいです。

R講座の一覧

学生時代の自主ゼミノートを清書した、初心者向けR講座。隙間時間で学べる細かい内容で、RやRStudioの魅力を無理なく習得！

みなさん、こんにちは！

ここでは、この回で紹介したマクネマー検定について解説しています。

今回の内容

マクネマー検定の概要
マクネマー検定の方法
結果の見方

マクネマー検定とは
関数の構造と引数オプション
分析の実践
まとめ

マクネマー検定とは

マクネマー検定は、対応のある名義尺度データの差を評価するための検定方法です。例えば、ある農薬の効果を評価する際に、同じ作物に対して農薬使用前後の病害発生率を比較するのに使用できます。

前提条件

マクネマー検定を実施する際には以下の条件を確認します。

対応の有無：対応あり
正規性：必要なし
等分散性：必要なし
群数：2群
データ尺度：名義尺度

仮説の設定

マクネマー検定では次の仮説を設定します。

帰無仮説（H₀）：計測の前後で結果に差はない。
対立仮説（H₁）：計測の前後で結果に差がある。

関数の構造と引数オプション

Rでマクネマー検定を行うには、mcnemar.test()関数を使用します。

関数の構造

# マクネマー検定の関数
mcnemar.test(x, y = NULL, correct = TRUE)

引数オプション

x: 2次元のクロス集計表を含む行列形式、または factor オブジェクトを指定します。
y: factor オブジェクトを指定します。x が行列の場合、この引数は無視されます。
correct: 検定統計量を計算する際に連続性補正を適用するかを示す論理値です。補正を適用する場合は TRUE、適用しない場合は FALSE を指定します。

まとめると、mcnemar.test()関数は次の二つの入力方法となります。

mcnemar.test(行列)
mcnemar.test(ベクトル1, ベクトル2)

分析の実践

次のステップでデータを分析していきます。

Rでマクネマー検定の手順

STEP 1
データの読み込み

csvファイルからデータを読み込みます。
STEP 2
マクネマー検定の実行

mcnemar.test()関数でマクネマー検定を実行します。
STEP 3
結果の出力

計算された結果がコンソールペインに出力されます。

使用するデータ

この講座では、説明のために同じ CSV データを使い回しています。
実際には、データの性質（分布・尺度・サンプル数など）に合わせて、適切な統計検定を選びましょう。

csvファイル

R講座サンプルデータ5 ダウンロード

csvファイルの内容

このcsvファイルには次のデータが含まれています。

Before	After
Cure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	Cure
NoCure	NoCure

データの読み込み

まずは、次のコードを使って、オブジェクト「data」にread.csv()関数でcsvファイルのデータを代入します。

# データの読み込み
data <- read.csv(file.choose(),
                 check.names = F)

マクネマー検定

Table()を使う方法

行列データに変換してマクネマー検定を実行します。

# 行列に変換して実行
tab <- table(data)
mcnemar.test(tab)

ベクトルを使う方法

行列データに変換してマクネマー検定を実行します。

# ベクトルでマクネマー検定実行
mcnemar.test(data$Before, data$After)

結果の見方

結果はコンソールペインに表示されます。

	McNemar's Chi-squared test with continuity correction

data:  tab
McNemar's chi-squared = 6.125, df = 1, p-value = 0.01333

この結果から、p値が0.05より小さいため、BeforeとAfterに有意な差があったと判断します。

有意水準・p値・信頼区間

項目	説明
`有意水準 (α)`	帰無仮説を棄却する基準。通常 0.05（5%）や 0.01（1%）を使用する。例： α = 0.05なら、5%未満の確率で偶然起こる差を「有意」と判断する。
p値	検定統計量が観測された値以上になる確率。 p値 < 有意水準 (α) なら、統計的に有意と判断し、帰無仮説を棄却する。
統計的に有意とは？	「偶然の変動では説明できない差がある」と判断すること。ただし「実験的に重要」や「因果関係がある」とは限らない。
信頼区間 (Confidence Interval, CI)	母集団の真の値（2つのグループの平均値の差）が含まれる範囲を示す。例えば 95%信頼区間は、繰り返し実験したときに95%の確率で真の値(平均値の差)を含む。
信頼区間と有意性の関係	もし信頼区間がゼロ（または比較対象の値）を含まなければ、統計的に有意と判断できる。例：平均差の95%信頼区間が (0.5, 2.3) なら、有意水準5%で有意。
注意点	統計的有意でも「効果の大きさ（実用的な意味）」とは異なる。 p値が大きくても「差がない」とは言えない（サンプル数が少ない可能性）。