研究室に配属されたばかりの新入生や、これからRで統計分析を始めたいと思っている方へ向けて、【R講座】では、RとRStudioの基本的な使い方から統計手法の選び方、基本的なデータ分析方法までを解説しています。
特にRが初めての方でも安心して学べるように、難しいコマンドやコードは少なめで、RStudioのクリック操作を中心に進めていくので、プログラミングの経験がなくても大丈夫です。
実際のコードを交えながら進めるので、これからの研究やデータ分析に、ぜひ役立ててください!
R講座の記事一覧
「R講座」の記事一覧です。
この記事では、スピアマンの相関係数について紹介しています。
スピアマンの順位相関係数とは
スピアマンの相関係数は、2つの連続変数間の線形関係の強さと方向を測る統計量です。
前提設定
- 正規性:不要
- データ尺度:順序尺度または間隔尺度・比率尺度
仮説の設定
- 帰無仮説(H0):母集団の相関係数は0である(相関がない)
- 対立仮説(H1):母集団の相関係数は0ではない(相関がある)
Rでスピアマンの相関係数を計算する
関数と引数オプション
Rで相関係数を計算するには、cor.test()
関数を使用します。
## ベクトルを使う方法
cor.test(x, y,
alternative = c("two.sided", "less", "greater"),
method = c("pearson", "kendall", "spearman"),
exact = NULL, conf.level = 0.95, continuity = FALSE, ...)
## データフレームを使う方法
cor.test(formula, data, subset, na.action, ...)
x
,y
: データ値の数値ベクトル。x
とy
は同じ長さである必要があります。alternative
: 対立仮説を指定し、"two.sided"(両側検定)、"greater"(正の相関)、"less"(負の相関)のいずれかを選択。頭文字のみでも指定可能。method
: 使用する相関係数の種類を指定する文字列。"pearson"、"kendall"、"spearman"のいずれかを選択。省略形も可。exact
: 正確なp値を計算するかどうかを指定する論理値。KendallのτとSpearmanのρに使用。デフォルト(NULL)の意味は'Details'セクションを参照。conf.level
: 返される信頼区間の信頼水準。現在はPearsonの積率相関係数で、少なくとも4組の完全な観測対がある場合にのみ使用。continuity
: 論理値。TRUEの場合、KendallのτとSpearmanのρで正確に計算されない場合に連続性補正を使用。formula
:~ u + v
形式の式。u
とv
はそれぞれのサンプルのデータ値を与える数値変数。サンプルは同じ長さである必要がある。data
: オプションの行列またはデータフレーム(または類似のもの)で、formula
で指定された変数を含む。デフォルトでは変数はenvironment(formula)
から取得。subset
: 使用する観測値のサブセットを指定するオプションのベクトル。na.action
: データにNAが含まれる場合の処理方法を指定する関数。デフォルトはgetOption("na.action")
。
コード例と結果の見方
例として、植物の草丈と日照時間の関係を調べてみます。
# サンプルデータの作成
data <- data.frame(草丈 <- c(10, 15, 20, 25, 30, 35, 40, 45, 50, 55),
日照時間 <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11))
# ピアソンの相関係数の計算
cor.test(草丈, 日照時間, method = "spearman")
Spearman's rank correlation rho
data: 草丈 and 日照時間
S = 3.6637e-14, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
この結果のから、相関係数(cor)が1で強い相関関係があります。また、p値が2.2e-16で、0.05より十分に小さいため、相関が統計的に有意であると判断できます。
以上、スピアマンの相関係数について紹介しました。
この記事が少しでもお役に立てたら嬉しいです。