研究室に配属されたばかりの新入生や、これからRで統計分析を始めたいと思っている方へ向けて、【R講座】では、RとRStudioの基本的な使い方から統計手法の選び方、基本的なデータ分析方法までを解説しています。
特にRが初めての方でも安心して学べるように、難しいコマンドやコードは少なめで、RStudioのクリック操作を中心に進めていくので、プログラミングの経験がなくても大丈夫です。
実際のコードを交えながら進めるので、これからの研究やデータ分析に、ぜひ役立ててください!
この記事では、演算子を使った計算やデータの入出力方法、ヘルプの見方など、Rの基本操作について解説しています。
演算子
まずは、Rでよく使われる代表的な演算子を紹介します。
演算子には、算術演算子、代入演算子、論理演算子があります。
それぞれの演算子の一例を以下の表に示します。
算術演算子一例
演算子 | 説明 | 例 | 結果 |
---|---|---|---|
+ | 加算 | 3 + 2 | 5 |
- | 減算 | 5 - 1 | 4 |
* | 乗算 | 4 * 2 | 8 |
/ | 除算 | 8 / 2 | 4 |
^ | 累乗 | 3 ^ 2 | 9 |
%% | 剰余 | 5 %% 2 | 1 |
代入演算子一例
演算子 | 説明 | 例 |
---|---|---|
<- | 代入 | x <- 5 |
= | 代入 | y = 10 |
論理演算子一例
演算子 | 説明 | 例 | 結果 |
---|---|---|---|
== | 等しい | 3 == 3 | TRUE |
!= | 等しくない | 3 != 4 | TRUE |
> | 大きい | 5 > 3 | TRUE |
< | 小さい | 3 < 5 | TRUE |
>= | 大きいか等しい | 5 >= 3 | TRUE |
<= | 小さいか等しい | 3 <= 5 | TRUE |
& | AND | TRUE & TRUE | TRUE |
| | OR | TRUE | FALSE | TRUE |
基本計算
ここでは、基本的な演算子を使って、四則計算や代入、関数計算の方法を解説します。
四則計算
四則計算は、足し算、引き算、掛け算、割り算の基本操作です。
以下はRを使った簡単な四則計算のサンプルコードです。
# 足し算
1 + 1
# 引き算
1 - 1
# 掛け算
2 * 2
# 割り算
6 / 3
このコードを実行すると、以下の結果が得られます。
[1] 2 # 足し算の結果
[1] 0 # 引き算の結果
[1] 4 # 掛け算の結果
[1] 2 # 割り算の結果
代入
Rでは、値をxやyなどの文字(オブジェクト)に代入することができます。
# 変数への代入
x <- 42 # xに42を代入
y = 24 # yに24を代入
代入した結果は、RStudioの「Environment」に表示されるほか、「Console」にオブジェクト名を入力することで確認できます。
オブジェクト名には、空白や数字で始まる文字を使用できません。
ABC123 <- 100
123ABC <- 100
オブジェクトを使った計算
先ほどのオブジェクトを使って計算してみます。
# オブジェクトを使った計算
x + y
[1] 66
関数計算
Rには多くの組み込み関数があり、これらを利用することで効率的に作業を行うことができます。
関数の基本構造は以下のようになります。
関数名(引数1, 引数2,...)
関数名の後ろには括弧がついています。その中に、関数ごとに必要な値「引数」を入れていきます。
Rで扱うデータのタイプ
Rには、データを扱うためのさまざまなデータタイプがありますが、その中でベクトルデータとデータフレームについて説明をします。
ベクトルデータ
ベクトルデータは、「10 20 15 18 22
」や「A B C
」のように数字や文字の並びが入るデータタイプです。
データフレーム
データフレームは、行と列で構成された表形式のデータを扱うためのオブジェクトです。データフレームを使うことで、複数のデータ型をまとめて扱え、統計解析や可視化が容易になります。
データフレームは次のような構造を持ちます。
草丈 節数
1 10 5
2 20 7
3 15 6
4 18 8
5 22 9
Rのデータ操作や解析において、それぞれの用途に応じてベクトルデータとデータフレームが使い分けます。
データの読み込み方法
Rにデータを入力する方法を、直接入力する方法とcsvから読み込む方法の2つを説明します。
データの数が少ない場合は直接入力しても良いですが、データの数が多い場合や、分析器がcsv出力する場合などは、csvファイルから読み込みを行うと良いでしょう。
データの書き出し
Rで処理したデータはいくつかの方法で書き出すことができますが、ここでは、データフレームをwrite.csv( )関数を使って書き出す方法と、図の描画から保存までの基本的な操作を紹介します。
データフレームの書き出し
以下のコードを実行すると、指定したパスにcsvファイルが保存されます。
# データの書き出し
write.csv(data, "path/to/your/output.csv", row.names = FALSE)
図の描画と保存
Rでは作図が簡単行うことができます。
例として標準で入っているplot( )関数を使って散布図を描画します。
# 散布図の描画
plot(data)
上のコードを実行すると、次のような図が右下のペインに表示されます。
保存するときはPlotsペインの「Export」から「Save as Image...」または「Save as PDF...」で保存することができます。
Macの場合、次のコードを使うとPDF形式で保存することができます。
# 図の保存方法
par(family = "HiraKakuProN-W6") # フォントの指定
cairo_pdf(file = "~/Downloads/plot.pdf",
family = "HiraKakuProN-W6",
width = 5,
height = 5,
pointsize = 10)
print(plot(data))
dev.off()
日本語を使うと文字化けが発生しやすいので注意です。
ヘルプと終了
Rには、関数やパッケージに関するヘルプを簡単に探すことができます。また、作業を終了をコマンドで実行できます。
# ヘルプの表示
help(sum) # sum関数のヘルプを表示
# Rの終了
q() # Rを終了
このコードを実行すると、ヘルプペイン(右下)にsum関数の詳細な説明が表示されます。
また、q()
を実行すると、Rの作業が終了し、ウィンドウが閉じます。
まとめ
今回は、Rを使った基本的な操作を紹介しました。
最後に、今回の講座の内容から、Rでのデータ分析の流れをまとめます。
- STEP1データの読み込み
実験データを
write.csv()
関数でRに読み込みます。 - STEP2データ分析
読み込んだデータは、関数を使ってデータ分析します。
(具体的な計算は、今後紹介予定です。) - STEP3データの書き出し
データ分析によって得られた図表を出力します。
次回は、関数を使って基本統計量の計算する方法について紹介します。
少しでもあなたの解析が楽になりますように!