【R講座】基本操作について

R

研究室に配属されたばかりの新入生や、これからRで統計分析を始めたいと思っている方へ向けて、【R講座】では、RとRStudioの基本的な使い方から統計手法の選び方、基本的なデータ分析方法までを解説しています。

特にRが初めての方でも安心して学べるように、難しいコマンドやコードは少なめで、RStudioのクリック操作を中心に進めていくので、プログラミングの経験がなくても大丈夫です。

実際のコードを交えながら進めるので、これからの研究やデータ分析に、ぜひ役立ててください!

R講座の記事一覧
「R講座」の記事一覧です。

この記事では、演算子を使った計算やデータの入出力方法、ヘルプの見方など、Rの基本操作について解説しています。

演算子

まずは、Rでよく使われる代表的な演算子を紹介します。

演算子には、算術演算子、代入演算子、論理演算子があります。

それぞれの演算子の一例を以下の表に示します。

算術演算子一例

演算子説明結果
+加算3 + 25
-減算5 - 14
*乗算4 * 28
/除算8 / 24
^累乗3 ^ 29
%%剰余5 %% 21

代入演算子一例

演算子説明
<-代入x <- 5
=代入y = 10

論理演算子一例

演算子説明結果
==等しい3 == 3TRUE
!=等しくない3 != 4TRUE
>大きい5 > 3TRUE
<小さい3 < 5TRUE
>=大きいか等しい5 >= 3TRUE
<=小さいか等しい3 <= 5TRUE
&ANDTRUE & TRUETRUE
|ORTRUE | FALSETRUE

演算子と数字の間にはスペースを開けておくことをおすすめします。

例えば、比較式「 x < -1」(xは-1より小さい)を、演算子と数字の間にスペースを入れずに「x<-1」としてコードを実行すると、代入式として計算されます。

基本計算

ここでは、基本的な演算子を使って、四則計算や代入、関数計算の方法を解説します。

四則計算

四則計算は、足し算、引き算、掛け算、割り算の基本操作です。

以下はRを使った簡単な四則計算のサンプルコードです。

# 足し算
1 + 1

# 引き算
1 - 1

# 掛け算
2 * 2

# 割り算
6 / 3

このコードを実行すると、以下の結果が得られます。

[1] 2  # 足し算の結果
[1] 0  # 引き算の結果
[1] 4  # 掛け算の結果
[1] 2  # 割り算の結果

Rでは、「#」より右側はコードとして読み込みされないため、コメントを入れることができます。

代入

Rでは、値をxやyなどの文字(オブジェクト)に代入することができます。

# 変数への代入
x <- 42  # xに42を代入
y = 24   # yに24を代入

代入した結果は、RStudioの「Environment」に表示されるほか、「Console」にオブジェクト名を入力することで確認できます。

オブジェクト名には、空白や数字で始まる文字を使用できません。

ABC123 <- 100

123ABC <- 100

オブジェクトを使った計算

先ほどのオブジェクトを使って計算してみます。

# オブジェクトを使った計算
x + y
[1] 66

関数計算

Rには多くの組み込み関数があり、これらを利用することで効率的に作業を行うことができます。

関数の基本構造は以下のようになります。

関数名(引数1, 引数2,...)

関数名の後ろには括弧がついています。その中に、関数ごとに必要な値「引数ひきすう」を入れていきます。

関数に必要な引数は、以下のコードを「Console」に入力することで確認できます。

??関数名

help(関数名) 

# 括弧をつけなくても大丈夫です

Rで扱うデータのタイプ

Rには、データを扱うためのさまざまなデータタイプがありますが、その中でベクトルデータデータフレームについて説明をします。

ベクトルデータ

ベクトルデータは、「10 20 15 18 22」や「A B C」のように数字や文字の並びが入るデータタイプです。

データフレーム

データフレームは、行と列で構成された表形式のデータを扱うためのオブジェクトです。データフレームを使うことで、複数のデータ型をまとめて扱え、統計解析や可視化が容易になります。
データフレームは次のような構造を持ちます。

  草丈 節数
1  10   5
2  20   7
3  15   6
4  18   8
5  22   9

Rのデータ操作や解析において、それぞれの用途に応じてベクトルデータとデータフレームが使い分けます。

データの読み込み方法

Rにデータを入力する方法を、直接入力する方法とcsvから読み込む方法の2つを説明します。

データの数が少ない場合は直接入力しても良いですが、データの数が多い場合や、分析器がcsv出力する場合などは、csvファイルから読み込みを行うと良いでしょう。

データの書き出し

Rで処理したデータはいくつかの方法で書き出すことができますが、ここでは、データフレームをwrite.csv( )関数を使って書き出す方法と、図の描画から保存までの基本的な操作を紹介します。

データフレームの書き出し

以下のコードを実行すると、指定したパスにcsvファイルが保存されます。

# データの書き出し
write.csv(data, "path/to/your/output.csv", row.names = FALSE)

図の描画と保存

Rでは作図が簡単行うことができます。

例として標準で入っているplot( )関数を使って散布図を描画します。

# 散布図の描画
plot(data)

上のコードを実行すると、次のような図が右下のペインに表示されます。

保存するときはPlotsペインの「Export」から「Save as Image...」または「Save as PDF...」で保存することができます。

Macの場合、次のコードを使うとPDF形式で保存することができます。

# 図の保存方法
par(family = "HiraKakuProN-W6") # フォントの指定
cairo_pdf(file = "~/Downloads/plot.pdf",
      family = "HiraKakuProN-W6",
      width = 5,
      height = 5,
      pointsize = 10)
print(plot(data))
dev.off()

日本語を使うと文字化けが発生しやすいので注意です。

ヘルプと終了

Rには、関数やパッケージに関するヘルプを簡単に探すことができます。また、作業を終了をコマンドで実行できます。

# ヘルプの表示

help(sum)  # sum関数のヘルプを表示

# Rの終了
q()  # Rを終了

このコードを実行すると、ヘルプペイン(右下)にsum関数の詳細な説明が表示されます。

また、q()を実行すると、Rの作業が終了し、ウィンドウが閉じます。

まとめ

今回は、Rを使った基本的な操作を紹介しました。

最後に、今回の講座の内容から、Rでのデータ分析の流れをまとめます。

データ分析の手順まとめ
  • STEP1
    データの読み込み

    実験データをwrite.csv()関数でRに読み込みます。

  • STEP2
    データ分析

    読み込んだデータは、関数を使ってデータ分析します。
    (具体的な計算は、今後紹介予定です。)

  • STEP3
    データの書き出し

    データ分析によって得られた図表を出力します。


次回は、関数を使って基本統計量の計算する方法について紹介します。

少しでもあなたの解析が楽になりますように!

タイトルとURLをコピーしました