はじめに
この記事では、R言語の基本的な使い方(文法)のみを学びます。何らかのプログラミング言語(Pythonなど)でプログラミングの基本文法を学んでいる方を対象に記述しています。そのため変数とは何か、関数とはといった用語の説明はしませんのでご了承ください。
R言語とは
Rは、オープンソースで利用可能な統計やデータ解析に特化したプログラミング言語です。
Rと同様なことが出来るプログラミング言語には、PythonやMatlab、Juliaなどが挙げられます。
上記のプログラミング言語でも統計処理やデータ解析は可能ですが、RはPythonよりもデータ分析に記述するコードが比較的短いため、素早くデータ分析を試行できます。
さらに、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy data)を扱うためのツールが充実しています。
Rの環境構築に関しては、以下のどちらかをご参考ください。
【初学者向け】「R」言語とは?R言語に関してわかりやすく解説!
【Google Colab】Colab で R を使おう
四則演算
足し算は+
、引き算は-
、掛け算は*
、割り算は/
で計算できます。また[1]
は出力部分になりますので、打ち込む必要はありません。
> 1 + 5
2
[1] 6
3
> 10 - 5
4
[1] 5
5
> 20 * 3
6
[1] 60
7
> 20 / 4
8
[1] 5
変数の代入
R言語で変数を扱う場合は、<-
を利用します。
> x <- 10
> x + 1
[1] 11
関数
R言語には、平方根(√)を計算するsqrt
関数などの標準関数と、自分で関数を定義する独自関数が利用できます。
> x <- sqrt(10)
> x
[1] 3.162278
次に、以下は独自関数add
関数を定義した例です。
> add <- function(x1, x2) {
+ return (x1 + x2)
+ }
> add(10, 200)
[1] 210
※上記の>
と+
は打ち込む必要ありません。
ベクトル
R言語ではベクトルをc
という関数を使って定義します。
> c(10, 20, 30, 40, 50)
[1] 10 20 30 40 50
ベクトルに対する四則演算は全ての要素に作用します。
> vec <- c(10, 20, 30, 40, 50)
> vec + 10
[1] 20 30 40 50 60
またベクトルに関数を適用する場合、全ての要素に作用します。
> sqrt(vec)
[1] 3.162278 4.472136 5.477226 6.324555 7.071068
リスト
リストを使うことで、複数のデータ型を管理することができます。Rでリストを扱うにはlist()を利用します。
> li = list(1, "test", 5.0)
> li
[[1]]
[1] 1
[[2]]
[1] "test"
[[3]]
[1] 5
また先ほど学んだベクトルの記法に、文字列型や整数型などを混ぜると全て文字列型に変換されますので注意です。
Rでリストの要素を取り出す場合は、リスト名[1]
といった記法で、要素を取り出すことができます。しかし、Pythonでは添え字(index)は0から始まりましたが、Rでは1番目から始まりますので注意です。
先ほど定義したリストliの後に次のプログラムを記述して実行してください。
> li[2]
[[1]]
[1] "test"
すると2番目の要素である、”test”が出力されます。 また、ベクトルの場合、全ての要素に四則演算や関数の処理が作用されましたが、リストはエラーになりますので注意です。
次に、リストにはPythonでいう辞書型のような使い方もできます。
> users <- list(名前 = "田中", 年齢 = 30)
> users
$名前
[1] "田中"
$年齢
[1] 30
> users$名前
[1] "田中"
> users$年齢
[1] 30
データフレーム
Rでは表形式のデータを表現できます。Pythonでは、Pandasモジュールを使って表現可能です。
データフレームの実態は、リストに『同じ長さのベクトル』が入っています。
下記の例ではdata.frame()を用いて、変数名がそれぞれ”身長”と”体重”である二つのベクトルを引数に渡し、ベクトルが列として格納されたデータフレームを作っています。
> 身長 <- c(170, 181, 167)
> 体重 <- c(61, 68, 55)
> X <- data.frame(身長, 体重)
> X
身長 体重
1 170 61
2 181 68
3 167 55
値(列)を取り出すには、リストと同じく$
を利用します。
> X$身長
[1] 170 181 167
> X$体重
[1] 61 68 55
後から行を次のように追加することも可能です。
> X$職業 <- c("マーケティング", "営業", "人事")
> X
身長 体重 職業
1 170 61 マーケティング
2 181 68 営業
3 167 55 人事
> X$名前 <- c("山田", "高橋", "佐藤")
> X
身長 体重 職業 名前
1 170 61 マーケティング 山田
2 181 68 営業 高橋
3 167 55 人事 佐藤
おわりに
この記事では、R言語をGoogle Colabで動作する方法を解説しました。
データ分析や統計処理を実施したい方にはR言語がオススメです。気になった方は本記事の内容を元にR言語の基本文法や、データの加工、統計解析等を学んでみてください。
独学ではなく、オンラインで質問し放題の環境で学びたい方は、AI Academy Bootcampの「オンデマンド動画+チャットサポートプラン」をご検討ください。
本プランでは、6ヶ月質問し放題で受講料が35,000円(税込)でご受講頂けます。
1日の受講費用換算で、なんと194円でご受講頂けます。
450種類のオリジナルテキストコンテンツに加え、5つの動画コース(AIプランナーコース、初めてのPythonプログラミング、Pythonプログラミング入門コース、データサイエンティストコース、機械学習エンジニアコース)もご受講頂けます。
業界最安値で、どこよりもお得に、効率よくAIスキルを身に付けたい方、AI人材として転職したい方は是非ご受講ご検討ください。