Rは、統計計算とグラフィックスのためのプログラミング言語およびソフトウェア環境です。オークランド大学のRoss IhakaとRobert Gentlemanによって作られ、1993年に初めてリリースされました。S統計言語のオープンソース実装であるRは、学術統計、生物統計学、データサイエンス研究の支配的な言語となっています。
Rはデータ分析をファーストクラスの関心事として扱います。ベクトル、行列、データフレーム、統計分布が言語のコアに組み込まれています。ベクトル化された演算により、明示的なループなしでデータセット全体に対する計算を実行できます。CRANリポジトリは統計、機械学習、可視化、バイオインフォマティクス、計量経済学などをカバーする20,000以上のパッケージをホストしています。
Rは何に使われますか?
Rは、統計分析と仮説検定、ggplot2によるデータ可視化(出版品質のチャートのゴールドスタンダード)、caret、tidymodels、xgboostによる機械学習、Bioconductorによるバイオインフォマティクスとゲノミクス、計量経済学と金融分析、R MarkdownとShiny Webアプリケーションによる再現可能な研究に使用されています。世界中の大学がRを統計の主要言語として教えています。
初心者のためのR
Rはデータサイエンス、統計、学術研究に参入する場合に学ぶべき言語です。データ操作の構文は汎用言語とは異なり(ベクトルとデータフレームが中心)、tidyverseエコシステム(dplyr、ggplot2、tidyr)によりデータ分析が驚くほど読みやすくなります。myCompilerのオンラインRコンパイラを使えば、プリインストールされたライブラリでデータ操作と統計計算を練習できます。ローカルセットアップは不要です。
Rと他の言語の比較
データサイエンスにおいてPythonと比較すると、Rは優れた統計機能と可視化(ggplot2)を持ち、Pythonは機械学習、デプロイメント、本番システムのためのより広いエコシステムを持っています。多くのデータサイエンティストは両方を使います。Pythonはエンジニアリングとデプロイメント、Rは統計と研究です。MATLAB / Octaveと比較すると、Rは無料で、より大きなパッケージエコシステムを持ち、統計作業に適していますが、MATLABは数値シミュレーションやエンジニアリングに強みがあります。
なぜオンラインRコンパイラを使うのか?
オンラインRコンパイラ(RサンドボックスやR REPLとも呼ばれます)を使えば、RとRStudioをローカルにインストールすることなく、ブラウザで直接Rコードを実行できます。R構文の学習、tidyverse操作の練習、ggplot2可視化のテスト、複雑なローカルセットアップなしでのコース内の統計概念の実践に最適です。
myCompilerのオンラインR IDEには、ggplot2、dplyr、tidyr、data.tableを含む人気ライブラリがプリインストールされています。プロットは出力パネルにレンダリング・表示されます。stdinでデータを提供し、プログラムを保存し、URLで共有できます。すべて無料です。
なぜRは人気があるのか?
学術界でのRの人気は他に類を見ません。統計研究の主要言語であり、世界中のほぼすべての統計学科で教えられています。tidyverse(Hadley Wickhamによるデータサイエンス用Rパッケージのコレクション)はRの使いやすさを一変させ、新世代のアナリストやデータサイエンティストに広まりました。R Shinyにより、データサイエンティストはR言語のみでインタラクティブなWebダッシュボードを構築でき、産業界での採用がさらに拡大しています。
Rのキャリアチャンス
Rのスキルは、データサイエンティスト、統計学者、生物統計学者、クオンツアナリスト、データアナリストの職種で高く評価されています。製薬企業、研究機関、政府機関、金融機関はRユーザーを多く雇用しています。Pythonのスキルと組み合わせることで、Rの知識はあなたを包括的なデータサイエンス候補者にします。