R은 통계 컴퓨팅과 그래픽을 위한 프로그래밍 언어 및 소프트웨어 환경입니다. 오클랜드 대학교의 Ross Ihaka와 Robert Gentleman이 만들고 1993년에 처음 출시된 R은 S 통계 언어의 오픈소스 구현입니다. 학술 통계, 생물통계학, 데이터 과학 연구의 지배적인 언어가 되었습니다.
R은 데이터 분석을 일급 관심사로 취급하며, 벡터, 행렬, 데이터 프레임, 통계 분포가 언어 코어에 내장되어 있습니다. 벡터화된 연산으로 명시적 루프 없이 전체 데이터셋에 대한 계산을 수행할 수 있습니다. CRAN 저장소는 통계, 머신러닝, 시각화, 생물정보학, 계량경제학 등을 다루는 20,000개 이상의 패키지를 호스팅합니다.
R은 무엇에 사용되나요?
R은 통계 분석 및 가설 검정, 출판 품질 차트의 최고 표준인 ggplot2를 활용한 데이터 시각화, caret, tidymodels, xgboost를 활용한 머신러닝, Bioconductor를 통한 생물정보학 및 유전체학, 계량경제학 및 금융 분석, R Markdown과 Shiny 웹 애플리케이션을 활용한 재현 가능한 연구에 사용됩니다. 전 세계 대학에서 통계의 기본 언어로 R을 가르칩니다.
초보자를 위한 R
R은 데이터 과학, 통계 또는 학술 연구에 진입하려는 사람이 배워야 할 언어입니다. 데이터 조작을 위한 문법은 범용 언어와 다르지만(벡터와 데이터 프레임이 중심), tidyverse 생태계(dplyr, ggplot2, tidyr)가 데이터 분석을 놀라울 만큼 읽기 쉽게 만듭니다. myCompiler의 온라인 R 컴파일러를 사용하면 사전 설치된 라이브러리로 데이터 조작과 통계 계산을 로컬 설정 없이 연습할 수 있습니다.
R vs 다른 언어들
데이터 과학에서 Python과 비교하면, R은 우수한 통계 기능과 시각화(ggplot2)를 가지고 있으며, Python은 머신러닝, 배포, 프로덕션 시스템에 더 넓은 생태계를 가지고 있습니다. 많은 데이터 과학자가 Python은 엔지니어링과 배포에, R은 통계와 연구에 양쪽 모두 사용합니다. MATLAB/Octave와 비교하면, R은 무료이고, 더 큰 패키지 생태계를 가지며, 통계 작업에 더 적합하고, MATLAB은 수치 시뮬레이션과 엔지니어링에 더 강합니다.
온라인 R 컴파일러를 사용해야 하는 이유
R 샌드박스 또는 R REPL이라고도 불리는 온라인 R 컴파일러를 사용하면 로컬에 R과 RStudio를 설치하지 않고도 브라우저에서 직접 R 코드를 실행할 수 있습니다. R 문법 학습, tidyverse 연산 연습, ggplot2 시각화 테스트, 복잡한 로컬 설정 없이 과정에서 통계 개념을 다루기에 적합합니다.
myCompiler의 온라인 R IDE에는 ggplot2, dplyr, tidyr, data.table을 포함한 인기 라이브러리가 사전 설치되어 있습니다. 플롯이 출력 패널에 렌더링되어 표시됩니다. stdin을 통해 데이터를 제공하고, 프로그램을 저장하고, URL로 공유할 수 있으며, 모두 무료입니다.
R은 왜 그렇게 인기가 많나요?
R의 학계에서의 인기는 비할 데 없으며, 통계 연구의 기본 언어이자 전 세계 거의 모든 통계학과에서 가르치는 언어입니다. Hadley Wickham의 데이터 과학을 위한 R 패키지 컬렉션인 tidyverse는 R의 사용성을 변화시키고 새로운 세대의 분석가와 데이터 과학자에게 R을 가져왔습니다. R Shiny는 데이터 과학자가 순수 R로 대화형 웹 대시보드를 구축할 수 있게 하여 산업에서의 채택을 더욱 넓혔습니다.
R 커리어 기회
R 기술은 데이터 과학자, 통계학자, 생물통계학자, 퀀트 분석가, 데이터 분석가 역할에서 가치가 있습니다. 제약회사, 연구기관, 정부 기관, 금융 회사에서 R 사용자를 광범위하게 고용합니다. Python 기술과 결합하면 R 지식은 종합적인 데이터 과학 후보자를 만들어줍니다.