R(프로그래밍 언어)

cat("Hello World \n")


R-project 공식 웹사이트

1 개요

뉴질랜드 오클랜드 대학 (The University of Auckland) 에서 개발된 통계 및 그래프 작업을 위한 인터프리터 프로그래밍 언어.

2 장점

장점은 크게 두가지

  • 첫째로 GNU GPL 라이센스로 배포되고 있어 무료로 사용할 수 있다. SPSS, MATLAB과 같은 상용 프로그램을 구입하지 않아도 된다.
  • 둘째로 R에서 사용할 수 있는 수많은 통계 관련 패키지[1]가 개발되어 있어서 인터넷을 통해 이 패키지들을 설치하는 식으로 무수한 기능 확장이 가능하다. 애초에 통계학자들이 만들어 낸 언어인데다, 통계 전문 언어 중 가장 메이저하기 때문에 내가 사용하고 싶은 모든 통계기법이 이미 어딘가에 패키지 형태로 구현되어 있다고 봐도 무방하다.[2]
    • 그래픽 관련 패키지를 설치하면 간단하게 수많은 종류의 그래프를 활용할 수 있으며, 구글이나 네이버 지도를 불러오거나 이를 활용해 GIS 용도로 쓰는 것도 가능하다.
    • 데이터 마이닝, 빅 데이터 프로세싱, 기계학습 등에 유용하다.
    • 리스크, 재무 전문가를 뽑을 때 R 언어 능통자를 우대하기도 한다.

3 단점

  • 메모리 관리, 속도, 효율성 : R 언어는 그 설계 특성상 매우 큰 데이터 집합을 사용한 작업을 수행할 때 문제가 발생할 수 있다. 데이터를 물리적 메모리에 저장해야 하기 때문이다. 때문에 효율이 중시되는 프로젝트에서는 먼저 R로 구현한 후 그걸 C 등의 일반 프로그래밍 언어로 포팅하는 경우가 많다. 다른 경우는 복잡한 데이터 작업은 C 또는 Fortran(포트란)에서 작업시키고 결과만 가져오는 방식을 사용하기도 한다. 다만, 컴퓨터에 장착되는 메모리 용량이 증가함에 따라 이 문제는 점점 개선되고 있다.
  • 정보보호 기능 없음. 과거에는 R을 백엔드 서버로 사용하여 계산을 수행하는 것도 불가능했으나, 아마존 웹 서비스 클라우드 플랫폼에서 가상 컨테이너를 사용하는 등의 기술이 개발되면서 보안 문제는 개선됐다.
  • 웹 브라우저에 내장할 수 없음. 웹이나 인터넷 앱에 사용할 수 없다.

4 통합 개발 환경 (IDE)

통합 개발 환경으로 RStudio가 가장 무난하다. R 본체가 설치되어 있어야 작동하며, 훨씬 편리한 인터페이스를 제공하는 것이 강점. 단, 폴더 경로나 파일 이름에 한글이 들어가면 제대로 작동하지 않을 수 있으니 주의할 것.[3] RStudio 홈페이지

다른 IDE나 에디터들은

  • ConTEXT
  • Eclipse (StatET)
  • Emacs (Emacs Speaks Statistics)
  • LyX (modules for knitr and Sweave)
  • Vim
  • jEdit
  • Kate
  • Revolution R Enterprise DevelopR (part of Revolution R Enterprise)
  • Sublime Text
  • TextMate
  • Atom
  • WinEdt (R Package RWinEdt)
  • Tinn-R
  • Notepad++
  • Visual Studio
  • Architect

5 간단히 튜토리얼을 접해볼 만한 사이트

6 간단한 질문을 받아주는 카톡오픈채팅방

  1. 추가 기능이라고 볼 수 있다
  2. 2015년 12월 29일 현재 7,700개 가까이의 패키지가 존재한다. 필요한 것이 있다면 여기서 찾아볼 수 있다.
  3. 특히 사용자 계정 이름이 한글일 경우 기본 폴더 경로 자체에 한글이 들어가게 되므로 제대로 실행되지 않는다. 이 경우 관리자권한으로 실행시키면 된다.