R을 이용한 웹 크롤링

웹 사이트에서 데이터와 텍스트를 크롤링해 가져오는 방법을 알아봅니다

726
수강중

4. 설치 및 데이터

동영상이 없는 텍스트 강의 자료입니다.

R과 RStudio 설치

Java 설치

RSelenium 패키지를 설치하기 위해서는 Java를 먼저 설치하셔야 합니다.

사용할 패키지

  • rvest
  • httr
  • stringr
  • RSelenium

R이나 RStudio의 명령 창에서 다음 명령을 붙여넣기하고 엔터를 치면 모두 설치됩니다.

install.packages(c('rvest', 'httr', 'stringr', 'RSelenium'), repos='http://cran.nexr.com')

윈도에서 RStudio가 패키지 설치를 못할 경우

윈도에서 사용자 이름이 한글인 경우 RStudio에서 설치가 잘 되지 않을 수 있습니다. 이때는 다음 둘 중 한 가지 방법을 사용하세요.

  • R GUI에서 설치하시면 잘 됩니다.
  • TEMP와 TMP 환경 변수를 한글이 없는 경로(예: C:\TEMP 등)로 설정하면 RStudio에서도 설치가 잘 됩니다
    • 환경변수는 제어판에서 사용자 계정을 선택 후 환경변수 변경을 선택하면 설정할 수 있습니다.

내용의 난이도는 적절한가요?

공부나 업무에 도움이 되는 내용인가요?