Python 웹 스크래핑

Python으로 웹에 있는 자료들을 스크래핑 하는 방법을 알아봅니다.


수강중

6. 패키지 설치

동영상이 없는 텍스트 강의 자료입니다.

웹 스크래핑에 필요한 패키지는 lxml, requests 그리고 cssselect입니다.

  • requests: 웹스크래핑을 위한 HTTP 요청을 처리
  • lxml: HTML에서 정보를 추출
  • cssselect: HTML에서 특정 요소를 추출하는데 CSS 선택자를 사용

lxmlrequests는 아나콘다 또는 구글 colab를 사용할 경우 미리 설치되어 있으므로 설치할 필요가 없습니다.

cssselectpip를 이용해 설치합니다.

!pip install cssselect