Python 웹 스크래핑

Python으로 웹에 있는 자료들을 스크래핑 하는 방법을 알아봅니다.


수강중

16. 셀레늄으로 웹브라우저 열기

셀레늄에서 Chrome을 임포트한다.

from selenium.webdriver import Chrome
import os

윈도와 맥에서 브라우저를 여는 방법에 차이가 있다.

윈도에서는 현재 작업 폴더에 chromedriver.exe 파일이 있다면 다음과 같이 열 수 있다.

browser = Chrome()

맥에서는 chromedriver 파일(윈도와 달리 .exe가 붙지 않음)이 있더라도, 다음과 같이 해당 파일의 위치를 명시해주어야 한다.

browser = Chrome(os.getcwd() + '/chromedriver')

셀레늄 모듈이 정상작동하는 경우, 새로운 크롬이 뜨면서 Chrome이 자동화된 테스트 소프트웨어에 의해 제어되고 있습니다. 라고 표시된다.

만약 'chromedriver' executable needs to be in PATH.와 같은 오류가 날 경우, 이는 chromedriver.exe 파일이 현재 작업 폴더에 없거나, 위치를 잘못 지정한 것이므로 이를 수정한다.

셀레늄을 통해 브라우저를 열어도 일반 브라우저와 동일하게 사용할 수 있다. 이를 통해 수작업이 필요한 경우 직접 브라우저를 제어할 수 있다.

셀레늄에서 특정 주소로 브라우저를 이동시키려면 다음과 같이 .get 메소드를 사용한다.

browser.get('https://naver.com')