✏️ 공부중 파이썬

1. 크롤링 시작 (설치 및 설정)

인유주 2023. 9. 22. 19:36
728x90
반응형
SMALL

설치하기

1.크롬 드라이버

파이썬으로 웹 브라우저를 제어하기 위해서는 크롬 드라이버를 설치해야 합니다. 크롬 드라이버는 파이썬과 웹 브라우저 사이의 통신을 도와줍니다. 크롬 드라이버를 설치하기 위해 아래 명령어를 실행합니다:

pip install chromedriver-autoinstaller

 

 

2.셀레늄

크롬 드라이버를 사용하여 웹페이지를 제어하기 위해 셀레늄 라이브러리를 설치해야 합니다. 셀레늄은 웹 브라우저를 자동으로 조작할 수 있는 라이브러리입니다. 아래 명령어를 사용하여 셀레늄을 설치합니다:

pip install selenium

 

 

 

3. 뷰티풀 소프트
크롤링한 데이터에서 원하는 정보를 추출하기 위해 뷰티풀 소프트 라이브러리를 사용합니다. 뷰티풀 소프트는 HTML 문서를 파싱하여 데이터를 추출하는 데 유용합니다. 아래 명령어를 사용하여 뷰티풀 소프트를 설치합니다:

pip install beautifulsoup4

 

반응형

 

설정하기

1. 크롬 드라이버 설정
크롬 드라이버를 설치했다면, 이제 웹 브라우저를 자동으로 제어할 수 있도록 크롬 드라이버의 경로를 설정해야 합니다. 이를 위해 아래와 같이 코드를 작성합니다: 위 코드에서 "크롬 드라이버 경로" 부분에 설치한 크롬 드라이버의 경로를 입력해야 합니다.

from selenium import webdriver

# 크롬 드라이버 경로 설정
driver = webdriver.Chrome(executable_path="크롬 드라이버 경로")

 

2. 웹페이지 접속 및 데이터 수집

import chromedriver_autoinstaller   #크롤링 브라우저열기

from selenium import webdriver   # 셀레늄 라이브러리 준비

from bs4 import BeautifulSoup   #뷰티풀숩 라이브러리 준비

chromedriver_autoinstaller.install()   #chromedriver 최신버전설치 chromedriver.exe를 자동다운로드 받게 됨

browser = webdriver.Chrome()   # 브라우저 열기




browser . 페이지접속
browser . 정보가져오기

 

 


이제 파이썬을 사용하여 웹페이지에 접속하고 데이터를 수집할 수 있습니다. 웹페이지의 요소를 찾고 데이터를 추출하는 방법은 다음 튜토리얼에서 자세히 다루겠습니다.

이렇게 해서 크롤링을 위한 기본적인 환경 설정을 마쳤습니다. 다음 튜토리얼에서는 실제로 웹페이지에서 데이터를 크롤링하는 방법을 배우겠습니다.

 

 

 

 

728x90
반응형
SMALL

'✏️ 공부중 파이썬' 카테고리의 다른 글

2. 웹페이지 접속하기  (0) 2023.09.22
#5.변수사용하기  (0) 2023.08.12