웹 크롤링을 이용해 간단하게 네이버 기사 제목을 뽑아보자. 웹 데이터 추출을 위해 select_one/select/find/find_all 메소드를 이용한다. 기초지만 크로링에서 가장 중요한 기능을 담당한다고해도 과언이 아니다.
[네이버 제목 추출 파이썬 코드]
import requests
from bs4 import BeautifulSoup
keyword = input("KEYWORD : ")
url = f"https://search.naver.com/search.naver?ssc=tab.blog.all&sm=tab_jum&query={keyword}"
res = requests.get(url)
if res.status_code == 200:
html = res.text
soup = BeautifulSoup(html, 'html.parser')
# select_one()
print("-------------- select_one() -------------- ")
print(soup.select_one(".title_link").text)
# select()
print("-------------- select() -------------- ")
titles = soup.select(".title_link")
for title in titles[:5]:
print(title.text)
# find()
print("-------------- find() -------------- ")
print(soup.find(class_="title_link").text)
# find_all()
print("-------------- find_all() -------------- ")
titles = soup.find_all(class_="title_link")
for title in titles[:5]:
print(title.text)
[출력 결과]
반응형
'코드리뷰 > chatGPT(Python)코드' 카테고리의 다른 글
웹 크롤링 기초 - 네이버 헤더 정보 가져와 설정하기 (1) | 2024.03.23 |
---|---|
GRADIO 챗봇에 제휴링크 걸기 (0) | 2024.03.18 |
Streamlit 쿠팡 파트너스와 토스 후원 링크로 수익 창출 (4) | 2024.03.16 |
댓글