オッサンのPython勉強日記です。
スクレイピングの練習問題。
百度の热搜榜にアクセスし、タイトルを取得するコードです。
import requests
from bs4 import BeautifulSoup
session = requests.Session()
url = 'https://top.baidu.com/board?tab=realtime'
response = session.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
items = soup.select('.title_dIF3B')
keywords = [item.text for item in items]
print(keywords)