-
get_last_page of Stack OverflowProject using python/Jobs scrapper 2020. 12. 21. 10:51
scrapperSO.py
import requests from bs4 import BeautifulSoup def get_last_page(url): result = requests.get(url) soup = BeautifulSoup(result.text, "html.parser") pages = soup.find("div", {"class": "s-pagination"}).find_all('a') last_page = pages[-2].get_text(strip=True) return int(last_page) def get_SOJobs(word): url = f"https://stackoverflow.com/jobs?q={word}" last_page = get_last_page(url) print(last_page) get_SOJobs("python")
Stack Overflow에 있는 원하는 language의 일자리를 scrap할 것이다. 먼저 해야할 것은 SO가 수백 개의 일자리를 페이지 별로 나눴는데, 그 중 가장 마지막 페이지의 번호를 얻어야 한다.
참고 자료
소스 코드
github.com/zpskek/web_scraper-v2/commit/4393ae9f05f3433bccaee7de61b5c07c2f1c5407
'Project using python > Jobs scrapper' 카테고리의 다른 글
Scrap WeWorkRemotely (0) 2020.12.21 Extract jobs from Stack Overflow (0) 2020.12.21 Job scrapper Intro (0) 2020.12.21 Python BeautifulSoup (0) 2020.12.21 Python requests (0) 2020.12.21