Project using python/Jobs scrapper

get_last_page of Stack Overflow

Cog Factory 2020. 12. 21. 10:51

scrapperSO.py

import requests
from bs4 import BeautifulSoup

def get_last_page(url):
  result = requests.get(url)
  soup = BeautifulSoup(result.text, "html.parser")
  pages = soup.find("div", {"class": "s-pagination"}).find_all('a')
  last_page = pages[-2].get_text(strip=True)
  return int(last_page)

def get_SOJobs(word):
  url = f"https://stackoverflow.com/jobs?q={word}"
  last_page = get_last_page(url)
  print(last_page)

get_SOJobs("python") 

   Stack Overflow에 있는 원하는 language의 일자리를 scrap할 것이다. 먼저 해야할 것은 SO가 수백 개의 일자리를 페이지 별로 나눴는데, 그 중 가장 마지막 페이지의 번호를 얻어야 한다.

참고 자료

소스 코드

github.com/zpskek/web_scraper-v2/commit/4393ae9f05f3433bccaee7de61b5c07c2f1c5407