예제1) 네이버증권 홈페이지의 '삼성전자' 페이지를 parsing해서 재무재표를 데이터프레임으로 가져오기

- 사용 모듈 : requests, pandas, (bs4) BeautifulSoup

- 네이버증권 삼성전자 페이지 : https://finance.naver.com/item/main.naver?code=005930

 

결과)

 

코드)

#참조 페이지 : https://chaelist.github.io/docs/webscraping/requests_beautifulsoup/

import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://finance.naver.com/item/main.naver?code=005930'
r = requests.get(url)  # requests가 url의 source code를 받아온 후,
soup = BeautifulSoup(r.text, 'lxml')   # BeautifulSoup로 각 tag를 접근할 수 있게 준비

info = soup.find('table', attrs={'class':'tb_type1 tb_num tb_type1_ifrs'}) 
table = pd.read_html(str(info))
table[0] # list인 table의 첫번째 항목에 dataframe형태로 들어가 있음.

+ Recent posts