예제1) 네이버증권 홈페이지의 '삼성전자' 페이지를 parsing해서 재무재표를 데이터프레임으로 가져오기
- 사용 모듈 : requests, pandas, (bs4) BeautifulSoup
- 네이버증권 삼성전자 페이지 : https://finance.naver.com/item/main.naver?code=005930
결과)
코드)
#참조 페이지 : https://chaelist.github.io/docs/webscraping/requests_beautifulsoup/
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://finance.naver.com/item/main.naver?code=005930'
r = requests.get(url) # requests가 url의 source code를 받아온 후,
soup = BeautifulSoup(r.text, 'lxml') # BeautifulSoup로 각 tag를 접근할 수 있게 준비
info = soup.find('table', attrs={'class':'tb_type1 tb_num tb_type1_ifrs'})
table = pd.read_html(str(info))
table[0] # list인 table의 첫번째 항목에 dataframe형태로 들어가 있음.
'New Collar Level 2' 카테고리의 다른 글
비정형 데이터의 단어 토큰화 (0) | 2024.06.17 |
---|---|
업무 자동화 - Windows 창 활성화 (0) | 2024.06.16 |
MS그림판으로 자동으로 그림그리기 (0) | 2024.05.06 |
Pandas를 사용해서 데이터 계산하기 (0) | 2024.05.04 |
주피터 시작 - 명령어창에서 상대경로 찾는 법 (1) | 2024.03.18 |