웹페이지를 파싱해서 데이터프레임으로 가져오기

Aaron P 2024. 5. 6. 21:25

2024. 5. 6. 21:25

예제1) 네이버증권 홈페이지의 '삼성전자' 페이지를 parsing해서 재무재표를 데이터프레임으로 가져오기

- 사용 모듈 : requests, pandas, (bs4) BeautifulSoup

- 네이버증권 삼성전자 페이지 : https://finance.naver.com/item/main.naver?code=005930

결과)

코드)

#참조 페이지 : https://chaelist.github.io/docs/webscraping/requests_beautifulsoup/

import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://finance.naver.com/item/main.naver?code=005930'
r = requests.get(url)  # requests가 url의 source code를 받아온 후,
soup = BeautifulSoup(r.text, 'lxml')   # BeautifulSoup로 각 tag를 접근할 수 있게 준비

info = soup.find('table', attrs={'class':'tb_type1 tb_num tb_type1_ifrs'}) 
table = pd.read_html(str(info))
table[0] # list인 table의 첫번째 항목에 dataframe형태로 들어가 있음.

'New Collar Level 2' 카테고리의 다른 글

비정형 데이터의 단어 토큰화 (0)	2024.06.17
업무 자동화 - Windows 창 활성화 (0)	2024.06.16
MS그림판으로 자동으로 그림그리기 (0)	2024.05.06
Pandas를 사용해서 데이터 계산하기 (0)	2024.05.04
주피터 시작 - 명령어창에서 상대경로 찾는 법 (1)	2024.03.18

Python으로 떠나는 여행

웹페이지를 파싱해서 데이터프레임으로 가져오기

'New Collar Level 2' 카테고리의 다른 글

+ Recent posts

티스토리툴바