[Python] pandas로 가져온 데이타 처리하기
데이타 처리하기
앞서 배운 데이타 가져오기 이후 데이타를 처리하는 예제들입니다.
예제 1
아래와 같은 테이블을 pd.read_html()을 이용해서 가져오는 예제입니다.
시가총액 | 3조 485억원 |
---|---|
시가총액순위 | 코스피 109 위 |
상장주식수 | 868,530,000 |
액면가 l 매매단위 | 5,000원 l 1주 |
page = requests.get(url)
table = pd.read_html(StringIO(page.text), match='시가총액', encoding='utf-8')
0 시가총액 3조 485 억원
1 시가총액순위 코스피 109위
2 상장주식수 868530000
3 액면가l매매단위 5,000원 l 1주
현재 테이블은 복잡하지 않으므로 아래와 같이 바로 접근하여 데이타를 가져올 수 있습니다.
행과 열을 가끔 헷갈리는 경우가 많은데 아래와 같습니다.
-
Rows : horizontal - 행
-
Columns : vertical - 열
-
loc[n] : n 행 을 읽음
-
iloc[n] : n 열을 읽음
직접 데이타 조회하기
print('시가총액:', table[0].iloc[0, 1])
print('시가총액순위', table[0].iloc[1, 1])
print('상장주식수', table[0].iloc[2, 1])
print('액면가, 매매단위', table[0].iloc[3, 1])
위를 한줄로 하면
for i, row in table[0].iterrows():
print(row.iloc[0], ':', row.iloc[1])