[Python] pandas로 가져온 데이타 처리하기

[Python] pandas로 가져온 데이타 처리하기 updated_at: 2024-02-02 14:10

데이타 처리하기

앞서 배운 데이타 가져오기 이후 데이타를 처리하는 예제들입니다.

예제 1

아래와 같은 테이블을 pd.read_html()을 이용해서 가져오는 예제입니다.

시가총액 3조 485억원
시가총액순위 코스피 109 위
상장주식수 868,530,000
액면가 l 매매단위 5,000원 l 1주
page = requests.get(url)
table = pd.read_html(StringIO(page.text), match='시가총액', encoding='utf-8')
0      시가총액    3조  485  억원
1    시가총액순위       코스피 109위
2     상장주식수      868530000
3  액면가l매매단위  5,000원  l  1주

현재 테이블은 복잡하지 않으므로 아래와 같이 바로 접근하여 데이타를 가져올 수 있습니다.
행과 열을 가끔 헷갈리는 경우가 많은데 아래와 같습니다.

  • Rows : horizontal - 행

  • Columns : vertical - 열

  • loc[n] : n 행 을 읽음

  • iloc[n] : n 열을 읽음

직접 데이타 조회하기

print('시가총액:', table[0].iloc[0, 1])
print('시가총액순위', table[0].iloc[1, 1])
print('상장주식수', table[0].iloc[2, 1])
print('액면가, 매매단위', table[0].iloc[3, 1])

위를 한줄로 하면

for i, row in table[0].iterrows():
    print(row.iloc[0], ':', row.iloc[1])

Table of contents 목차

평점을 남겨주세요
평점 : 5.0
총 투표수 : 1

질문 및 답글