Pandas 기초

파이썬에서 표 형태의 데이터를 탐색하고 분석하는데 사용하는 판다스 라이브러리 사용법을 알아봅니다.


수강중

5. 통계 계산

동영상이 없는 텍스트 강의 자료입니다.

판다스에서 통계 계산을 하는 방법을 알아보겠습니다.

먼저 판다스를 불러들이고, 예제 데이터를 엽니다.

import pandas as pd
df = pd.read_excel('census.xlsx')

통계 계산

합계

df['age'].sum()
1256257

평균

df['age'].mean()
38.58164675532078

중간값(중위수). 모든 값을 크기 순으로 정렬했을 때 한 가운데 위치한 값입니다.

df['age'].median()
37.0

최대

df['age'].max()
90

최소

df['age'].min()
17

분산. 분산은 데이터가 퍼진 정도를 나타내는 지표입니다.

df['age'].var()
186.06140024879625

표준편차.

df['age'].std()
13.640432553581146

표준편차를 제곱하면 분산이 됩니다.

df['age'].std() **2
186.06140024879628