통계 계산
판다스에서 통계 계산을 하는 방법을 알아보겠습니다.
먼저 판다스를 불러들이고, 예제 데이터를 엽니다.
import pandas as pd
df = pd.read_excel('census.xlsx')
통계 계산
합계
df['age'].sum()
1256257
평균
df['age'].mean()
38.58164675532078
중간값(중위수). 모든 값을 크기 순으로 정렬했을 때 한 가운데 위치한 값입니다.
df['age'].median()
37.0
최대
df['age'].max()
90
최소
df['age'].min()
17
분산. 분산은 데이터가 퍼진 정도를 나타내는 지표입니다.
df['age'].var()
186.06140024879625
표준편차.
df['age'].std()
13.640432553581146
표준편차를 제곱하면 분산이 됩니다.
df['age'].std() **2
186.06140024879628