통계 계산 :: Pandas 기초 - mindscale
Skip to content

통계 계산

판다스에서 통계 계산을 하는 방법을 알아보겠습니다.

먼저 판다스를 불러들이고, 예제 데이터를 엽니다.

import pandas as pd
df = pd.read_excel('census.xlsx')

통계 계산

합계

df['age'].sum()
1256257

평균

df['age'].mean()
38.58164675532078

중간값(중위수). 모든 값을 크기 순으로 정렬했을 때 한 가운데 위치한 값입니다.

df['age'].median()
37.0

최대

df['age'].max()
90

최소

df['age'].min()
17

분산. 분산은 데이터가 퍼진 정도를 나타내는 지표입니다.

df['age'].var()
186.06140024879625

표준편차.

df['age'].std()
13.640432553581146

표준편차를 제곱하면 분산이 됩니다.

df['age'].std() **2
186.06140024879628