Pandas 기초

파이썬에서 표 형태의 데이터를 탐색하고 분석하는데 사용하는 판다스 라이브러리 사용법을 알아봅니다.


수강중

19. 설정 바꾸기

동영상이 없는 텍스트 강의 자료입니다.

pandas에서 몇 가지 옵션을 바꾸는 방법을 알아보겠습니다.

import pandas as pd

최대 및 최소 행 수

pandas 옵션들은 모두 pd.options 아래에 있습니다. pd.options.display.max_rows는 표를 출력할 때 최대 행 수입니다.

pd.options.display.max_rows
60

pd.options.display.min_rows는 표를 출력할 때 최소 행 수입니다.

pd.options.display.min_rows
10

다음과 같이 확인할 수도 있습니다.

pd.get_option('min_rows')
10

get_option은 옵션 이름의 일부만 일치해도 보여줍니다.

pd.get_option('min_r')
10

이들 설정 값을 바꿔서 출력될 표의 크기를 바꿀 수 있습니다. 예를 들어 최대 출력 행 수를 6행으로 제한합니다.

pd.options.display.max_rows = 6

다음과 같이 설정할 수도 있습니다.

pd.set_option('max_rows', 6)

set_option도 일부만 일치해도 설정이 됩니다.

pd.set_option('max_r', 6)

길이가 100행인 표를 출력해보면 6행까지만 출력됩니다.

df = pd.DataFrame({'x': range(100)})
df
x
0 0
1 1
2 2
... ...
97 97
98 98
99 99

100 rows × 1 columns

최대 열 수

비슷하게 pd.options.display.max_cols는 최대 열 수를 설정합니다. 단, 최소 열 수는 설정할 수 없습니다.

pd.options.display.max_columns
20

chop_threshold

chop_threshold에서 설정된 값보다 작은 수는 모두 0으로 표시합니다.

pd.options.display.chop_threshold = 0.99
pd.DataFrame({'x': [10, 1, 0.1]})
x
0 10.0
1 1.0
2 0.0

설정을 초기화할 때는 아래와 같이 합니다.

pd.reset_option('display.chop_threshold')

float_format

float_format에서는 실수를 출력하는 함수를 설정할 수 있습니다. 아래 람다 함수 lambda x: f'{x:.2f}'는 실수 x를 받아 소수점 둘째자리까지만 표현합니다.

pd.options.display.float_format = lambda x: f'{x:.2f}'
pd.DataFrame({'x': [3.1415]})
x
0 3.14

설정을 취소할 때는 아래와 같이 합니다.

pd.reset_option('display.float_format')

precision

precision은 소수점은 과학적 표기법으로 변환할 자릿수를 정합니다. 아래와 같이 하면 소수점 셋째 자리 밑으로는 과학적 표기법으로 표시합니다.

pd.options.display.precision = 3
pd.DataFrame({'x': [0.5], 'y': [0.0003]})
x y
0 0.5 3.000e-04

과학적 표기법으로 3.000e-04는 $3.000 \times 10^{-4}$을 의미합니다. 자릿수가 아주 작거나 큰 수를 표기할 때 유용합니다.