Pandas 기초

파이썬에서 표 형태의 데이터를 탐색하고 분석하는데 사용하는 판다스 라이브러리 사용법을 알아봅니다.


수강중

3. 파일 읽기/쓰기

동영상이 없는 텍스트 강의 자료입니다.

파일에서 데이터 프레임을 읽거나, 데이터 프레임을 파일로 쓰는 방법을 알아보겠습니다.

import pandas as pd

엑셀 파일 열기

데이터 프레임을 엑셀 파일에서 여는 방법을 알아보겠습니다. 엑셀 파일은 read_excel 함수로 엽니다.

df = pd.read_excel('census.xlsx')

첫 부분 보기

.head 메소드로 데이터 프레임의 첫 5행을 볼 수 있습니다.

df.head()
age workclass fnlwgt education education_num marital_status occupation relationship race sex capital_gain capital_loss hours_per_week native_country income
0 39 State-gov 77516 Bachelors 13 Never-married Adm-clerical Not-in-family White Male 2174 0 40 United-States <=50K
1 50 Self-emp-not-inc 83311 Bachelors 13 Married-civ-spouse Exec-managerial Husband White Male 0 0 13 United-States <=50K
2 38 Private 215646 HS-grad 9 Divorced Handlers-cleaners Not-in-family White Male 0 0 40 United-States <=50K
3 53 Private 234721 11th 7 Married-civ-spouse Handlers-cleaners Husband Black Male 0 0 40 United-States <=50K
4 28 Private 338409 Bachelors 13 Married-civ-spouse Prof-specialty Wife Black Female 0 0 40 Cuba <=50K

저장

엑셀 파일로 저장할 때는 .to_excel 메소드를 사용합니다.

df.to_excel('new.xlsx')

CSV로 저장할 때는 to_csv 메소드를 사용합니다.

df.to_csv('new.csv')

CSV 파일 열기

CSV를 열 때는 read_csv 함수를 사용합니다.

df2 = pd.read_csv('new.csv')