본문 바로가기
Python

[pandas] 여러개의 csv 파일 하나로 합치기

by reo.l 2021. 6. 8.

pandas.. 정말 좋은 라이브러리라고 생각한다. 데이터 전처리하는데 정말 편리한 것 같다. 주석에 설명을 남겼다.

 

import pandas as pd
import glob
import os

input = '/Users/iyuchang/Downloads/전국제조업체다알아버리기' #병합할 파일들의 위치
output = '/Users/iyuchang/Downloads/전국제조업체다알아버리기/result.csv' #병합한 파일을 저장할 경로와 저장명

list = glob.glob(os.path.join(input, 'email_*')) #email로 시작하는 파일들을 배열안에 모아준다.
data = [] 
for x in list:
    y = pd.read_csv(x,index_col = 0, encoding='CP949') 
    #한글 데이터가 있기에 encoding 설정해주고 index_col=0은 첫 번째 열을 기준으로 정렬
    data.append(y) 

res = pd.concat(data, axis=0, ignore_index=True) 
# axis=0은 수직으로 병합 ignore_index=True는 기존의 index를 무시하고 순서대로 index 부여한다.
res.to_csv(output_file, index=True)

댓글