pandas.. 정말 좋은 라이브러리라고 생각한다. 데이터 전처리하는데 정말 편리한 것 같다. 주석에 설명을 남겼다.
import pandas as pd
import glob
import os
input = '/Users/iyuchang/Downloads/전국제조업체다알아버리기' #병합할 파일들의 위치
output = '/Users/iyuchang/Downloads/전국제조업체다알아버리기/result.csv' #병합한 파일을 저장할 경로와 저장명
list = glob.glob(os.path.join(input, 'email_*')) #email로 시작하는 파일들을 배열안에 모아준다.
data = []
for x in list:
y = pd.read_csv(x,index_col = 0, encoding='CP949')
#한글 데이터가 있기에 encoding 설정해주고 index_col=0은 첫 번째 열을 기준으로 정렬
data.append(y)
res = pd.concat(data, axis=0, ignore_index=True)
# axis=0은 수직으로 병합 ignore_index=True는 기존의 index를 무시하고 순서대로 index 부여한다.
res.to_csv(output_file, index=True)
'Python' 카테고리의 다른 글
[django] Rest Framework tutorial #3 views - 2 (0) | 2021.05.06 |
---|---|
[django] Rest Framework tutorial #2 views - 1 (0) | 2021.05.03 |
[django] Rest Framework tutorial #1 Serialization (0) | 2021.04.26 |
[django] channels tutorial #2 (0) | 2021.04.16 |
[django] channels tutorial #1 (0) | 2021.04.14 |
댓글