34 lines
1.2 KiB
Python
34 lines
1.2 KiB
Python
'''
|
||
Data:2017-07-13
|
||
Auther;JXNU Kerwin
|
||
Description:使用Pandas拼接多个CSV文件到一个文件(即合并)
|
||
'''
|
||
import pandas as pd
|
||
import os
|
||
# 要拼接的文件夹及其完整路径,注意不要包含中文
|
||
Folder_Path = "/home/dengzeyi/coding/sequence_dos/cicids2017/input"
|
||
SaveFile_Path = "/home/dengzeyi/coding/sequence_dos/cicids2017/input" # 拼接后要保存的文件路径
|
||
SaveFile_Name = "cicids-label.csv" # 合并后要保存的文件名
|
||
|
||
# 修改当前工作目录
|
||
os.chdir(Folder_Path)
|
||
# 将该文件夹下的所有文件名存入一个列表
|
||
file_list = os.listdir()
|
||
|
||
# 排序
|
||
file_list.sort()
|
||
|
||
# 读取第一个CSV文件并包含表头
|
||
print(file_list[0])
|
||
df = pd.read_csv(Folder_Path + '/' + file_list[0]) # 编码默认UTF-8,若乱码自行更改
|
||
|
||
# 将读取的第一个CSV文件写入合并后的文件保存
|
||
df.to_csv(SaveFile_Path+'/' + SaveFile_Name, encoding="utf_8", index=False)
|
||
|
||
# 循环遍历列表中各个CSV文件名,并追加到合并后的文件
|
||
for i in range(1, len(file_list)):
|
||
print(file_list[i])
|
||
df = pd.read_csv(Folder_Path + '/' + file_list[i])
|
||
df.to_csv(SaveFile_Path+'/' + SaveFile_Name, encoding="utf_8",
|
||
index=False, header=False, mode='a+')
|