5、Excel文件批量合并
5.1 工具包
1
2
3
导入工具包
import pandas as pd
import os
5.2 获取文件列表
1
2
3
4
5
6
7
8
9
10
设置文件路径
path = 'C:/Users/yyz/Desktop/python办公技巧/data/数据合并/'
空列表, 用于存放文件路径
files = []
for file in os.listdir(path):
if file.endswith(".xlsx"):
files.append(path+file)
查看列表
files
5.3 转换存储数据
1
2
3
4
5
6
7
8
9
10
11
12
定义一个空的dataframe
data = pd.DataFrame()
遍历所有文件
for file in files:
datai = pd.read_excel(file)
datai_len = len(datai)
data = data.append(datai) # 添加到总的数据中
print('读取%i行数据,合并后文件%i列, 名称:%s'%(datai_len,len(data.columns),file.split('/')[-1]))
# 查看是否全部读取,格式是否出错
重置索引
data.reset_index(drop=True,inplace=True)
6、Word文件批量转pdf
只能转docx文件,转doc文件会报错, 工具包安装
1
pip install docx2pdf
6.1 导入工具包
1
2
3
4
安装工具包:
导入工具包
from docx2pdf import convert
import os
6.2 单个转换
1
2
单个转换
convert("c:/users/yyz/desktop/魔方公式.docx", "c:/users/yyz/desktop/excel笔记.pdf")
6.3 批量转换
1
2
3
4
5
6
7
8
9
10
11
文件位置
path = 'C:/Users/yyz/Desktop/python办公技巧/data/word转pdf/'
定义空list,存放文件列表
files = []
for file in os.listdir(path):
if file.endswith(".docx"):
files.append(path+file)
files
for file in files:
convert(file,file.split('.')[0]+'.pdf')
print(file+'转换成功')