大众好,我是Python进阶者。
1、前言
前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题,问题如下: import zipfile
def unzip_file(zip_file_path, output_folder_path):
withzipfile.ZipFile(zip_file_path,r) as zip_ref:
zip_ref.extractall(output_folder_path)
# 运用示例
zip_file_path = example.zip
output_folder_path = output_folderunzip_file(zip_file_path, output_folder_path)以上代码解压的中文文件名是乱码,怎么处理?
2、实现过程
这儿【瑜亮老师】给了个思路如下:乱码是什么样子的?最好能传上来一个压缩包,咱们好实验。
过了几分钟,【瑜亮老师】弥补道:@fashjon 我查看了一下zipfile的源码,发掘是运用了cp437编码了文件名才引起的文件名错误。既然晓得了错误的编码,那样办法就很简单了,1修改源码,2自己写代码读取解压缩路径中的文件名,重新运用cp437编码而后用gbk解码,重命名文件名,问题处理。修改后的代码如下: import zipfile
import os
def unzip_file(zip_file_path, output_folder_path, encoding=gbk):
with zipfile.ZipFile(zip_file_path, r) as zip_ref:
zip_ref.extractall(output_folder_path)
# 遍历解压后的目录,检测并修正文件名
for root, dirs, files in os.walk(output_folder_path):
for bad_name in files:
# 假设这儿咱们晓得ZIP文件运用的是gbk编码(但实质状况可能区别)
if not bad_name.isascii(): # 倘若文件名包括非ASCII字符true_name = bad_name.encode(cp437).decode(encoding)
os.rename(os.path.join(root, bad_name), os.path.join(root, true_name))
# 运用示例
zip_file_path = example.zip
output_folder_path = output_folder
unzip_file(zip_file_path, output_folder_path)
不确定你的电脑里是不是安装pathlib,因此呢运用了os,顺利地处理了粉丝的疑问。
粉丝追问:解压文件用什么库比较好?
回答1:这方面我只晓得zipfile和代码调用winrar。平时很少接触匹量处理压缩包。
回答2:批量处理压缩包,直接wps批量解压就能够了;
回答3:何须wps,只要电脑上装的有任意解压软件,全选压缩包,右键,能够解压到一个文件夹,亦能够每一个压缩包单独生成一个文件夹。代码只不外方便遍历多层文件夹目录,倘若都在一个文件夹中,还不如右键点选更方便。
倘若你亦有类似这种Python关联的小问题,欢迎随时来交流群学习交流哦,有问必答!
3、总结
大众好,我是Python进阶者。这篇文案重点盘点了一个Python自动化办公的问题,文中针对该问题,给出了详细的解析和代码实现,帮忙粉丝顺利处理了问题。
最后感谢粉丝【fashjon】提出的问题,感谢【瑜亮老师】给出的思路,感谢【莫生气】等人参与学习交流。
【提问弥补】温馨提示,大众在群里提问的时候。能够重视下面几点:倘若触及到大文件数据,能够数据脱敏后,发点demo数据来(小文件的意思),而后贴点代码(能够复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字就可,代码超过50行这样的话,发个.py文件就行。
|