前几天通过_excel读取excel文件的时候遇到了一个bug,说xml格式不正确(无效标记):
刚刚开始我也非常郁闷,我读excel文件,又不是读xml文件,你为啥说xml错误,后来才意识到excel文件其实是zip压缩,里面有xml文件。
ailx10
网络安全优秀回答者
网络安全硕士
去咨询
使用wps打开这个excel文件是正常的,给wps点赞,然而使用微软的Excel2016打开的时候,就会报错:
在github上找到了相同的问题[1],这似乎是python的openpyxl库(或可能是xml库)的缺陷,然而在R语言上,我测试了一下,可以成功读取这个excel文件,现在压力给到pandas了。
参考^xlsxfileloader::notwellformed
发布于2024-04-0318:44・IP属地江苏





