Python openpyxl的一些坑

现在的新冠疫情是个大事,咱们要响应国家号召不出门,在家没事做,于是开始写Python。因为自己每个月都要改报表,所以首先想写一个批量给Excel改格式的小东西。写的过程中开始才开始研究Python的语法和库类,从xlrd和xlwr看到openpyxl,最终决定用openpyxl实现。


写的时候踩了不少坑,有的坑是找了很多资料都没人提到过的,感觉还是写下来比较好,一是记录一下以后不再重复踩坑,二是给有类似需求的同学提个醒,能省好多时间啊。


1、首先openpyxl里只能操作xlsx文件,如果是xls文件,要记得给他转过来,下面这段代码是网上抄的,可以用。

def xls2xlsx(filePath):

    excelobj = win32.gencache.EnsureDispatch('Excel.Application')

    wb = excelobj.Workbooks.Open(filePath)

     # xlsx: FileFormat = 51

     # xls: FileFormat=56,

     # print(strExcelFilePath +"x")

     wb.SaveAs(filePath + "x", FileFormat=51)

     wb.Close()excelobj.Application.Quit()

以上是从Python 批量将xls文件转换为xlsx - 简书这篇文章里抄的。


2、openpyxl给了删除行的方法,也就是deleterow。deleterow执行以后,下面的行会自动上移。但是经我测试,这跟直接在Excel里删除并上移行不一样。在Excel里,直接删除一行,下面单元格在上移的过程中,会同时修改自己公式的引用范围(如果有公式的话)。

举个例子,假设第十行有A10单元格,A10单元格的公式为A10=B10+C10,我们在Excel里操作,把A10上面的第九行的整行删除以后,原来A10单元格就跑去A9了,公式同时也会相应变成A9=B9+C9。

执行deleterow的区别在于:行上去了,但是公式的引用范围是不会变的,也就是说,原来是A10现在是A9的这个单元格,公式还是B10+C10。这样一来,如果下面行的单元格里有公式,直接deleterow就是灾难啊~

目前这个坑还没想到解决方案……


3、openpyxl里提供了实现首行冻结的方法,也就是

freeze_panes = '单元格坐标'

freeze_panes可以冻结输入单元格坐标上面和左面的部分,比如如果需要冻结首行,输入的就是A1。

但是下面神坑来了:冻结首行没问题,但是必须在你打开Excel时看到的是表单第一行第一列是才生效,如果默认 打开时不是显示第一样第一列,Excel会出现让人费解的“吃行吃列不显示”的bug。

所以,如若要实现冻结首行,一定一定要先把默认打开显示设置为第一行第一列,也就是这句:

sheet_view.topLeftCell = 'A1'

把打开时显示的最左和最上的单元格设置为A1,就解决问题了。我翻了半天也没找到类似问题的描述,因为吃行吃列的bug都快抑郁了,最后一路靠print断点才隐约找到问题所在,顺腾摸瓜才算搞定,这篇博客可以说就是为了这个语句写的,眼泪哗哗的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。