回复“书籍”即可获赠Python从入门到进阶共10本电子书

一共有近2600条类似格式的表格细栏,每个栏目包括的信息有:

  • 日期

  • 发文单位

  • 文号

  • 标题

  • 签收栏

需要提取其中加粗的这三项内容到Excel表格中存储,表格样式如下:


Python办公自动化|从Word到Excel-LMLPHP

仔细观察可以发现一个文件条目占据了3行,所以对表格全部行循环迭代时可以设步长为3

Python办公自动化|从Word到Excel-LMLPHP

注意观察表格,按照row和cell把所需内容解析清楚

  • strptime: 解析字符串中蕴含的时间

  • strftime: 转化成所需的时间格式

线程的最后记得保存

Python办公自动化|从Word到Excel-LMLPHP

最后附上完整代码,代码很简单,理清思路最重要

/今日留言主题/

随便说一两句吧~

本文分享自微信公众号 - Python爬虫与数据挖掘(crawler_python)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

08-30 23:38
查看更多