回复“书籍”即可获赠Python从入门到进阶共10本电子书
一共有近2600条类似格式的表格细栏,每个栏目包括的信息有:
日期
发文单位
文号
标题
签收栏
需要提取其中加粗的这三项内容到Excel表格中存储,表格样式如下:
仔细观察可以发现一个文件条目占据了3行,所以对表格全部行循环迭代时可以设步长为3
注意观察表格,按照row和cell把所需内容解析清楚
strptime:
解析字符串中蕴含的时间strftime:
转化成所需的时间格式
线程的最后记得保存
最后附上完整代码,代码很简单,理清思路最重要
/今日留言主题/
随便说一两句吧~
本文分享自微信公众号 - Python爬虫与数据挖掘(crawler_python)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。