安装
pip install python-docx
1.建立新Word文档
建立新文档需要调用Document对象的save方法,
一个Document对象代表一个Word文档,该方法的参数是保存的文件名。
from docx import Document
doc = Document()
doc.save("test.docx")
2.添加段落和段落文字
调用Document对象的add_paragraph方法,返回值是一个Paragraph对象。
调用Paragraph对象的add_run方法为该段落添加文字。add_run方法的返回值是一个Run对象,需要设置该对象属性。
from docx import Document
doc = Document()
p = doc.add_paragraph('无格式的部分')
p.add_run('加粗部分').bold = True
p.add_run('无格式')
p.add_run('斜体部分').italic = True
doc.save(r".\test.docx")
无格式的部分加粗部分 无格式 斜体部分
3.读取文档的所有段落
Document对象的paragraphs属性是一个包含文档所有Paragraph对象的列表对象,
一个Paragraph对象代表文档的一个段落。对paragraphs属性进行循环遍历可以操作文档的所有段落。
Paragraph对象的text属性代表该段落的文字。
from docx import Document
doc = Document("./test.docx")
for p in doc.paragraphs:
print(p.text)
4.读取文档表格中的文字
Document对象的tables属性是一个包含文档所有Table对象的列表对象,
一个Table对象代表文档的一个表格。Table对象的cells属性是一个包含表格所有_Cell对象的列表
,一个_Cell对象代表表格的一个单元格。对表格的cells属性进行循环遍历可以操作表格的所有单元格。
_Cell对象的text属性代表该单元格的文字。
from docx import Document
doc = Document("./Python.docx")
for t in doc.tables:
for c in t._cells:
print(c.text)