我已经在Google文档中创建了.docx文档,

我想使用脚本来检测以下内容的元数据:


作者
标题
日期


我已经尝试了以下软件包,但由于这些软件包无法使用,因此我打开了一些问题:


office-document-properties
docx-extractor


如何从NodeJS中的Google文档.docx文档中提取元作者和标题?

最佳答案

.docx文件只是其中包含其他文件的一个zip文件。只是找到一个可以解压缩的软件包/模块,然后查找包含所需数据的.xml文件。 ;)您可以自己解压缩并看看。我使用7-zip进行了探索,并在docProps子路径中找到了两个文件和一些文档数据:


app.xml
core.xml


我确定有很多选择,但是这里有一个:https://www.npmjs.com/package/unzip

如果您要从Google文档导出,则可能不包括该信息。

关于javascript - 如何从NodeJS中从Google文档导出的文档中提取元作者和标题?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58226865/

10-09 23:32
查看更多