我已经在Google文档中创建了.docx
文档,
我想使用脚本来检测以下内容的元数据:
作者
标题
日期
我已经尝试了以下软件包,但由于这些软件包无法使用,因此我打开了一些问题:
office-document-properties
docx-extractor
如何从NodeJS中的Google文档.docx
文档中提取元作者和标题?
最佳答案
.docx文件只是其中包含其他文件的一个zip文件。只是找到一个可以解压缩的软件包/模块,然后查找包含所需数据的.xml
文件。 ;)您可以自己解压缩并看看。我使用7-zip进行了探索,并在docProps
子路径中找到了两个文件和一些文档数据:
app.xml
core.xml
我确定有很多选择,但是这里有一个:https://www.npmjs.com/package/unzip
如果您要从Google文档导出,则可能不包括该信息。
关于javascript - 如何从NodeJS中从Google文档导出的文档中提取元作者和标题?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58226865/