This question was migrated来自软件工程堆栈交换,因为它可以在堆栈溢出时得到响应。
Migrated6年前。
我想在ppt文件中获取内容(仅文本)。怎么做?
(如果我想在txt文件中获取内容,我只需要打开并阅读。我需要做什么才能从ppt文件中获取信息?)
顺便说一下,我知道windows系统中有一个win32com。但现在我在linux上工作,有什么可能的方法吗?

最佳答案

我在Superuser上发现了这个讨论:
Command line tool in Linux to Extract Text From Word, Excel, Powerpoint?
这里列出了几个合理的答案,包括使用LibreOffice(以及.doc.docx.pptx等)和Apache Tika Project(在这个解决方案空间中似乎是5000磅的大猩猩)。

关于python - 如何使用python读取ppt文件?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/13565542/

10-11 21:32