我正在使用 unoconvdocx 转换为 pdf 。只要我通过文件名传递文档,一切都很好:

$ unoconv -f pdf --stdout test.docx

但是一旦我使用 --stdin 它就不再起作用了:
$ unoconv -f pdf --stdin --stdout < test.docx

Traceback (most recent call last):
  File "/usr/bin/unoconv", line 1275, in <module>
    main()
  File "/usr/bin/unoconv", line 1185, in main
    inputfn = sys.stdin.read()
  File "/usr/lib/python3.5/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xad in position 41: invalid start byte

这是同一个文件。为什么这不起作用?

这是文件:https://nofile.io/f/bKz1zWf745K/test.docx

最佳答案

我认为问题在于 --stdin 选项没有做人们可能认为的那样。

在错误消息中,第 1185 行中的变量名称看起来很可疑:

inputfn = sys.stdin.read()

事实上,检查 source code ,似乎从 STDIN 读取的文本被解释为文件名,而不是文件内容。

但是,文档( man unoconv )具有误导性:



这听起来真的不像将输入解释为文件名。

我建议你 file a bug report 关于这个(也许首先检查是否已经有一个)。

10-08 05:40