我一直在遵循this guide here来区分Microsoft Word文档,但是遇到了这个错误:

Usage:  /usr/bin/docx2txt.pl [infile.docx|-|-h] [outfile.txt|-]
        /usr/bin/docx2txt.pl < infile.docx
        /usr/bin/docx2txt.pl < infile.docx > outfile.txt

        In second usage, output is dumped on STDOUT.

        Use '-h' as the first argument to get this usage information.

        Use '-' as the infile name to read the docx file from STDIN.

        Use '-' as the outfile name to dump the text on STDOUT.
        Output is saved in infile.txt if second argument is omitted.

Note:   infile.docx can also be a directory name holding the unzipped content
        of concerned .docx file.

fatal: unable to read files to diff

要解释我是如何发生该错误的:我在要与之区别的存储库中创建了一个.gitattributes。 .gitattributes看起来像这样:
*.docx diff=word
*.docx difftool=word

我已经安装了docx2txt。我在Linux上。我创建了一个名为docx2txt的文件,其中包含以下内容:
#!/bin/bash
docx2txt.pl $1 -

$ chmod a+x docx2txt并将docx2txt放在/usr/bin/

我做了:
$ git config diff.word.textconv docx2txt

然后尝试区分两个Microsoft Word文档。那是我收到上面提到的错误的时间。

我想念什么?我该如何解决此错误?

PS:我不知道我的 shell 是否可以找到docx2txt,因为当我这样做时:
$ docx2txt

我的终端死机,处理了一些东西,但是什么也没输出,当我执行以下命令时,会发生这种情况:
$ man docx2txt
No manual entry for docx2txt
$ docx2txt --help
Can't read docx file <--help>!

更新进度:我将docx2txt更改为
#!/bin/bash
docx2txt.pl "$1" -

正如pmod所建议的那样,现在git diff <commit>可从命令行运行!耶!
但是,当我尝试
$ git difftool <commit>

git启动kdiff3,然后出现此 pop 错误:
Some input characters could not be converted to valid unicode.
You might be using the wrong codec. (e.g. UTF-8 for non UTF-8 files).
Don't save the result if unsure. Continue at your own risk.
Affected input files are in A, B.

...并且文件中的所有字符都是巨型字符。命令行可以正确显示diff文本,但是由于某些原因kdiff3不能正确显示diff文本。

如何在kdiff3或其他gui工具中正确显示差异文本?我应该将kdiff3更改为其他工具吗?

额外的:由于以下命令,我的shell似乎无法找到docx2txt:
$ which doctxt
which: no doctxt in (/usr/local/sbin:/usr/local/bin:/usr/bin:/usr/lib/jvm/default/bin:/usr/bin/site_perl:/usr/bin/vendor_perl:/usr/bin/core_perl)

$ which docx2txt
/usr/bin/docx2txt

最佳答案

期望根据用法精确地使用两个参数或零。在第一个(您的)情况下,参数是文件名或“-”。因此,对于文件名中至少有一个空格作为第一个参数传递的情况,您的包装器脚本看起来是正确的。在这种情况下,扩展 $ 1后,文件名部分将作为单独的参数传递,因此该工具将输出使用情况信息,因为它读取的参数超过2个。

尝试使用引号来避免文件名拆分:

#!/bin/bash
docx2txt.pl "$1" -



你可以用
$ which docx2txt

如果看到路径,则可以找到工具(二进制或可运行脚本)(基于PATH环境变量)。



如果不带参数,您的脚本将执行 doc2txt.pl-,根据工具的使用情况,它期望输入文件通过STDIN传递,即您输入的内容。因此,它看起来像是挂起并处理某些东西,但实际上仅捕获了您的输入。

关于git - 在git中如何区分Microsoft Word文档?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34023396/

10-13 07:34