我一直在研究PDF文件,以了解其构建方式。
我注意到InDesign已创建了如下文本的PDF(使用pdftk解压缩后)。
0 Tc /Span<</ActualText<FEFF0009>>> BDC
4.018 -0.2 Td
( )Tj
我了解ActualText的作用(用于复制/粘贴/搜索),但我想知道我应该如何解释FEFF0009。看起来像带有BOM字符的UTF-16字符串,代表制表符。这似乎是不正确的,因为它确实是一个空间。我想知道这里是否有特殊含义?
最佳答案
..这似乎是不正确的,因为它确实是一个空间。
不,这真的是一个标签。
14.9.4替换文字
注1:正如可以为图像和其他不能自然翻译为文本的项目提供替代描述一样(如上一条款所述),可以为确实翻译为文本但以非标准方式。
(PDF 32000-1:2008)
PDF文本引擎不支持“标签”的概念。在这种情况下,InDesign通过在文本流中插入一个空格来模仿制表符的功能,它可以设置空格宽度以匹配原始制表符所跨越的距离,或者对其余文本使用较大的相对位置(它在这里所做的:您的代码段中4.018
的水平位移)。
通常的想法是在选项卡的位置上呈现一个空格,但是当您复制此文本并将其粘贴到其他位置时,您会得到一个选项卡字符。我想插入“空格”只是为了复制某些内容。