我需要从pdf中捕获一些数据并将其输入到excel文件中,但是要创建一个宏来组织单元格,我需要除“,”以外的其他字符。因为某些价值数据需要用“,”表示。有任何想法吗 ? (像“ /”或“-”之类的字符可以解决该问题)

当我将pdf转换为csv时,所有数据都位于一个单元格中,这就是为什么我需要使用宏的原因。
How my data is organized into excel

from tabula import read_pdf
from tabula import convert_into
convert_into("B.pdf", "BBBBB.csv", output_format="csv", pages=1,coding = 'latin-1',stream=True, guess = False ,
         area = (306.9,253,379,570),
         columns = (347,399.1,443.4,481.6,514.3,543.5,572))

最佳答案

如果要继续使用convert_into,可以设置output_format="tsv",它将转换制表符分隔格式的表。 https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.wrapper.convert_into
除此之外,您可以使用read_csv转换为DataFrame,然后将df.to_csv与设置定界符一起使用。

关于python - 将表格分隔符更改为另一个字符,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58383642/

10-09 00:58