我需要从pdf中捕获一些数据并将其输入到excel文件中,但是要创建一个宏来组织单元格,我需要除“,”以外的其他字符。因为某些价值数据需要用“,”表示。有任何想法吗 ? (像“ /”或“-”之类的字符可以解决该问题)
当我将pdf转换为csv时,所有数据都位于一个单元格中,这就是为什么我需要使用宏的原因。
How my data is organized into excel
from tabula import read_pdf
from tabula import convert_into
convert_into("B.pdf", "BBBBB.csv", output_format="csv", pages=1,coding = 'latin-1',stream=True, guess = False ,
area = (306.9,253,379,570),
columns = (347,399.1,443.4,481.6,514.3,543.5,572))
最佳答案
如果要继续使用convert_into
,可以设置output_format="tsv"
,它将转换制表符分隔格式的表。 https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.wrapper.convert_into
除此之外,您可以使用read_csv
转换为DataFrame,然后将df.to_csv
与设置定界符一起使用。
关于python - 将表格分隔符更改为另一个字符,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58383642/