我有一个包含64位整数列的csv文件,其中一些整数由于浮点精度问题而被截断。
下面是一个例子

id                       name
-----------------------------
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028000000000 'GSS Glasgow'
387028000000000 'GSS Glasgow'

前6位总是正确的,但有时余数是零。
对于正确和不正确的ID,第二列总是相同的。
我不能保证正确的id会在错误的id之前被解析,所以我在努力思考如何解决这个问题我真的很感激你的一些想法。
有6000行,有600个不同的“名称”。我可以用python,perl,php编程,我只需要想出一个防弹的方法。

最佳答案

把所有的行读成一个列表。
将列表按name分组。
在每个组中寻找正确的id并修复该组中所有损坏的ids。
保存列表。

关于algorithm - 修复损坏的表格数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/23277311/

10-11 02:32