问题:我似乎无法解析文本文件中的信息,因为python将其读取为完整字符串,而不是单独的字符串。每个变量之间的空格不是a\t,这就是为什么它不分开的原因。有没有一种方法可以灵活地删除空格并用逗号或T代替呢?
示例数据:
MOR125-1 MOR129-1 0.587
MOR125-1 MOR129-3 0.598
MOR129-1 MOR129-3 0.115
我使用的代码:
with open("Distance_Data_No_Bootstrap_RAW.txt","rb") as f:
reader = csv.reader(f,delimiter="\t")
d=list(reader)
for i in range(3):
print d[i]
输出:
['MOR125-1 MOR129-1 0.587']['MOR125-1 MOR129-3 0.598']['MOR129-1 MOR129-3 0.115']
期望输出:
['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']
最佳答案
您可以简单地将分隔符声明为空格,并要求csv跳过分隔符后面的初始空格。这样,分隔符实际上就是正则表达式' +'
,即一个或多个空格。
rd = csv.reader(fd, delimiter=' ', skipinitialspace=True)
for row in rd:
print row
['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']