我是编程的初学者,但是对于自然语言处理项目,我需要使用csv。
我有带注释文本的csv文件。句子之间用空行隔开。每行都是一个标记(带有注释的单词或标点符号)。我需要的是这样的嵌套列表[[[I,pronoun],[need, verb], [you, pronoun]], [[Do, verb], [you, pronoun], [need, verb], [me, pronoun]]]
文本在csv中如下所示:
I pronoun
need verb
you pronoun
Do pronoun
you pronoun
need verb
me pronoun
我尝试了以下代码,但随后我只得到一个大列表,而不是一个嵌套列表。我不知道如何将句子拆分为空白行。
sentences = []
for row in text:
sentences.append(list(row))
print(sentences)
有什么建议么?
最佳答案
你可以做类似的事情
sentences = []
with open('my_file.csv', 'r') as R:
curr = [] # store current sentence
for row in R:
if len(row) == 0:
# empty line
sentences.append(curr) # add current sentence to pool
curr = [] # start a new sentence
continue
curr.append(row.strip().split()) # assuming no leading 1. etc.
我正在使用
strip
删除行首/结尾的空白,并使用split
将字符串(row
)拆分为列表元素。关于python - 将csv行插入嵌套列表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44909048/