我是编程的初学者,但是对于自然语言处理项目,我需要使用csv。
我有带注释文本的csv文件。句子之间用空行隔开。每行都是一个标记(带有注释的单词或标点符号)。我需要的是这样的嵌套列表[[[I,pronoun],[need, verb], [you, pronoun]], [[Do, verb], [you, pronoun], [need, verb], [me, pronoun]]]

文本在csv中如下所示:

I  pronoun
need  verb
you  pronoun

Do  pronoun
you  pronoun
need verb
me  pronoun


我尝试了以下代码,但随后我只得到一个大列表,而不是一个嵌套列表。我不知道如何将句子拆分为空白行。

 sentences = []
    for row in text:
        sentences.append(list(row))
 print(sentences)


有什么建议么?

最佳答案

你可以做类似的事情

sentences = []
with open('my_file.csv', 'r') as R:
  curr = [] # store current sentence
  for row in R:
    if len(row) == 0:
      # empty line
      sentences.append(curr) # add current sentence to pool
      curr = [] # start a new sentence
      continue
    curr.append(row.strip().split()) # assuming no leading 1. etc.


我正在使用strip删除行首/结尾的空白,并使用split将字符串(row)拆分为列表元素。

关于python - 将csv行插入嵌套列表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44909048/

10-12 00:02
查看更多