我有以下输入数据。
我可以为除最后一个字段以外的所有其他字段创建嵌套列表。最后一个字符串字段也可以在单词之间包含空格(例如:Hello!welcome)。

input  = ['a1 a2 a3 a4 Hello! welcome','b1 b2 b3 b4 how are you','c1 c2 c3 c4 you are welcome']


电流输出:

[['a1', 'a2', 'a3', 'a4', 'Hello!', 'welcome'],
 ['b1', 'b2', 'b3', 'b4', 'how', 'are', 'you'],
 ['c1', 'c2', 'c3', 'c4', 'you', 'are', 'welcome']]


预期产量:

[['a1', 'a2', 'a3', 'a4','Hello! welcome'],
 ['b1', 'b2', 'b3', 'b4','how are you'],
 ['c1', 'c2', 'c3', 'c4','you are welcome']]


下面的代码行产生如上所述的当前输出,但是我需要转换代码才能获得预期的结果。任何人都可以让我知道达到预期结果的方法。

for ix in range(len(input) ):
    nested.append(input[ix:ix + 1])

for i in range(len(nested)):
    list1.append(nested[i][0].split())

最佳答案

您可以将re.split用于此目的:

import re

input  = ['a1 a2 a3 a4 Hello! welcome','b1 b2 b3 b4 how are you','c1 c2 c3 c4 you are welcome']

res=[re.split(" ", el, maxsplit=4) for el in input]

print(res)


输出:

[['a1', 'a2', 'a3', 'a4', 'Hello! welcome'], ['b1', 'b2', 'b3', 'b4', 'how are you'], ['c1', 'c2', 'c3', 'c4', 'you are welcome']]

[Program finished]


参考:https://docs.python.org/2/library/re.html

08-06 01:44
查看更多