我是python的新手,我想将数据分成一列,其中包括发行年份的电影名称到多列,因此我发现了分割功能。
数据按标题(年份)组织。
我在python中尝试过的是:
movies['title'].str.split('(', 1, expand = True)
以下情况发生了例外:
失落儿童之城(The LaCitédes enfants perdus,La)(1999)
失落儿童之城。洛杉矶儿童基金会(1999)
我原以为只有1999年)进入第二栏。
我需要你的帮助!
最佳答案
我投票赞成在这里使用re.findall
和(.*?) \((\d{4})\)
模式:
input = """City of Lost Children, The (Cité des enfants perdus, La) (1999)
City of Lost Children, The. Cité des enfants perdus, La) (1999)"""
matches = re.findall(r'\s*(.*?) \((\d{4})\)', input)
print(matches)
打印:
[('City of Lost Children, The (Cité des enfants perdus, La)', '1999'),
('City of Lost Children, The. Cité des enfants perdus, La)', '1999')]
关于python - python中的split()在有条件的情况下如何使用必须跳过某些值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56950011/