我是python的新手,我想将数据分成一列,其中包括发行年份的电影名称到多列,因此我发现了分割功能。

数据按标题(年份)组织。

我在python中尝试过的是:

movies['title'].str.split('(', 1, expand = True)


以下情况发生了例外:


  失落儿童之城(The LaCitédes enfants perdus,La)(1999)
  
  失落儿童之城。洛杉矶儿童基金会(1999)


我原以为只有1999年)进入第二栏。

我需要你的帮助!

最佳答案

我投票赞成在这里使用re.findall(.*?) \((\d{4})\)模式:

input = """City of Lost Children, The (Cité des enfants perdus, La) (1999)
           City of Lost Children, The. Cité des enfants perdus, La) (1999)"""

matches = re.findall(r'\s*(.*?) \((\d{4})\)', input)
print(matches)


打印:

[('City of Lost Children, The (Cité des enfants perdus, La)', '1999'),
 ('City of Lost Children, The. Cité des enfants perdus, La)', '1999')]

关于python - python中的split()在有条件的情况下如何使用必须跳过某些值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56950011/

10-10 20:56