在Python3.6中,我使用这个regex模式删除emojis:
emoji_pattern = re.compile(u"["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"]", flags= re.UNICODE)
。
因为它看起来不像上面的代码,而且在regex101中不工作,所以我想知道如何将它放入模式中,谢谢!
编辑:
如前所述,这是一个例子(这里不显示emoji)
mot = '⚡'
mot = emoji_pattern.sub('', mot)
print(mot)
And i'll see the emoji
最佳答案
。
"\u2600-\u26FF" # Unicode Block 'Miscellaneous Symbols'
。。
当前版本的Python在字符串文本中支持unicode,因此您可以简单地在regex中使用实际的字符。
>>> re.sub('⚡', ':zap:', 'AC⚡DC')
'AC:zap:DC'