我试图将字符串解析为字母,因此所有标点符号、数字、符号等都被视为分隔符。我的问题是:有很多非字母字符要划分。
有办法过滤所有这些字符吗?我的意思是有26个标准英文字母,如果你算上大写的话有52个。我知道ASCII/Unicode不是这样工作的,但是看起来应该有某种排他性方法,因为我可以提供所有我想允许的字符,并将ASCII/Unicode表中的其他所有字符都建立为分隔符。
所以我想我是在问,这样的事情有可能吗?你能隔离65-90和97-122(Unicode)范围之外的所有内容吗?
我目前正在使用这个作为分隔符字符串,虽然它捕获了可能需要捕获的95%的字符,但我希望有更实质性的内容:

#define DELIMITERS " 0123456789<>?:,./;'[]{}-=_+\\\""

最佳答案

通常的方法是使用regular expression,比如[^a-zA-Z]+

07-24 17:49
查看更多