我试图在许多类别(日期,年份,时间,名称,标点符号,电子邮件等)中找到适合他们的单词类型。我当时正在编写自己的代码来检测此问题(并且可以工作),但是我发现了诸如ANTLR和JavaCC之类的库。
我想要做的是这些库的任务吗?如果是,我应该使用什么,如果没有,我可以使用一些东西吗?
有哪些建议? JavaCC,ANTRL还有更多吗?我看到JavaCC生成了一些类,但是有些事情我不希望它像令牌化那样。
最佳答案
取决于所需的解析器的功能。如果您需要功能非常强大的东西(例如JavaCC或ANTLR),请与它们一起使用,不要花费太多时间来尝试制作自己的东西。
如果您需要一些简单的内容,则可以构建一个简单的字典查找解析器,而该解析器只包含regular expressions in Java甚至是StringTokenizer(如果您的示例非常简单)。