有人能给我指一下关于“令牌后缀树”的教程吗。

最佳答案

从同一个短语和第一个结果的扫描中,我猜他们正在谈论一个后缀树,其中“字母”(或“字符”或“元素”)不是我们所习惯的单个ASCII或Unicode字符,而是一些计算机语言的词汇标记。
例如,对于c,有一个“字母”叫做int,另一个字母叫做(,依此类推。我不确定如何处理其他令牌的子序列(例如+++的子序列)的令牌,但我的猜测是,它们的处理方式与lexer处理它们的方式相同,即(至少对于C)总是贪婪地构建最长的令牌(例如,5个输入字符+++++将被lexed为+++++)。

关于algorithm - token 后缀树教程,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/1754641/

10-08 22:12