有人能给我指一下关于“令牌后缀树”的教程吗。
最佳答案
从同一个短语和第一个结果的扫描中,我猜他们正在谈论一个后缀树,其中“字母”(或“字符”或“元素”)不是我们所习惯的单个ASCII或Unicode字符,而是一些计算机语言的词汇标记。
例如,对于c,有一个“字母”叫做int
,另一个字母叫做(
,依此类推。我不确定如何处理其他令牌的子序列(例如+
是++
的子序列)的令牌,但我的猜测是,它们的处理方式与lexer处理它们的方式相同,即(至少对于C)总是贪婪地构建最长的令牌(例如,5个输入字符+++++
将被lexed为++
,++
,+
)。
关于algorithm - token 后缀树教程,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/1754641/