到目前为止,当我尝试使用表情符号和POS标记器时,它显示为未知符号,小盒子。有没有办法让POS标记器与表情符号配合使用?表情符号与code Unicode版本相同。
最佳答案
如果字符编码在整个代码,系统和Stanford CoreNLP代码中都是正确的,则表情符号应正确表示。但是,您将遇到另外两个基本问题:
首先,表情符号是一个字符长,除了不确定的文章外,它们不太可能被标记为其他任何东西。英语中的“ a”。一个智能的令牌生成器可能更好地理解表情符号,但我对此表示怀疑。
其次,更重要的是,POS标记器注释parts of speech。表情符号不是语音的一部分。至少,它们是独立的,新的令牌类别,但肯定不是语法上的。
所有这些...您知道他们的字符代码...他们已经被标记了。
关于java - Stanford CoreNLP和Emoji😀?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41879957/