尽管我拥有EE的背景,但是我没有机会参加自然语言处理类(class)。

我想为土耳其语构建情感分析工具。我认为最好是创建一个土耳其语wordnet数据库,而不是将文本翻译成英语,然后使用提供的工具通过错误的翻译文本进行分析。 (是吗?)

那么,你们推荐我做什么?首先要从开放式网站上学习NLP类(class)吗?我真的不知道从哪里开始。您能帮我,也许可以为我提供逐步指导吗?我知道这是一个学术项目,但我有兴趣建立该领域的业余爱好技能。

提前致谢。

最佳答案

这是我以前使用过的过程(制作日语,中文,德语和阿拉伯语语义网络):

  • 至少收集两个英语/土耳其语字典。它们必须是独立的,而不是彼此派生的。您可以使用Wikipedia自动生成您的词典之一。如果您需要发布网络,则可能需要开源词典,许可费或律师。
  • 使用这些词典来翻译英语Wordnet,从而为每个同义词集生成可信度等级。
  • 保留那些具有强烈信心的人员,手动批准或修复那些具有中等或低信心的人员。
  • 手动将其关闭

  • 我在2008年论文的“WordNet自动翻译”部分对此进行了扩展:http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

    (对于您指定的土耳其语情感词典的目标,还有其他方法,不涉及语义网络。例如,刘冰撰写的“语义分析和观点挖掘”是一个很好的研究综述。但是语义网络方法将,恕我直言,从长远来看始终会带来更好的效果,并且还有许多其他用途。)

    关于wordnet - 我如何开始建立土耳其语的词网以用于情感分析,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8641503/

    10-10 14:36