为了完成一个简单的二元分类任务,我已经训练了一个Doc2Vec模型,但我也很想看看哪些单词或句子对给定文本的意义贡献更大。到目前为止,我找不到任何相关或有帮助的东西。有什么办法可以实现这个功能吗?我应该从Doc2Vec转换到更传统的方法,如tf-idf?

最佳答案

你在问模型的可解释性。我从以下几个方面了解到:
根据您的分类器,模型的参数可能会告诉您它在看什么。例如,在基于注意力的模型中,模型关注的是说明问题的。
LimeAnchor这样的工具对于任何黑盒模型都是有用的,并且在这种情况下可能会工作。两者的文档都显示了如何将其与文本数据一起使用。

关于python - 如何通过Doc2Vec查找文档中最具决定性的句子或单词?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51798248/

10-11 13:14