浏览了一些有关协作过滤的教程,我发现它主要用于电影和书本推荐,以及具有用户和他们所评价项目的数据集。当然,每个项目的评分范围是相同的(例如1-10)。但是,如果我有一个具有不同范围的数据集怎么办。意思是一个完全不同的数据集,它与人们对项目的评分方式无关,而是基于人们的病历。我正在考虑将记录中的功能(如BMI,体重,身高等)用作项目,将用户用作该记录的人。基本上在过程结束时,我想根据已经有预定输出的其他记录来确定一个人是否患有疾病。我知道在神经网络中通常/很容易做到这一点。但是我真的很想知道在协作过滤中是否也有可能。还是不是?
最佳答案
这不是推荐问题,这是经典分类,仅此而已。神经网络只是数十种可能的方法之一,但是再一次-它不是协作过滤,而是分类的确切定义方式。在协作式过滤中,您不知道正确的答案(标签/输出)-您只是尝试找到一些常见的模式。在进行疾病检测/预测的情况下,您确切知道应该输出什么。
如果您可能的疾病和相关疾病的范围非常广,并且只有很少的人,则可以在此处使用推荐系统(因此,不可能为灾难构建实际的培训集)。这样的话,寻找潜在健康问题的“建议”就很有意义了。对于带标签的二进制输出数据,它只是一个分类。即使,您可能最终会得到以下模型:“如果肥胖,那么您很可能会心脏病发作”等。因此,请在相似的诊断之间找到相关性。
关于machine-learning - 可以将协作过滤应用于疾病检测吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18738505/