我对基于因变量和自变量之间关系的具有一维输出的二维输入数据进行聚类感兴趣。
例如,如果2个独立维是x,y,因变量是z,并且(x,y)和z之间的关系在xy空间中的不同区域不同;我想对数据进行聚类,以使xy空间中与z表现出相同功能关系的区域归为一类。 xy空间和z之间可能存在的功能关系是未知的先验。

最好是有人可以向我提供哪些机器学习技术的指导/参考,这些机器学习技术可以按原样使用或进行修改以适合此问题。

最佳答案

这个问题没有很好的答案,因为这是聚类和分类技术之间整个杂交领域的核心概念。结果,已经提出了数十种方法,从对初始数据进行聚类(在您的情况下为整个XYZ空间),到对每个聚类中分类模型的可能行为进行独立分析,再到将两个过程完全合并为一个大的优化问题。在我看来,它几乎和询问“我有一个(x,f(x))形式的数据并想要重构“ f”,我该怎么做?”一样宽。

因此,对于与聚类和分类混合相关的任何内容,参考文献都将成为谷歌搜索工具,因为您所要解决的问题等同于找到一个良好的聚类以建模(部分)独立的分类/回归任务。

当然,如果您对这种功能关系的形式有所了解,那么整个问题就很容易解决。例如,如果您知道函数关系或多或少是高斯函数,则可以简单地将一些高斯混合模型拟合到数据中。在一般情况下,给定有关函数的知识,EM(期望最大化)将是一个不错的选择。

关于machine-learning - 基于自变量和因变量之间的关系模式对数据进行聚类,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20012248/

10-13 00:06