我在ELKI环境中使用OPTICS实施时遇到问题。我在DBSCAN实施中使用了相同的数据,它的工作原理很吸引人。可能我缺少了一些带有参数的东西,但我无法弄清楚,一切似乎都是正确的。

数据是一个简单的300х2矩阵,包含3个簇,每个簇有100个点。

DBSCAN结果:

Clustering result of DBSCAN

MinPts = 10,Eps = 1

光学结果:

Clustering result of OPTICS

MinPts = 10

最佳答案

您显然已经找到了解决方案,但这是一个很长的故事:

ELKI中的OPTICS类仅计算集群顺序/可达性图。

为了提取群集,您有不同的选择,其中之一(原始OPTICS出版物中的一个)在ELKI中可用。

因此,为了在ELKI中提取群集,您需要使用OPTICSXi算法,该算法将依次使用OPTICS或基于索引的DeLiClu来计算群集顺序。

在ELKI中将其分为两部分的原因可能是,以便您一方面可以实现另一种用于提取集群的逻辑,另一方面可以实现诸如DeLiClu之类的不同方法来计算集群顺序。这将与ELKI的模块化体系结构保持一致。

IIRC至少还有一种方法(显然在ELKI中还不是),它通过寻找局部最大值来提取簇,然后水平扩展它们直到到达山谷的尽头。还有另一种使用情节的“拐点”的人。

08-28 20:53