我正在查看具有纬度,经度和事件日期/时间的数据点。在查看集群算法时遇到的算法之一是DBSCAN。尽管它可以对lat和lng进行聚类,但我担心的是,合并时域信息时,它会崩溃,因为它的规模或距离类型不同。

将时间数据合并到DBSCAN算法中,我有哪些选择?

最佳答案

查找同一作者的广义DBSCAN。



对于(通用)DBSCAN,您需要两个功能:

  • findNeighbors-从数据库中获取所有“相关”对象
  • corePoint-决定此设置是否足以启动群集

  • 那么您就可以反复寻找邻居来扩大集群。

    例如,您可以使用功能1来使用两个阈值:一个是地理阈值,另一个是时间阈值(即100英里以内,1小时以内)。

    关于machine-learning - 使用空间和时间数据的DBSCAN,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30603256/

    10-13 03:07