我有一个大型数据集,我正在尝试使用 SOM 进行聚类分析。数据集是 巨大的 (约数十亿条记录),我不确定神经元的数量和 SOM 网格大小应该是多少。任何关于估计神经元数量和网格大小的 Material 的指针将不胜感激。
谢谢!
最佳答案
我没有相关的引用资料,但我建议您从数据集中每个预期类别使用大约 10 个 SOM 神经元开始。例如,如果您认为您的数据集由 8 个独立的组件组成,请选择具有 9x9 神经元的 map 。不过,这完全只是一个大概的启发式方法。
如果您希望数据更直接地驱动 SOM 的拓扑,请尝试在训练期间更改拓扑的 SOM 变体之一:
不幸的是,这些算法比普通 SOM 涉及更多的参数调整,但它们可能适用于您的应用程序。
关于machine-learning - Kohonen 自组织映射 : Determining the number of neurons and grid size,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19163214/