我最近遇到了“拓扑数据分析”(TDA),它是一种可视化大型数据集的独特方式。这是斯坦福大学的一篇论文,结尾是示例输出。
我想产生类似的结果,但在安装包、加载示例数据、然后执行几行(如https://research.math.osu.edu/tgda/mapperPBG.pdf示例)的网络上,很难找到可运行的代码。我的语言偏好是python,但也可以使用r。
有没有人能够通过TDA获得牵引力,如果有,有没有关于如何启动和运行代码的建议?

最佳答案

有一个新的R包:
TDA: Statistical Tools for Topological Data Analysis
这个包提供了用于持久同源性统计分析和密度聚类的工具。
写得很好的小插曲可以在这里找到:Introduction to the R package TDA
摘要
我们提供了一个简短的教程和使用R包的介绍
TDA为拓扑数据分析提供了一些工具。在
特别是,它包括一些函数的实现,
数据,提供有关底层空间的拓扑信息,例如
作为距离函数,测量距离,knn密度
估计量、核密度估计量和核距离。这个
子级集(或超级集)的显著拓扑特征
这些函数中的一个可以用持久的同源性来量化。我们
为C++的高效算法提供R接口
图书馆Gudhi、Dionysus和Phat,包括
持久同源的RIPS过滤,和一个持久的
任意函数的子级集(或超级集)的同调性
在网格点上计算。特征的意义
产生的持久性图可以用以下函数进行分析:
实施Fasy、Lecci、Rinaldo、Wasserman中讨论的方法,
Balakrishnan和Singh(2014年)、Chazal、Fasy、Lecci、Rinaldo和
Wasserman(2014c)和Chazal、Fasy、Lecci、Michel、Rinaldo和
瓦瑟曼(2014a)。R包TDA还包括实现
一种密度聚类算法,它允许我们识别
概率质量的空间组织与
密度函数,并通过树形图将其可视化,
簇树。

08-07 17:08