非常简单,
如果我在Python中对高维数据执行t-SNE,那么我将获得2或3个反映每个新点的坐标。
但是如何将它们映射到原始ID?
我能想到的一种方法是,如果索引始终保持固定,那么我可以这样做:
在t-SNE中选择一个点
查看t-SNE中的哪一行(例如索引7)
转到原始数据,然后选择行/索引7。
但是,我不知道如何检查它是否真的有效。我的数据是超高维度的,很难通过常规的“健全性检查”来理解。
非常感谢!
最好,
最佳答案
如果您使用的是sklearn的t-SNE,则您的假设是正确的。输入的顺序与输出的顺序匹配。因此,如果执行y=TSNE(n_components=n).fit_transform(x)
,则y
和x
的顺序相同,因此y[7]
将成为x[7]
的嵌入。您可以相信scikit-learn会是这种情况。