我对执行多维缩放后的特征值感兴趣。什么功能可以做到这一点?我看了documentation,但它根本没有提到特征值。
这是一个代码示例:
mds = manifold.MDS(n_components=100, max_iter=3000, eps=1e-9,
random_state=seed, dissimilarity="precomputed", n_jobs=1)
results = mds.fit(wordDissimilarityMatrix)
# need a way to get the Eigenvalues
最佳答案
我也无法通过阅读文档找到它。我怀疑他们没有执行classical MDS,而是更复杂的操作:
“现代多维比例缩放-理论与应用”,博格,I .; Groenen P.Springer统计资料系列(1997)
“非度量多维缩放:一种数值方法”,Kruskal,J.Psychometrika,29(1964)
“通过优化对非度量假设的拟合优度来进行多维缩放”,Kruskal,J. Psychometrika,29,(1964)
如果您正在寻找每个经典MDS的特征值,那么不难获得它们。这些步骤是:
获取您的距离矩阵。然后将其平方。
执行双重定心。
查找特征值和特征向量
选择前k个特征值。
您的第i个主要成分是sqrt(eigenvalue_i)* eigenvector_i
参见下面的代码示例:
import numpy.linalg as la
import pandas as pd
# get some distance matrix
df = pd.read_csv("http://rosetta.reltech.org/TC/v15/Mapping/data/dist-Aus.csv")
A = df.values.T[1:].astype(float)
# square it
A = A**2
# centering matrix
n = A.shape[0]
J_c = 1./n*(np.eye(n) - 1 + (n-1)*np.eye(n))
# perform double centering
B = -0.5*(J_c.dot(A)).dot(J_c)
# find eigenvalues and eigenvectors
eigen_val = la.eig(B)[0]
eigen_vec = la.eig(B)[1].T
# select top 2 dimensions (for example)
PC1 = np.sqrt(eigen_val[0])*eigen_vec[0]
PC2 = np.sqrt(eigen_val[1])*eigen_vec[1]