import numpy as np
import pandas as pd
from scipy.stats.stats import pearsonr
from cvxpy import Variable, Problem, Maximize

X = np.random.rand(1000, 4)
Y = np.random.rand(1000, 4)
weights = Variable(4,)
constraints = []

def get_correlation(a):
    return pearsonr(X * a, Y *a)

obj = Maximize(get_correlation(weights))
problem = Problem(obj, constraints)
problem.solve()


我正在尝试使用cvxpy查找向量权重的值,以执行两个矩阵的线性转换。目标函数是两个变换矩阵之间的皮尔逊相关性的最大化。

我不明白为什么会出现以下错误。

      4 def get_correlation(a):
----> 5     return pearsonr(X * a, Y *a)
      6
      7 obj = Maximize(get_correlation(weights))

~/Python/global/lib/python3.6/site-packages/scipy/stats/stats.py in pearsonr(x, y)
   3030     x = np.asarray(x)
   3031     y = np.asarray(y)
-> 3032     n = len(x)
   3033     mx = x.mean()
   3034     my = y.mean()

TypeError: len() of unsized object

最佳答案

您的错误是因为pearsonr希望传递两个数组,例如输入xy

您在代码中创建了数组XY,是的。但是,如果您检查X * weights的类型(这实际上是您传递给pearsonr的内容),您会看到它具有类型cvxpy.atoms.affine.binary_operators.MulExpression,它没有长度属性,因此len(X * weights)会抛出一个错误。

08-20 02:18