我有一个包含 20 个实数的向量 X 和一个包含 20 个实数的向量 Y。

我想将它们建模为

y = ax^2+bx + c

如何找到 'a' 、 'b' 和 'c' 的值
和最佳拟合二次方程。

给定值
X = (x1,x2,...,x20)
Y = (y1,y2,...,y20)

我需要一个公式或程序来找到以下值
a = ???
b = ???
c = ???

提前致谢。

最佳答案

@Bartoss 说的一切都是对的,+1。我想我只是在这里添加了一个实际的实现,没有 QR 分解。您想要评估 a、b、c 的值,以使测量数据和拟合数据之间的距离最小。您可以选择作为度量

sum(ax^2+bx + c -y)^2)

其中总和超过向量 x,y 的元素。

那么,最小值意味着该量相对于 a、b、c 中的每一个的导数为零:
d (sum(ax^2+bx + c -y)^2) /da =0
d (sum(ax^2+bx + c -y)^2) /db =0
d (sum(ax^2+bx + c -y)^2) /dc =0

这些方程是
2(sum(ax^2+bx + c -y)*x^2)=0
2(sum(ax^2+bx + c -y)*x)  =0
2(sum(ax^2+bx + c -y))    =0

除以2,上面的可以改写为
a*sum(x^4) +b*sum(x^3) + c*sum(x^2) =sum(y*x^2)
a*sum(x^3) +b*sum(x^2) + c*sum(x)   =sum(y*x)
a*sum(x^2) +b*sum(x)   + c*N        =sum(y)

在你的情况下 N=20 在哪里。下面是一个简单的 Python 代码,显示了如何执行此操作。
from numpy import random, array
from scipy.linalg import solve
import matplotlib.pylab as plt
a, b, c = 6., 3., 4.
N = 20
x = random.rand((N))
y = a * x ** 2 + b * x + c
y += random.rand((20)) #add a bit of noise to make things more realistic

x4 = (x ** 4).sum()
x3 = (x ** 3).sum()
x2 = (x ** 2).sum()
M = array([[x4, x3, x2], [x3, x2, x.sum()], [x2, x.sum(), N]])
K = array([(y * x ** 2).sum(), (y * x).sum(), y.sum()])
A, B, C = solve(M, K)

print 'exact values     ', a, b, c
print 'calculated values', A, B, C

fig, ax = plt.subplots()
ax.plot(x, y, 'b.', label='data')
ax.plot(x, A * x ** 2 + B * x + C, 'r.', label='estimate')
ax.legend()
plt.show()

实现解决方案的一种更快的方法是使用非线性最小二乘算法。这样写起来会更快,但运行起来不会更快。使用 scipy 提供的那个,
from scipy.optimize import leastsq
def f(arg):
    a,b,c=arg
    return a*x**2+b*x+c-y

(A,B,C),_=leastsq(f,[1,1,1])#you must provide a first guess to start with in this case.

关于algorithm - 如何计算最适合一组给定数据的二次方程,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21158765/

10-12 22:16
查看更多