(一)基础铺垫

  • 一元非线性回归分析(Univariate Nonlinear Regression)

    • 在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条曲线近似表示,则称为一元非线性回归分析。

    • 一元二次方程:

y=a2x2+a1x1+a0x0
    • 一元三次方程:
y=a3x3+a2x2+a1x1+a0x0
    • 一元 n 次方程:
y=anxn+......+a1x1+a0x0

(二)案例-金融场景为例

12.225.5
22.322.5
32.419.5
42.516.5
52.713.5
63.110.5
73.67.5
84.84.5
97.01.5

1.建模逻辑

  • 一元非线性回归方程转为多元一次回归方程
例如:y=a2x2+a1x1+a0x0
转为:y=a2x¯2+a1x¯1+a0x¯0
数据分析部落公众号(shujudata)
其中:
x¯0=x0
x¯1=x1
x¯2=x2

2.实操

  • jacky关键点提示:把一元非线性方程转化为多元线性方程的方法

    • 转化的方法是PolynomialFeatures类

    • 要确定是一元几次方程(从图形中观察),然后确定degree是几(多少阶的方程)

#---author:朱元禄---
import pandas
data = pandas.read_csv(
'file:///Users/apple/Desktop/jacky_1.csv',encoding='GBK'
) x = data[["手续费(%)"]]
y = data[["金融产品销售额"]] import matplotlib
font = {
'family':'SimHei'
}
matplotlib.rc('font',**font)
matplotlib.rcParams['axes.unicode_minus'] = False
from pandas.plotting import scatter_matrix scatter_matrix(
data[["手续费(%)","金融产品销售额"]],
alpha = 0.8,figsize =(10,10),diagonal = 'kid'
) from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures pf = PolynomialFeatures(degree=2)
x_2_fit = pf.fit_transform(x) lrModel = LinearRegression()
lrModel.fit(x_2_fit,y) lrModel.score(x_2_fit,y) x_2_predict = pf.fit_transform([9],[10])
lrModel.predict(x_2_predict)
05-11 13:17