我有一个train_data,其中包含有关商店及其销售的信息。看起来像这样
我想使用“ DayofWeek”,“ Customers”,“ Promo”构建多特征线性回归来预测test_data上的“ Sales”。
如何为此建立多元线性回归模型,最好使用SKlearn。
编辑:如果有人感兴趣,这是我正在使用的数据集的链接:https://www.kaggle.com/c/rossmann-store-sales
到目前为止,这是我尝试过的。
import pandas as pd
from sklearn import linear_model
x=train_data[['Promo','Customers','DayOfWeek']]
y=train_data['Sales']
lm=LinearRegression()
lm.fit(x,y)
为此,我收到一条错误消息,提示“未定义线性回归”。
最佳答案
您实际上并没有导入LinearRegression
类。如果要导入linear_model
模块中的所有内容(通常不赞成),则可以执行以下操作:
from sklearn.linear_model import *
lr = LinearRegression()
...
更好的做法是导入模块本身并为其命名。像这样:
import sklearn.linear_model as lm
lr = lm.LinearRegression()
...
最后,您可以只导入所需的类:
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
...
关于python - 多特征线性回归的实现,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46531347/