我需要有关如何分析此类数据的建议。我想对其进行情感分析或线性回归作为机器学习工具。预测指标是分数。

color   type    make    new score

red     truck   ford    y   2
black   sedan   chevy   n   4
silver  sedan   nissan  y   5
silver  truck   nissan  n   2
black   coupe   toyota  y   1
blue    van     honda   y   1
red     truck   toyota  n   4
red     coupe   ford    n   2
black   sedan   ford    y   1
blue    truck   toyota  y   4
white   coupe   chevy   y   3
white   van     toyota  n   5
red     van     ford    y   2
silver  truck   nissan  n   3
black   sedan   honda   n   1
silver  truck   chevy   y   4
red     truck   chevy   y   5
white   coupe   honda   n   5
blue    sedan   chevy   n   2
blue    van     nissan  y   3

我可以在 WEKA 中运行一个 LinearRegression 分类器,它产生:
score =  1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55

但是,我想在 Django 中为 Web 应用程序实现这一点。是否有另一种方法来处理此数据并生成不使用 WEKA 的线性回归方程。除了线性回归之外,还有其他关于如何分析它的建议吗?我已经实现了一个决策树。

最佳答案

您可以使用 scikit-learn 作为您的机器学习库,尤其是它的 linear regression capabilityThis example 也可能有用。

此外,您始终可以将 Weka java API 绑定(bind)到您的应用程序,或者自己实现线性回归,给定矩阵代数库,这是相当容易实现的算法。

关于python - 情感分析/线性回归 (Django),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/13956943/

10-12 19:59