我需要有关如何分析此类数据的建议。我想对其进行情感分析或线性回归作为机器学习工具。预测指标是分数。
color type make new score
red truck ford y 2
black sedan chevy n 4
silver sedan nissan y 5
silver truck nissan n 2
black coupe toyota y 1
blue van honda y 1
red truck toyota n 4
red coupe ford n 2
black sedan ford y 1
blue truck toyota y 4
white coupe chevy y 3
white van toyota n 5
red van ford y 2
silver truck nissan n 3
black sedan honda n 1
silver truck chevy y 4
red truck chevy y 5
white coupe honda n 5
blue sedan chevy n 2
blue van nissan y 3
我可以在 WEKA 中运行一个 LinearRegression 分类器,它产生:
score = 1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55
但是,我想在 Django 中为 Web 应用程序实现这一点。是否有另一种方法来处理此数据并生成不使用 WEKA 的线性回归方程。除了线性回归之外,还有其他关于如何分析它的建议吗?我已经实现了一个决策树。
最佳答案
您可以使用 scikit-learn 作为您的机器学习库,尤其是它的 linear regression capability 。 This example 也可能有用。
此外,您始终可以将 Weka java API 绑定(bind)到您的应用程序,或者自己实现线性回归,给定矩阵代数库,这是相当容易实现的算法。
关于python - 情感分析/线性回归 (Django),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/13956943/