目录
数据挖掘专栏,包含基本的数据挖掘算法分析和实战,数据挖掘竞赛干货分享等。数据挖掘是从大规模数据集中发现隐藏模式、关联和知识的过程。它结合了统计学、人工智能和数据库系统等领域的技术和方法,旨在通过分析大量数据来提取有用的信息,并用于预测、决策制定和问题解决等领域。
1、专栏大纲
🐋基础部分:
从基础的算法开始,
- 【数据挖掘基础】——数据挖掘能解决什么问题(1)
- 【数据挖掘基础】——理解业务和数据(2)
- 【数据挖掘基础】——数据的预处理(3)
- 【数据挖掘基础】——模型的评估(4)
- 【数据挖掘基础】——模型怎么解决业务需求(5)
- 【数据挖掘基础】——KNN算法+sklearn代码实现(6)
- 【数据挖掘基础】——决策树算法+代码实现(7)
- 【数据挖掘基础】——支持向量机(SVM)+代码实现(8)
- 【数据挖掘基础】——常见算法对比和选择(9)
文章中的常用的数据挖掘方法:
文章中介绍一些数据挖掘技术,如决策树、随机森林、神经网络、支持向量机、主成分分析等。在不同的数据挖掘问题中选择不同的模型来解决实际的问题。
🐋实战部分:
- 【数据挖掘实战】——舆情分析:对微博文本进行情绪分类
- 【数据挖掘实战】——使用xgboost实现酒店信息消歧
- 【数据挖掘实战】——使用 word2vec 和 k-mean 聚类寻找相似城市_k-means 城市
- 【数据挖掘实战】——电力窃漏电用户自动识别(LM神经网络和决策树)
- 【数据挖掘实战】——航空公司客户价值分析(K-Means聚类案例)
- 【数据挖掘实战】——基于水色图像的水质评价(LM神经网络和决策树)
- 【数据挖掘实战】——家用电器用户行为分析及事件识别(BP神经网络)
数据挖掘可以解决许多问题,包括但不限于以下几个方面:
部分的流程图:
部分文章目录:
🐋竞赛部分:
持续更新中:
- 【数据挖掘实战】——科大讯飞:跨境广告ROI预测(Baseline)
- 【数据挖掘竞赛】——比赛的流程干货分享
- 【数据挖掘竞赛】——糖尿病遗传风险检测挑战赛(科大讯飞)
- 【数据挖掘竞赛】——汽车领域多语种迁移学习挑战赛(科大讯飞)
竞赛网站推荐:
2、代码附录
大部分代码在文中。
订阅链接: