我目前正在学习数据挖掘,并且有以下问题。


机器学习和数据挖掘之间有什么关系?
我发现许多数据挖掘技术与统计信息相关,而我“听到”数据挖掘与机器学习有很多关系。所以我的问题是:机器学习与统计紧密相关吗?
如果它们之间的关系不密切,是否存在这样的区分:将侧重于统计技术的数据挖掘与侧重于机器学习技能的数据挖掘分开?因为我发现一些研究生院的统计系开设了数据挖掘课程。

最佳答案

数据挖掘是从数据中提取有用信息的过程,例如模式,趋势,客户/用户行为,喜好/反感等。这涉及与人工智能和统计相关的算法的使用。

Wikipedia的数据挖掘定义为:


  数据挖掘(数据库中知识发现的分析步骤
  过程[1]或KDD),这是一个相对年轻且跨学科的领域
  计算机科学,[2] [3]是发现新模式的过程
  来自大型数据集,涉及统计和人工方法
  情报,还有数据库管理。与例如相反
  机器学习,重点在于先前的发现
  未知模式,而不是将已知模式推广到新模式
  数据。


机器学习涉及使计算机“学习”行为,趋势等,并按照其行动。例如,在信用卡欺诈中,计算机“学习”客户的行为,并且如果发生奇怪的事情(涉及金额非常高的交易等),则会将该交易标记为潜在欺诈。

维基百科对机器学习的定义是:


  机器学习是人工智能的一个分支,是一门科学
  与算法设计和开发有关的学科
  允许计算机根据经验数据来发展行为,例如
  来自传感器数据或数据库。机器学习与
  算法的发展使机器可以通过
  基于表示不完整数据的归纳推理
  有关统计现象的信息。分类也是
  称为模式识别,是机器中的一项重要任务
  学习,通过哪些机器“学习”以自动识别复杂
  模式,以根据样本的不同来区分样本
  模式,并做出明智的决策。


机器学习使用数据挖掘来学习模式,行为,趋势等,因为数据挖掘是从一组数据中提取此信息的方式。数据挖掘和机器学习都使用统计决策。是的,因此涉及统计,并且在数据挖掘和机器学习中非常重要。

关于statistics - 统计,机器学习和数据挖掘,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7502337/

10-12 17:43
查看更多