数据科学和机器学习中的多重共线性:隐藏的威胁及其解决方法
数据科学和机器学习中的多重共线性:隐藏的威胁及其解决方法 文章目录 一、说明二、什么是多重共线性?三、为什么多重共线性很重要?四、多重共线性的类型五、检测多重共线性六、多重共线性对回归模型的影响七、解决多重共线性的方法八、结论:关键要点 一、说明 在数据科学和机器学习中,理解变量之间的关系对于构建准确且可解释的模型至关重要。多重共线性,即两个或多个预测变量之间的高相关性,如果不加以控制,会对模型的准确性...
【机器学习】在向量的流光中,揽数理星河为衣,以线性代数为钥,轻启机器学习黎明的瑰丽诗章
文章目录 线性代数入门:机器学习零基础小白指南前言一、向量:数据的基本单元1.1 什么是向量?1.1.1 举个例子: 1.2 向量的表示与维度1.2.1 向量的维度1.2.2 向量的表示方法 1.3 向量的基本运算1.3.1 向量加法1.3.2 向量的数乘1.3.3 向量的长度(范数) 1.4 向量的几何意义 二、矩阵:多维数据的集合2.1 什么是矩阵?2.1.1 举个例子: 2.2 矩阵的表示与维度2...
【机器学习】在不确定的光影中:机器学习与概率论的心灵共舞
文章目录 概率与统计基础:解锁机器学习的数据洞察之门前言一、概率论基础1.1 概率的基本概念与性质1.1.1 概率的定义1.1.2 样本空间与事件1.1.3 互斥事件与独立事件1.1.4 概率的计算方法 1.2 条件概率与独立性1.2.1 条件概率1.2.2 独立事件 1.3 随机变量1.3.1 随机变量的定义1.3.2 离散随机变量1.3.3 连续随机变量1.3.4 随机变量的期望与方差1.3.5 随...
机器学习学习笔记-20241211
文章目录 空间归纳偏置局部性(Locality)平移不变性(Translation Invariance)空间关系(Spatial Relationships)尺度不变性(Scale Invariance)上下文依赖(Context Dependency)、形状和几何信息(Shape and Geometry) 多头自注意力(Multi-Head Self-Attention)概念机制优点缺点 可分离自...
基于机器学习的新闻分类系统
基于机器学习的新闻分类系统是一种利用机器学习算法对新闻文章进行自动分类的技术。这种系统可以帮助新闻机构、社交媒体平台或信息聚合网站快速、准确地将新闻文章归类到相应的类别中,如体育、政治、科技、娱乐等。以下是一个基于机器学习的新闻分类系统的基本构建步骤: 1. 数据收集与预处理数据收集:- 从可靠的新闻源或数据库中收集大量的新闻文章。- 确保数据集包含多个类别,并且每个类别有足够的样本。数据预处理:- 文...
机器学习-多元线性回归
文章目录 代码什么是回归任务什么是多元什么是回归什么是多元线性回归表达式何时使用多元线性回归注意损失函数 代码 https://github.com/FULLK/AI_Study/tree/main/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E5%A4%9A%E5%85%83%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92 什么是回归任务 根据历...
AI、大数据、机器学习、深度学习、神经网络之间的关系
AI、大数据、机器学习、深度学习、神经网络之间的关系 一、人工智能(AI)的概念 人工智能是指通过计算机程序或机器来模拟、实现人类智能的技术和方法。它旨在使计算机具备感知、理解、判断、推理、学习、识别、生成、交互等类人智能的能力,从而能够执行各种任务。人工智能是一个广泛的领域,包括了机器学习、专家系统、知识表示与推理、搜索算法、逻辑推理、规划、进化算法、博弈理论与决策树、模糊逻辑、贝叶斯网络、强化学习等...
机器学习-正则化技术
文章目录 拟合正则化正则项L1 正则化(Lasso)L2 正则化(Ridge) 多元线性回归的正则化回归形式代码 拟合 过拟合:参数(特征)过多(理解为考虑很多因素)或者说过多专注于原来的训练数据,导致模型过于复杂 欠拟合:参数太少,太不专注于原来的训练数据,导致模型过于简单 随着模型复杂度增加(可以认为与训练数据的拟合程度)训练误差越来越小,泛化误差(就是与测试数据的误差)先小后大 复杂度的低中高分别...
【机器学习】乱象中寻序,虚实间求真:统计学连接数据与真理的桥梁
文章目录 统计学基础:揭开机器学习的数学面纱前言一、统计学的核心概念1.1 描述统计1.1.1 集中趋势的测量1.1.2 离散程度的测量1.1.3 数据分布与偏态 1.2 推断统计1.2.1 样本与总体1.2.2 假设检验1.2.3 置信区间 二、推断统计:从样本到总体的桥梁2.1 样本与总体2.1.1 样本与总体的定义2.1.2 样本为何可以推断总体 2.2 假设检验:检验假设的有效性2.2.1 零假...
有监督学习 vs 无监督学习:机器学习的两大支柱
有监督学习 vs 无监督学习:机器学习的两大支柱 有监督学习 vs 无监督学习:机器学习的两大支柱一、有无“老师”来指导二、解决的问题类型不同三、模型的输出不同 有监督学习 vs 无监督学习:机器学习的两大支柱 在机器学习的奇妙世界里,有监督学习和无监督学习就像是两位超级英雄,各自拥有独特的超能力,解决着不同类型的问题。今天,就让我们用通俗易懂的方式来揭开它们神秘的面纱,看看这两者到底有啥区别。 一、有...