一、前言

本文主要面向那些想了解或准备从事人工智能相关领域研究和工作的入门人士。在踏入这个领域之前,全面了解人工智能的概貌。

二、人工智能(AI)是什么?

起源

人工智能研究领域正式成立于1956年在达特茅斯学院举行的“达特茅斯会议”。与会者后来在20世纪60年代成为该领域的先驱者。他们及其学生研发出的程序被媒体誉为“令人惊叹”:计算机不仅能学会国际跳棋策略,还能解决代数文字难题、证明逻辑定理,甚至能进行英语对话。在20世纪50年代末至60年代初,许多英国和美国的大学纷纷建立了人工智能实验室。

概念

人工智能(AI),是“Artificial Intelligence”的缩写。人工智能是一种由人类创造出来的具有智能的系统,旨在让机器模拟人类的行为和思维,以处理特定的问题。

人工智能的核心在于模拟人类智能。如今,人工智能 (AI) 已变成了一个无所不包的术语,涵盖许多不同的学科,包括计算机科学、数据分析和统计、硬件和软件工程、语言学、神经学,甚至哲学和心理学。

在业务使用的操作层面上,人工智能 (AI) 是一组主要基于机器学习和深度学习的技术。这些技术被用于数据分析、预测、对象分类、自然语言处理、推荐系统和智能数据检索等多种应用场景。

人工智能分类

  1. 弱人工智能(Artificial Narrow Intelligence (ANI))
    • 专用AI:针对特定任务或应用进行设计和训练,如语音助手、推荐系统和自动翻译工具。它在特定领域内表现优异,但不具备广泛的智能能力。
  2. 通用人工智能(Artificial General Intelligence (AGI))
    • 强AI:具备类似于人类的全面智能,能够理解、学习和应用各种知识和技能。这种类型的AI尚未完全实现,仍处于探索阶段。
  3. 超人工智能(Artificial Super Intelligence (ASI))
    • 超越人类的智能:一种理论上的AI,超越人类的所有智力和能力。这仍然是未来的愿景和研究方向。

严格地讲,我们现在看到的都属于“弱人工智能”——具有特定能力或能完成特定任务的人工智能。例如,赢得国际象棋比赛(RL)或从一系列照片中识别某个物体(CV);包括现在的五花八门的聊天机器人和文生图模型,以及其他各类AIGC产品都应该被划分在ANI范围之内。

人工智能应用

从事人工智能领域的人员主要分为两部分:一部分在学术界,如大学和研究所的教授,另一部分在企业中,如各种算法工程师。

当前,人工智能领域的几个热门主题包括但不限:

  1. 数据挖掘(Data Mining):从大量数据中提取有用的信息和模式。
  2. 机器视觉(Computer Vision, CV):让计算机能够“看”并理解图像和视频。
  3. 自然语言处理(Natural Language Processing, NLP):使计算机能够理解和生成自然语言。
  4. 语音交互:处理和生成语音,使机器能够与人类进行语音交流。
  5. 自动驾驶:开发能够自主驾驶的车辆技术。
  6. 游戏AI:在游戏中应用AI技术,提升游戏体验和挑战性。

三、机器学习是什么?

概念

机器学习是人工智能(AI)的基础。它是一种通过数据训练模型,使计算机能够自动学习和改进的方法。具体来说,机器学习利用算法解析数据,从中识别模式和规律,并基于这些模式和规律进行预测或决策,而不需要明确编写指令。其核心理念是让机器通过大量数据和算法进行学习从而产生经验,以便在遇到新数据时能够做出合理的判断。

简单来说机器学习实际上是在告诉机器(可以理解为电脑、CPU或任何能够处理逻辑计算的设备)是如何通过一系列数据学习到一些规则或决策。

想象一下,你在教小狗识别球时,可能会把球放在它面前,然后多次告诉它这个物体叫做“球”,并不断重复这一过程,同时给予奖励机制。经过一段时间的训练,当你说出“球”时,它就能准确知道你指的是什么。为了让小狗更加聪明,你可能会展示不同种类的球,如乒乓球、足球和篮球,并告知它们都叫“球”。经过长时间的训练,它可能就会明白,圆形且可以滚动的物品就叫做“球”。当你拿出一个网球时,它也能识别出这是“球”

如果你理解了这一过程,那你已经初步理解了什么是机器学习。上述我们称之为小狗学习,而机器学习则是教计算机如何学习。我们通过给计算机大量的数据,类似于给小狗展示多次的教学行为,让计算机从这些数据中找到规律和模式。当我们给小狗展示一个新的网球让它识别的过程,在机器学习中被称为预测或决策。

机器学习常见算法

在机器学习中,有许多算法可用于不同类型的问题。以下是一些常见的机器学习算法及其简要介绍:

机器学习分类

机器学习可以分为监督学习、无监督学习和强化学习三大类:

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

机器学习与人工智能的关系

机器学习和人工智能之间的关系可以概括为以下两点:

  1. 人工智能的子集:机器学习是人工智能的基础。人工智能涵盖了使机器具备智能行为的各种方法和技术,而机器学习是实现智能行为的必要方法,专注于通过数据训练模型来实现智能行为。
  2. 实现路径:人工智能的目标是模拟、延伸和扩展人类智能。机器学习提供了一条实现路径,通过让计算机从数据中学习并进行推断,来模拟人类的学习和决策过程。

总之,机器学习是实现人工智能的一种强有力的方法,通过数据驱动的方式,使计算机能够自动学习并在广泛的应用中展现智能行为。

四、神经网络是什么?

概念

人工神经网络(Artificial Neural Network,ANN,也简称为神经网络)是机器学习的一个分支,是一种模拟人脑神经系统的计算模型,用于处理和分析数据,通过使用模仿生物神经元协同工作方式的过程来识别现象、权衡利弊并得出结论。它的灵感来源于生物神经网络的结构和功能。

历史上,科学家一直希望模拟人的大脑,造出可以思考的机器。人为什么能够思考?科学家发现,原因在于人体的神经网络。

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

既然思考的基础是神经元,如果能够"人造神经元"(artificial neuron),就能组成人工神经网络,模拟思考。上个世纪六十年代,提出了最早的"人造神经元"模型,叫做"感知器"(perceptron),直到今天还在用。

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

上图的圆圈就代表一个感知器。它接受多个输入(x1,x2,x3…),产生一个输出(output),好比神经末梢感受各种外部环境的变化,最后产生电信号。

例如我们约定每种输入只有两种可能:1 或 0。如果所有输入都是1,表示各种条件都成立,输出就是1;如果所有输入都是0,表示条件都不成立,输出就是0。

而将多个神经元进行组合便是人工神经网络,如下图:

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

神经网络组成部分

输入层

人工神经网络有几个向其输入数据的节点。这些节点构成了系统的输入层。

隐藏层

输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可用于从多个不同角度分析问题。

例如,如果您得到了一张必须分类的未知动物的图像,则可以将其与您已经认识的动物进行比较。例如,您可以查看其眼睛和耳朵的形状、大小、腿的数量和毛皮花色。您可以尝试识别图样,如下所示:

  • 动物有蹄,所以它可能是牛或鹿。
  • 动物有猫眼,所以它可能是某种类型的野猫。

深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类,则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类。

输出层

输出层由输出数据的节点组成。输出 “是” 或 “否” 答案的深度学习模型在输出层中只有两个节点。那些输出更广泛答案的模型则有更多的节点。

神经网络模型

模型是指一种特定的网络结构和训练方法,用于解决特定类型的问题。虽然模型内部会使用各种算法来进行优化和学习,但在实际应用中,我们更常用模型这个术语来描述这些结构。

神经网络和机器学习的关系

神经网络与机器学习之间有着紧密的关系,神经网络是机器学习的一个子集。

神经网络是机器学习的一种模型:机器学习包括多种模型和算法,而神经网络是其中一种复杂且强大的模型。其他机器学习模型包括决策树、支持向量机(SVM)、K最近邻(KNN)等。

神经网络使用算法进行训练:神经网络的训练过程使用机器学习的算法,如前向传播和反向传播,通过大量数据调整模型参数,以提高性能。

五、深度学习是什么?

概念

在日常对话中,“深度学习”和“神经网络”这两个术语往往会交替使用,这可能会造成混淆。简单来说深度学习(deep learning)是更加复杂的人工神经网络。是一种以人工神经网络为架构,对数据进行学习的算法,而深度学习中的“深度”仅指神经网络中层的深度。一个由超过三层(包括输入层和输出层)构成的神经网络可以被视为一个深度学习算法。只有两层或三层的神经网络只是一个基本的神经网络,如下图:

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术,可以完成更高难度的工作

显然,“深度学习”是与机器学习中的“神经网络”是强相关

深度学习在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。我说个例子,你肯定听说过。那就是2016年谷歌旗下DeepMind公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是“深度学习”。

不过神经网络的计算量非常大,事实上在很长时间里由于基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一下子火热起来。

深度学习的特点

(1)强调了模型结构的重要性:深度学习所使用的深层神经网络(Deep Neural Network,DNN)算法中,隐藏层往往会有多层,是具有多个隐藏层的深层神经网络,而不是传统“浅层神经网络”,这也正是“深度学习”的名称由来。

(2)强调非线性处理:线性函数的特点是具备齐次性和可加性,因此线性函数的叠加仍然是线性函数,如果不采用非线性转换,多层的线性神经网络就会退化成单层的神经网络,最终导致学习能力低下。深度学习引入激活函数,实现对计算结果的非线性转换,避免多层神经网络退化成单层神经网络,极大地提高了学习能力。

**(3)特征提取和特征转换:**深层神经网络可以自动提取特征,将简单的特征组合成复杂的特征,也就是说,通过逐层特征转换,将样本在原空间的特征转换为更高维度空间的特征,从而使分类或预测更加容易。与人工提取复杂特征的方法相比,利用大数据来学习特征,能够更快速、方便地刻画数据丰富的内在信息。

深度学习与人工智能、机器学习的关系

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

深度学习面临的挑战

由于深度学习是一项相对较新的技术,因此其实际实施会带来某些挑战。

大量高质量的数据

在大量高质量数据上训练深度学习算法时,可以获得更好的效果。输入数据集中的异常值或错误会显著影响深度学习过程。例如,在我们的动物图像示例中,如果数据集中意外引入了非动物图像,深度学习模型可能会将飞机归类为海龟。

为避免此类错误,必须先清理和处理大量数据,然后再训练深度学习模型。输入数据预处理需要大量的数据存储容量。

处理能力

深度学习算法是计算密集型的,需要具有足够计算能力的基础设施才能正常运行。否则,它们需要很长的时间来处理结果,GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展。

六、总结

人工智能是一个很广泛的概念,机器学习是人工智能的重要实现方式,即子集,而深度学习又是机器学习的一个子集,三者的关系如下图所示:

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

AI入门指南:什么是人工智能、机器学习、神经网络、深度学习?-LMLPHP

七、未来展望

笔者认为在未来的10年内,使用基本的机器学习算法来优化业务问题将成为IT行业的标准配置。许多工作将部分地被AI取代,至少目前的推荐系统、搜索引擎和广告领域已经基本上被AI完全取代了。

八、参考资料

08-03 10:25