机械学习是多领域交叉的学科,可以从学习模式和学习方法上面进行分类,学习模式将机器学习分类为监督学习、无监督学习和强化学习等,学习方法可以将机器学习分为传统机器学习和深度学习。
机器学习按学习方式分为监督学习、无监督学习和强化学习。
机器学习是一门涉及统计学、系统识别、逼近理论、神经网络、优化理论、计算机科学、脑科学等多个领域的交叉学科。它研究计算机如何模拟或实现人类的学习行为,以获得新的知识或技能,重新组织现有的知识结构并使其持续。提高其性能是人工智能技术的核心。基于数据的机器学习是现代智能技术中最重要的方法之一。根据不同的学习模式、学习方法和算法,机器学习有不同的分类方法。
**知识图谱**
知识图谱本质上是语义网络(Semantic Network)的知识库”。但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图。
本质上来说知识图谱是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。
知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。
**自然语言处理**
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等。
机器翻译
机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展。
语义理解
语义理解技术是指利用计算机技术实现对文本篇章的理解,并且回答与篇章相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。随着 MCTest 数据集的发布,语义理解受到更多关注,取得了快速发展,相关数据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。
问答系统
问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案。常常用于企业的智能电话机器人开发之中,基于关键词识别和爬虫的索引找出一一对应的语句,然后进行答复。问答系统目前已经有了不少应用产品出现,大多是在实际信息服务系统和智能手机助手等领域中的应用,这是人工智能较为成熟的一个领域,在不断市场化扩张的同时,机遇与挑战并存,一款智能电话机器人好不好用同样需要面临自然语言处理的四大挑战:
1.词法、句法、语义、语用和语音等不同层面存在不确定性;
2.新的词汇、术语、语义和语法导致未知语言现象的不可预测性;
3.数据资源的不充分使其难以覆盖复杂的语言现象;
4.语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算
**人机交互**
人机交互是人工智能领域的重要外围技术。主要研究人与计算机之间的信息交换,包括人与计算机、计算机与人之间的信息交换。人机交互是一门与认知心理学、人机工程学、多媒体技术和虚拟现实技术密切相关的综合性学科。传统的人与计算机之间的信息交换主要依赖于交互设备,包括键盘、鼠标、操纵杆、数据服装、眼球跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔显示器、扬声器等输出设备。.人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互和脑机交互。
**计算机视觉**
计算机视觉是利用计算机模拟人的视觉系统的科学。它使计算机能够提取、处理、理解和分析与人类相似的图像和图像序列。汽车驾驶、机器人、智能医疗等领域需要通过计算机视觉技术从视觉信号中提取和处理信息。近年来,随着深度学习的发展,预处理、特征提取和算法处理逐渐融合,形成了一种端到端的人工智能算法技术。根据所解决的问题,计算机视觉可分为五类:计算成像、图像理解、三维视觉、动态视觉和视频编解码。
目前,计算机视觉技术发展迅速,具有初步的产业规模。未来计算机视觉技术的发展将面临以下挑战:
首先,如何更好地将不同的应用领域与其他技术结合起来,计算机视觉可以广泛地利用大数据来解决一些问题,这些问题已经逐渐成熟,可以超越人类,但在某些问题上不能达到高精
度。
其次,如何减少计算机视觉算法的开发时间和人力成本。目前,计算机视觉算法需要大量的数据和人工标记,并且需要较长的研究和开发周期,才能在应用领域达到要求的精度和耗时。
如何加快新算法的设计和开发。随着新的成像硬件和人工智能芯片的出现,针对不同芯片和数据采集设备的计算机视觉算法的设计和开发也是一个挑战。
**生物特征识别技术**
生物识别技术是指通过个体的生理或行为特征来识别和鉴别个体身份。从应用过程来看,生物特征识别通常分为注册和识别两个阶段。在注册阶段,人体的生物特征信息由指纹、人脸等光学信息、话筒语音等声学信息、数据预处理和特征提取技术等传感器采集,并存储相应的特征。
在识别过程中,根据配准过程将识别器作为信息采集、数据预处理和特征提取,然后将提取的特征与存储的特征进行比较,完成识别。从应用任务的角度来看,生物特征识别一般分为识别和确认任务。识别是指从存储库中识别待识别人员身份的过程,这是一对多的问题。识别是指通过将信息与存储库中特定的个人信息进行比较来识别待识别人员的过程。