如何了解人工智能产品体系

我们从搭建一个人工智能产品需要一个怎样的基础架构,到剖析架构中每个组件的含义以及对整个系统起到的作用和扮演的角色,最后对每个组件展开讲起。

1、人工智能产品实现逻辑

通常的一款人工智能产品涉及了很多技术,包括语音识别、语音合成、机器视觉、自然语言处理、文本/语义理解等多项技术等交互集成。人工智能的目标是模拟和延伸人的感知、理解、决策、学习、交流、移动和操作物体的能力。感知是人工智能实现的第一步,目前已经有了实质性的进展。理解和决策需要机器学习和人类指导相结合的方式才能实现。

目前阶段的人工智能还是弱人工智能,产品的流程可以概括为:海量数据训练和学习,从中识别规律和经验,新数据通过得到的经验用接近人的思维处理。

通过对角色分工、处理过程、功能价值三个不同的角度,一个人工智能产品的体系包含四个重要角色:
        1、基础设施提供者。
        2、数据提供者。
        3、数据处理者。
        4、系统协调者。

我们从数据流开始说起。
人工智能的产品体系是一个动态流程,本质上是围绕数据采集、存储、计算展开的。
1)数据提供者使用各种手段获得原始数据。
2)数据处理者对数据进行加工。
3)数据处理者进行模型训练,获得可以使用对模型。
4)用模型对新数据进行预测。

以上我们就完成了“数据--信息--知识--智慧”的过程,再随着动态循环,就是“训练--推断--再训练--再推断”的过程。产品经理需要完成系统集成、需求定义、资源协调、解决方案封装的保障工作。

2、基础设施

1)传感器:对信号模式进行转换。主要应用于可穿戴应用、高级辅助驾驶、健康监测、工业控制。举个例子,无人车对传感器有激光、毫米波、超声波、红外线等,产品经理需要对不同对传感器有自己对了解。
2)芯片:完成训练和推断的强大计算能力的计算核心。模型训练:对神经网络和海量数据计算对核心部件应该有充足对了解。云端推断:服务器对CPU、GPU、TPU等计算单元。终端设备:手机、摄像头等。
        按照定制化程度,芯片又分为:
                通用芯片:CPU、GPU、TPU等,可以处理通用任务类型。
                FPGA半定制化芯片:延时低,用硬件实现软件算法。
                ASIC:算法模型可以烧到芯片中,运行效率高。理论上先用FPGA在市场中试错,之后用ASIC量产。
3)基础平台
        1、大数据技术:算法虽好,数据决胜。
        2、云计算技术:降低了研发成本。

3、数据收集

数据收集类似于人类对各种感觉,没有感觉就无法判断。

1、数据来源:直接购买行业数据和免费的数据源;自行采集和爬取;第三方合作。
2、数据质量:(1)关联度;(2)时效性;(3)范围;(4)可信性。

4、数据处理

对原始数据对加工。可以概括为:数据  ---  机器学习给出规则  ---  新数据通过规则得到结果  ---  伴随着输入/输出的过程自我优化

5、机器“大脑”处理过程:识别、理解和推理、决策

1)识别:大量大量的数据存在计算机中计算得到一个模型,对于新数据判断。
2)理解和推理:识别侧重于人对环境的感知,理解和推理强电深层次的理解和归纳能力,是对识别之后的数据的再次处理过程。
3)做决策:通过对外界客观事物、环境、推理和理解来判断采取怎样的行动。

6、系统配置统筹的关键环节:系统协调 

构建一个人工智能系统需要多方协调:包括基础设施提供者、信息提供者、信息处理者在内的各种公司或公司内部各个部门。系统协调者需要在人工智能的不同阶段:需求定义、设计开发、系统优化、运行保障、售后支持、监控和审计发回资源协调和统筹作用。

人工智能产品体系最常见的发展规律是:一开始以项目交付解决单个场景的具体需求为主,看重个性化;当项目的技术和产品需求验证完毕后,就可以使产品走向千人千面的产品化;接下来是服务化,通过对外开放和输出各种服务能力,逐渐与终端用户具体业务解耦,统一数据中心和算法平台;最终实现平台化,帮助用户实现根据自身需求完成各种功能模块的在线快速封装和灵活配置。

考虑到企业的发展速度、市场规模、技术实现瓶颈及业务特殊性多方面因素,需要人工智能产品经理具有成本意识、市场敏锐度、前瞻性和大局观等综合素质。

7、不可逾越的红线:安全、隐私、伦理、道德

(1)安全:人工智能产品认为可控;人工智能产品不会影响公共安全。

(2)隐私:人工智能产品经理至少要评估一下四项:
        1、评估所有产品流程中涉及用户权利的风险。
        2、评估产品在设计或运行过程中的系统描述。
        3、基于产品设计或运行的目的,评估过程是否是必要的。
        4、针对识别出的风险,给出针对风险的管理措施。

在涉及到隐私数据保护措施中,我们可以从三个方面着手:
        1、减少对训练数据量的需求
                1)生成对抗网络(GAN):通过轮流训练判别器和生成器,令其互相对抗,从复杂概率分布中取样,生成文字、图片、语音等。
                2)联合学习(Federal Learning):部分训练过程放到用户手机,将模型传回服务器,不涉及用户敏感数据。
                3)迁移学习(Transfer Learning):把一个场景学习到的模型举一反三迁移到类似的场景中的方法。

        2、在不减少数据的基础上保护隐私:
                1)差分隐私技术(Different Privacy):在数据库检索时,加入满足某种分布的噪声,使查询结果随机化。
                2)同态加密技术(Homomorphic Encryption):在密文上进行计算,生成加密结果,解密后的结果与对明文进行相同操作产生的结果一致。核心在于,支持在加密的数据上进行查询操作,解决数据委托给第三方如云计算公司时的安全问题。
                3)提高算法可解释性,避免黑盒子事件的发生。

(3)伦理道德
在产品设计时,主要从以下三个方面重点关注人工智能的特殊性所带来的伦理问题:
        1、人工智能产品算法的“可解释性差”、“不透明”,使得一旦发生伦理道德事故无法评判。
        2、人工智能代替人履行社会职能的时候,产品的“不可预见性”有可能导致伦理道德争议。
        3、人工智能产品的道德地位值得思考。

8、运维管理

人工智能产品的运维和传统IT运维的出发点都是让业务高效稳定的运行。评价标准:
        1、系统能否第一时间发现异常。
        2、发现异常后能否第一时间找出原因。
        3、从原因能否定义到具体问题。
        4、问题能否自动修复或者自我修复。
        5、未来出现类似问题能否提前预警。

07-07 17:38