继百度文心一言发布三周之后,4月7日阿里通义大模型终于推出通义千问,阿里正式加入ChatGPT战局。下午市场一片大热,对于深耕NLP多年的阿里,大家有足够的期待。
官宣内测
“你好,我叫通义千问。初次见面,请多指教。”4月7日下午,阿里大模型“通义千问”在阿里云官方微博以这样的方式与大家见面。阿里版GPT正式官宣内测,通义千问开始邀请用户测试体验。目前主要定向邀请企业用户进行体验测试,用户可通过官网申请,符合条件的用户可参与体验,其官网地址为https://tongyi.aliyun.com/ 。
对于没有邀请码的用户来说,目前通义千问官网非常简单,只提供了“预约报名”和“使用邀请码”两个接口,用户可以在预约报名使用企业邮箱和企业主体名称进行申请,获取邀请码后在使用邀请码填码正式开启体验。
体验内容
在官网首页用非常简短的三句话介绍了通义千问:
- 我是通义千问,一个专门响应人类指令的大模型
- 我是效率助手,也是点子生成机
- 我服务于人类,致力于让生活更美好
进入体验页面后,可以看到它的提示性功能,可以去写一段电影脚本,可以作为职场助理,教你如何做产品,也可以写短文,写邮件,这些提示都是在教我们如何提问,能够放在体验首页展示,说明通义千问在这些方面表现比较出色。
通过这些提示可以发现,通义千问能够完成的功能与ChatGPT和文心一言比较相似,但它并没有展示编码能力和图像生成能力,这是相较于竞品比较劣势的一面。
在页面下方,还提示了我们有一个百宝袋,其页面如下。
该页面展示了通义千问搭载的9种应用,这些应用被分为3类,分别为效率类、生活类和娱乐类。
- 效率类:写提纲,SWOT分析、商品描述生成;
- 生活类:会放飞的菜谱,小学生作文,然后呢;
- 娱乐类:彩虹屁专家、写情书、为你写诗。
百宝箱可以为用户在特定功能内快速生成指定文案,这得益于阿里云在NLP自然语言处理上的长期积累,尤其在电商和生活领域更是深耕多年,在特定领域有数据积累优势。比如NLP电商行业能力,在通义千问发布前,已经具有智能商品发布,商品评价解析和对话知识抽取能力,能够帮助企业梳理商品评价,挖掘商品需求,实际上这已经是专业领域的生成式AI。
看到这里有一个感觉,阿里与百度的路正好相反,阿里从行业模型走向大众模型,百度从大众模型走向行业模型,两类用户都有利益,不同的路为了同一个目的,将更多的用户纳入自己的模型框架下。
鸟鸟分鸟
在通义千问发布前,阿里模型已经在网络和资本市场上大火了一把。4月4日,阿里版ChatGPT语音助手已经在网上现身。脱口秀演员鸟鸟展示了一个数字分身“鸟鸟分鸟”,这是一个搭载于天猫精灵上的ChatGPT,通过收集一小时左右的有效鸟鸟录音,并花费一周左右训练时间,可高度模仿鸟鸟的音色、语气与文本风格。鸟鸟与这个数字分身进行了多次互动,多轮对话。鸟鸟分鸟此次利用的达摩院KANN-TTS语音合成技术,融合了端到端TTS技术和传统TTS技术,可大幅提高合成语音与真人发声的相似度。
为什么第一个被展示是语音模型,而不是通用文本大模型,个人认为,这是因为阿里云在智能客服和智能语音交互上的技术积累比较深。智能客服应该是目前生成式AI实际应用上最成熟的行业,在ChatGPT刚出来时,大家预测将改变哪个行业,排在首位的几乎都是智能客服。
去年阿里达摩院打造了通义对话大模型 SPACE 体系,SPACE 是“半监督预训练对话模型”的简称,通过半监督,把人类知识注入到大模型中进行训练。在SPACE-1阶段,将对话策略知识注入到阿里云的大模型里,对话策略作为桥梁,链接起对话理解和对话生成,也就是我们常提到的联系上下文。在SPACE3阶段实现了从单模块建模到对话理解、对话策略和对话生成的一体化建模。这三个模块的一体化也就是对话交互模型的核心基础,实现了聊天机器人功能体系。
后言
4月11日,2023阿里云峰会将于北京召开,阿里巴巴董事局主席兼 CEO 张勇,阿里云智能首席技术官周靖人将出席论坛。有消息透露,峰会上阿里将发布大模型,可以期待届时更为全面的产品介绍、未来的发展方向和愿景。
从ChatGPT、Bard到文心一言,我们经历了人工智能第一阶段的爆发式发展,进入到4月,阿里通义大模型和华为盘古大模型将迎来正式发布,加上其他初创AI公司和老牌互联网公司的追逐,人工智能正在经历历史上最好的发展时期。有赞誉自然有毁誉,反对AI发展的声音虽然比较大,但阻挡不了整个行业趋势。更何况,对于国内ChatGPT类产品来说,担心的不是太先进不安全,而是怎么赶上目前GPT-4的水平。