“星火大模型与OpenAI,是什么关系?”

“我和OpenAI没有关系,我是讯飞星火认知大模型,我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。”

很快,「商业秀」就回答了星火认知大模型输入的问题。这与近期讯飞星火大模型的一则传言不符。

近日有网友发现,讯飞星火大模型在有些“问答”中会出现“我是由OpenAI开发的”等内容,由此一则关于“讯飞星火大模型被质疑‘套壳OpenAI的ChatGPT’”的消息传播开来。

5月11日,科大讯飞在最新披露的投资者关系活动记录表中表示,星火大模型“套壳OpenAI的ChatGPT”既不符合事实,也不符合逻辑。

科大讯飞具体表示,如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。

我们有理由相信,此时的科大讯飞,比任何一家公司都需要大模型的故事,而非“套壳”事故。且先不论大模型本身的优劣,光看科大讯飞迅速辟谣这一行径,足见星火大模型对其之重要。在拯救股价方面,大型模型的影响是无与伦比的,在本季度甚至更长的时间内都如此。

今年4月底,科大讯飞发布了2022年财报和2023年一季度报,财报显示,净利润出现大幅下滑态势,市场似乎对其瞬间丧失了大部分信心,股价一路下跌。直到5月6月(星期六),科大讯飞发布星火大模型,在5月8日开盘后,其股价才开始拉升10%,此后数日,一度呈现上涨趋势。市场对这家公司,似乎又恢复了信心。

推出大模型,再经历被质疑“套壳OpenAI”事件,科大讯飞也必须面对共同的AI话题:大模型纷纷扎堆,是时候该理性祛魅了。

在这个大模型横空出世的时代,科大讯飞并非“孤勇者”。自ChatGPT发布以来,掀起的科技军备竞赛就一直没有停息,其余威在国内也愈演愈烈,各家公司在AI领域“卷”个不停,前段时间大模型集中爆发,被评价为“颇有十年前互联网‘百团大战’甚至‘千团大战’的气势”。

据不完全统计,在ChatGPT发布后的短短4个月时间里,至少已经有30多个国内研发机构和企业,在ChatGPT发布之后纷纷推出了自己品牌的大模型和相关产品。

在不少企业声称自己是“国内首发”的情况下,类ChatGPT的技术在整个科技圈内变得十分普遍,资本市场也开始出现波动。与大模型相关的媒体报道铺天盖地,随后又陷入一阵短暂的沉寂。而下一波,大概率还在来的路上。

大模型带来的机遇不言而喻,但在这场疯狂的竞赛中,谁又能真正走到最后?决战未来,各家真正的核心竞争力又是什么?

以商业发展的历史规律来看,市场会在喧嚣过后崩溃泡沫,大规模模型的狂潮也不可能永远持续。要真正抓住由AI技术带来的产业变革机遇,必须去理解大型模型所带来的核心性改变,并进行冷静思考。

01 超越了ChatGPT?

目前,星火认知大模型在国内处于遥遥领先地位,中文表现已经超出了ChatGPT,而英文表现也接近领先地位。”在科大讯飞星火认知大模型发布会上,刘庆峰自信满满地说道。

作为继百度、阿里、商汤、昆仑万维后,第五家正式发布大模型的公司,科大讯飞一上场,就迫不及待展示自己的强大能力。

刘庆峰更是全程主持发布会,并与科大讯飞研究院院长刘聪现场展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力等多项能力。

在现场演示环节,刘聪提问:“你为什么叫星火 ”“如果有个小伙子跟女朋友吵架了,那他应该宁死不屈还是能屈能伸?” “孔子在2008年北京奥运会上说了什么?”等各类稀奇古怪的问题,星火迅速“接招”,并给出了恰如其分的回答。

在数学能力方面,刘聪也抛出了“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”这类计算问题。星火也很快给出了答案,并罗列了相关解题步骤。

刘庆峰随即表示,数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先,而且已经超越了ChatGPT。

对此,「商业秀」也进行了多轮“挖坑式”测试,例如询问“姚明在几几年获得了亚洲足球先生的称号?” “范志毅在NBA服役多少年?斩获了多少个进球?”等问题。星火都准确识别出了人为“陷阱”,并给出了恰当的回答。

科大讯飞回应“套壳”,AI大模型狂潮祛魅-LMLPHP

这表明,在常识性问题上,星火都进行了一定的训练,并具备一定的纠错能力。

相同的问题,「商业秀」也通过ChatGPT-3进行了测试,其同样也给出了恰当的回答,但在信息丰富度上不及星火全面。

科大讯飞回应“套壳”,AI大模型狂潮祛魅-LMLPHP

在数理能力上,「商业秀」也测试了“鸡兔同笼,鸡兔一共有25只,笼子里脚一共有74只,请问分别有多少只鸡和多少只兔子?”“一支股票今天涨10%,明天跌10%,请问赚还是赔?”等问题,星火也迅速给出了正确回答。

科大讯飞回应“套壳”,AI大模型狂潮祛魅-LMLPHP

「商业秀」将同样的数理问题抛给了ChatGPT-3,在这方面,结果显示ChatGPT-3的回答更有逻辑性。后者先给出了结论,再给出了具体实例,并且还会有延伸的问题,配合原问题答疑解惑。

科大讯飞回应“套壳”,AI大模型狂潮祛魅-LMLPHP

星火还支持语音提问和输出,即可通过语音提问,模型输出的答案也能转换为语音,并能通过持续对话调整语音风格。

「商业秀」通过语音询问“鸡兔同笼,笼里一共有35只,一共有94只脚,问一共有多少只鸡和多少只兔子” “中国拿到网球大满贯职业选手是谁”等问题。星火也准确识别了语音内容,并给出了相应的答案。

但这个操作,要求提问者的语速要很慢,并且能一字一句以标准普通话说出,否则星火可能无法准确识别出相应文字,或文字识别不准确导致回答有误。

经过多轮测试,「商业秀」认为,星火具备了一定的大语言模型能力,并且能够在某些特定领域输出自己的商业价值。

在发布会上,科大讯飞还发布了一系列结合星火大模型的产品,例如讯飞智能办公本能将语音实时转写与墨水屏纸感书写相结合,对会议记录内容形成一份精简的会议纪要;“星火大模型+智能座舱”为数千个车型提供多轮、多人、多区域、多模态的语音交互;基于大模型的生成式RPA(机器人流程自动化),让数字员工更智能……

但星火也不是没有缺点,刘庆峰自己也在发布会上坦言,“大模型技术目前还存在不少待攻克的缺陷。这些问题包括更新新知识不及时、混淆事实问答、编造历史和传统文化中的情节等。”他随之提及,上述问题在今年会有明显的改进。

据了解,星火认知大模型始于2022年12月。彼时,科大讯飞启动了“1+N”大模型技术攻关。其中,“1”是通用认知智能大模型算法研发及高效训练方案底座平台,“N”是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。

不到半年时间,星火认知大模型正式面世,研发时间之短暂、模型发布之匆忙,这直接导致包括科大讯飞在内的很多企业被外界质疑。

在如此短的时间内,星火的推出仅仅标志着一个新的起点,它还需经历多轮迭代和优化。刘庆峰在发布会上公布了星火认知大模型的发展规划:今年6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。

从这份规划日期来看,科大讯飞甚至细化到了哪一天,这从侧面或许表明其急于想将大模型能力落地应用,从而推进商业化。业内认为,这或许与近几年科大讯飞的商业化能力不佳有关。

02 急需大模型“提振信心”

此前,科大讯飞优异的业绩与赚钱能力常被业内称赞,但在经历了连续10年的增长后,神话基本结束于2022年。

科大讯飞2022年财报显示,该公司实现营收188.2亿元,同比微增2.77%;毛利为76.84亿元,同比微增2%;归母净利润5.61亿元,同比下滑63.94%;扣非净利润4.18亿元,同比下滑57.31%。

这句话可以重写为:科大讯飞已经计入政府补贴的数据显示,到2022年,其政府补贴预计将达到11亿元。在同一时间,这也是科大讯飞近五年来净利润同比增长率首次出现下降。数据显示,从2018年到2022年,科大讯飞的净利润增长率分别为24.71%、51.12%、66.48%、14.13%和﹣63.94%。

资本市场对这一成绩单颇感失望,在财报发布后,科大讯飞股价下跌超9%。

对于业绩出现如此大幅变动,科大讯飞方面给出了三个原因。

首先是大环境的影响,科大讯飞表示“受到去年12月份和今年1月份特殊的社会经济客观环境,以及春节假期影响,导致部分项目无法顺利及时推进”。

其次,继2019年被列入美国实体清单,2022年10月7日被再次极限施压,由于调整供应链和相关合同签署等工作影响了当季订单节奏。

最后一点,与星火大模型有关。科大讯飞提到,去年12月启动的“1+N认知智能大模型专项攻关”影响了当期利润,这从侧面印证科大讯飞在大模型上的投入很大。

来到今年,这三大原因仍持续影响科大讯飞的业绩。

数据显示,2023年一季度,科大讯飞实现营收28.88亿元,同比下降17.64%;净亏损5789.5万元,上年同期净利润1.1亿元;扣非后归母净亏损3.38亿元,上年同期净利润1.46亿元。

据界面新闻报道,科大讯飞总裁吴晓如透露,2022年和2023年一季度讯飞净利润下滑严重主要在于公司在教育、医疗等持续运营型业务的合作平台拓展投入、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。

不过,科大讯飞对业绩下滑的情况似乎不太担心。在业绩会上表示目前基于在国产替代和业务开拓上的进展,预计从今年二季度开始将实现收入和毛利正向增长,并有信心实现全年高质量增长的目标。

科大讯飞的核心业务包括教育产品与服务、信息工程和开放平台。其中教育产品是其主要营收来源,占到总营收比例的32.74%。

科大讯飞还构建了面向G端、B端和C端三类客户的业务体系:G端主要是面向地市县等区域,涵盖区域内各类学校和用户的因材施教解决方案;B端主要是面向学校的大数据精准教学、英语听说课堂、智慧作业等;C端主要以面向家长的AI学习机、个性化学习手册、课后服务课程服务等产品。

财报显示,G端业务目前已累计在 50 多个市、区(县)级应用;B端业务中的讯飞课后服务业务已覆盖超300区县、12000余所学校;C端的AI学习机该年销售额增长超50%,但并未透露出具体销售数量与金额。

而实际上,其业绩与目标业绩尚相差甚远。据2022年初的公告,科大讯飞预计其各个地区的业务将保持50%的增长。同时提到,2022年个性化学习手册业务预计营收增长超70%,AI学习机收入目标增长200%+,目标十四五做到年收入100 亿元。

除了主营业务未达预期外,科大讯飞的智慧城市、开放平台及消费者业务、智慧汽车、智慧医疗等业务表现也较为一般。

财报显示,智慧城市下属的信息工程、数字政府行业应用、智慧政法行业应用三大板块与开放平台业务均呈现同比下降态势。智慧汽车、智慧医疗与智慧金融业务虽然呈同比增长态势,例如智慧金融同比增长19.33%,但在整体营收规模中的占比实在少得可怜,智慧金融仅占比1.25%,智慧汽车与智慧医疗分别占比2.47%和2.48%。

如此看来,科大讯飞的主营业务表现不佳,创新业务又还远未达到大规模营收的阶段。科大讯飞当前需要充分利用大型模型所带来的巨大价值,从而提升各项业务的商业竞争力。

但如今处于风口浪尖的大模型,能否帮助科大讯飞实现目标,还需要时间去验证。

03 大模型狂潮祛魅时分

今年数月以来,全球的科技企业们处于一种近乎疯狂当中。大型模型技术在国内外得到广泛关注和应用,尤其是国内的科技巨头们推出了一系列自己的大型模型产品。

据「商业秀」不完全统计,目前已推出大模型产品的公司有百度文心一言、阿里通义千问、华为盘古、商汤日日新、昆仑万维天工以及科大讯飞星火,同时王慧文、王小川等互联网大佬创立的大模型公司也迅速获得了融资。

但这么多大模型都能顺利跑出来吗?大模型的核心竞争价值到底是什么?大模型还能带来哪些颠覆性机会?

疯狂的大模型浪潮,也该到了理性审视的祛魅阶段。

“现在涌现出很多大模型产品,但围绕大模型的训练和调试成本投入非常高,一般公司真烧不起,同时对中小企业来说自研经济性较低,未来竞争更大可能发生在巨头之间。”某风投机构投资经理董浩对「商业秀」表示。

英伟达的研究表示,GPT3最大规模的模型需要使用到175 Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练长达一个月的时间。每月大模型训练成本在数百万美元以上量级。

上月,由中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇发表的演讲中也提到,大模型开发和训练的单次费用高达1200万美元。

大模型开发成本如此高昂,但应用成本(收费)很低。OpenAI在今年3月开放API(应用程序接口),允许第三方开发者通过API将ChatGPT集成至应用程序和服务中。它的接口服务定价为每1000个令牌0.002美元,相对于GPT 3.5模型的价格便宜了约90%。

经济方面的考量显示,这项投入巨大的研发成本很难收回,更遑论实现盈利了。因此,中小企业无法承担这项生意,只有大企业才有足够的资金和资源来投资并争夺未来的市场份额。

或许正因如此,目前已发布大模型产品的企业,都将大模型能力内置到了自身已有的成熟产品中。这种方法可以提升现有产品的人工智能能力和吸引更多客户购买具体产品,而不仅仅是收取接口服务费。”一位业内人士告诉「商业秀」。

但即便如此,国内大模型的竞争也极为激烈。作为大模型应用较为成熟的办公领域,就有多家企业推出了相关产品,如百度“文心一言”具备制作PPT的能力;钉钉接入阿里“通义千问”后可唤起10多项AI能力;字节跳动旗下办公应用飞书也将上线AI助手“MY AI”;金山办公也推出“WPS AI”应用等。

这一次,科大讯飞在星火大模型发布会上也发布了录音笔、翻译笔、办公本等办公产品,意在抢占更多办公场景的用户。但是否真的能掘金成功,还要看接下来用户的实际反馈情况。

“虽然大模型竞争主要在巨头之间,但巨头也难以做到一家独大,这其中的关键就在于数据。玩家在不同领域积累的数据不同,因此可能会在特定领域建立自己的核心优势和独特场景。”董浩进一步表示。

举例来说,阿里有天猫、淘宝的电商数据,菜鸟系的物流数据,这是其他企业无法获取的独有数据,同样科大讯飞在教育领域深耕多年,也积累了自己的独有数据。这些数据,或许就是真正拉开企业差距的关键。

也就是说,那些没有持续资金支持的中小公司,或许很难做出真正的通用大模型产品,而各个大厂推出的通用大模型产品,已经在急于考虑商业变现,缺乏研发耐心与技术突破。

董浩直言,“这一切都来得太快了,还没几个月,各家大模型似乎都成熟可商用了,但事实上这其中必然存在诸多泡沫。”

眼下这场狂热的大模型竞赛才刚刚开始,在巨头和企业疯狂入局与厮杀的同时,不少业内人士也疾呼:是时候该回归初心,对技术保持敬畏,对商业保持探索,而不是一味追求速度、规模与效率,才能迎来大模型最好的时代。

(文中对话者均为化名)

以上就是科大讯飞回应“套壳”,AI大模型狂潮祛魅的详细内容,更多请关注Work网其它相关文章!

09-19 03:44