阿里巴巴在海外Meta之后,成为另一个推动人工智能(AI)大模型“安卓时刻”潮流的科技巨头
根据北京商报的报道,阿里云将于周四8月3日发布开源的通用问答模型Qwen-7B和对话模型Qwen-7B-Chat,这两款模型拥有70亿参数。它们已经上线了国内首个“模型即服务”开放平台魔搭社区,并且可以免费使用,商业用途也是允许的
用户可以通过开源代码量化Qwen-7B和Qwen-7B-Chat,并在消费级显卡上部署和运行模型。他们可以直接从魔搭社区下载模型,也可以通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat。阿里云为用户提供包括模型训练、推理、部署和精调等服务
在魔塔社区上,有帖子专门介绍通义千问模型的安装方法、创空间体验、模型推理和模型训练的最佳实践,还附有模型链接和下载情况的截图
根据公开资料,Qwen-7B是一个基座模型,使用去重和过滤后超过2.2万亿tokens的数据进行预训练。它支持中、英等多种语言,并具有8k的上下文窗口长度。该模型包含高质量的中、英、多语言、代码、数学等数据,覆盖全网文本、百科、书籍、代码、数学以及各个领域的垂直领域
根据MMLU评测结果显示,Qwen-7B在英文评测方面表现出色,超过了其他同类开源预训练模型,并且与更大规模的模型相比具有竞争力。在中文评测方面,Qwen-7B在C-Eval验证集上取得了最高分数,甚至与更大规模的模型相比也具有竞争力
下面是对比了Qwen-7B的MMLU 5-shot准确率结果
阿里云通过对齐机制,构建了基于基座模型的AI助手Qwen-7B-Chat,它是一个基于Transformer的中英文对话大语言模型,已经成功实现了与人类认知的对齐。该模型使用了多样的预训练数据,包括网络文本、专业书籍、代码等,覆盖范围广泛
Qwen-7B-Chat模型在C-Eval验证集和MMLU评测集上的zero-shot准确率都超过了其他同类对齐模型
下面是C-Eval测试集上的零-shot准确率结果对比
阿里云成为国内首家加入大模型开源行列的大型科技企业,今年7月联合Meta发布了可商用版本的开源AI模型Llama 2,该模型可替代OpenAI和谷歌的模型。此外,智谱AI及清华KEG实验室也在7月公布了中国顶尖的开源大模型
开源模型的优势在于提高用户接受率和提供更多数据用于人工智能处理。LLM的数据量越大,功能越强大。此外,开源模型有助于研究人员和开发人员发现和解决漏洞,提升技术和安全性水平
在2023年4月的阿里云峰会上,阿里巴巴宣布向企业开放通义千问,使得企业能够利用通义千问的能力来训练自己的大型模型
阿里云智能集团首席技术官(CTO)周靖人表示,未来企业可以充分利用阿里云的通义千问能力,并结合自身行业知识和应用场景,训练定制化的企业大模型。例如,每家企业都可以拥有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师和自动驾驶模型等功能
张勇,阿里巴巴集团CEO兼阿里云智能集团CEO,表示阿里巴巴的所有产品都将与通义千问大模型进行整合
阿里云希望帮助更多企业使用大模型,以适应AI时代的需求,让每家企业都能拥有自己行业能力的专属大模型,并基于通义千问进行重构
以上就是国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用的详细内容,更多请关注Work网其它相关文章!