首页 > 资讯 >

国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用

2023-08-04 06:41:38 来源:华尔街见闻

大模型激战之际,继海外的Meta之后,阿里巴巴成为又一家推动人工智能(AI)大模型“安卓时刻”潮流的科技巨头。


(资料图片)

8月3日周四,阿里云将70亿参数的通义千问模型开源,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型均已上线国内首个“模型即服务”开放平台魔搭社区,开源、免费、可商用。

开源代码支持对Qwen-7B和Qwen-7B-Chat的量化,支持用户在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的服务。

魔塔社区已有发帖,专门介绍通义千问上述模型的安装、创空间体验、模型推理、模型训练最佳实践,并附有模型链接及下载情况截图。

公开资料显示,Qwen-7B使用去重及过滤后超过2.2万亿tokens的数据进行预训练,是支持中、英等多种语言的基座模型,上下文窗口长度达到8k。它包含高质量中、英、多语言、代码、数学等数据,囊括全网文本、百科、书籍、代码、数学及各个领域垂类。

评测英文综合能力的基准评测之一MMLU的评测结果显示,在英文评测方面,Qwen-7B的效果超过了目前国内外其他同类开源预训练模型,对比更大规模版本的模型也具有较强竞争力。中文评测方面,在C-Eval验证集上,Qwen-7B在同等规模现有模型中取得了最高分数,甚至相比更大规模模型也具有较强竞争力。

以下为Qwen-7B的MMLU 5-shot准确率结果对比。

在Qwen-7B的基础上,阿里云使用对齐机制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文对话大语言模型,已实现与人类认知对齐。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。

无论是在C-Eval验证集上,还是在MMLU评测集上,Qwen-7B-Chat模型的zero-shot准确率均在同类对齐模型中表现较优。

以下为C-Eval测试集上的zero-shot准确率结果对比。

通义千问的开源后,阿里云成为国内首个加入大模型开源行列的大型科技企业。今年7月,微软宣布,联手Meta发布开源AI模型的可商用版本Llama 2,提供OpenAI和谷歌模型的平替产品。也是在7月,智谱AI及清华KEG实验室公布,中国顶尖开源大模型ChatGLM2-6B允许免费商用。

华尔街见闻此前文章提及,开源模型的好处包括用户的接受率更高,然后输入更多数据供人工智能处理。LLM拥有的数据越多,其功能就越强大。此外,开源模型使研究人员和开发人员能够发现和解决漏洞,同时提高技术和安全性。

今年4月的2023阿里云峰会上,阿里巴巴宣布向企业开放通义千问,企业可以调用通义千问的能力训练自己的大模型。

阿里云智能集团首席技术官(CTO)周靖人当时介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自身的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

阿里巴巴集团CEO兼阿里云智能集团CEO张勇当时称,阿里巴巴所有产品未来都将接入通义千问大模型。

张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,而基于这一信念,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于通义千问,拥有具备自己行业能力的专属大模型。

风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
上一篇:

一直守护你什么意思(一直守护你)

下一篇:

最后一页

x
推荐阅读

国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用

一直守护你什么意思(一直守护你)

小孩一周的营养食谱 儿童一周营养食谱

下列哪项不是我国宪法规定的内容(宪法规定的内容)

以奋斗之姿担使命 青春在大运赛场闪耀

为什么不建议买适时四驱

北京3名牺牲救援人员身份确认!请记住他们的名字

“无废城市”建设的包头模式

克丽缇娜:加盟美容院的不二选择

珲春司法局开展防范非法集资和防范诈骗宣传活动

油价即将上涨 8月9日24点 汽柴油上涨195元/吨

泸定地震带(只爱言情:四川:泸定地震后余震活动仍将持续)

工信部:上半年光伏产业链主要环节产量高速增长 同比增长均超过65%

祝贺!我国成功发射风云三号06星

逃离塔科夫13.1.3.25206离线版免费TT辅助

百度宣布调拨3000万支援抗汛救灾

刺激,35%的控球率仍赢,3-1意甲豪门爆发,掀翻皇马迎来2连胜

大同市美术馆个人参观须知

这是我的战争狙击中心顶楼_这是我的战争狙击中心

济南市调整2023年度社会保险缴费基数

华泰股份:8月2日融券净卖出100股,连续3日累计净卖出2.08万股

北京被困列车旅客回忆:最艰难时6个人分到一瓶水

时间定了!油价又有调整

海能达08月02日被深股通减持34.09万股

两部门明确支持小微企业融资有关税收政策

卡卡谈造访皇马:俱乐部光明未来不会遥远 贝林厄姆是现代型球员

上海谊众(688091):8月2日北向资金减持6200股

文字竖排怎么居中 文字竖排

孟哲(关于孟哲简述)

“豫”你一起,同舟共“冀”!

鸡拐骨是什么 鸡拐骨是什么意思

教你油焖大虾家庭制作方法,好吃不腻,每次做的都不够吃

五一股市休假安排(五一小长假股市停盘时间表)

百济神州:上半年净亏损缩窄至52亿元

电脑花屏的原因是什么(电脑花屏的原因)

我当一天家感悟 我当一天家活动感悟

成都金银街周三(8月2日)黄金价格报价573元/克

工行资产管理部原总经理顾建纲接受审查调查

说几句涿州水灾!

南召县扎实做好人防工程防汛工作

阿里云大模型产品再升级 “通义听悟”上线“自动提取PPT”等三大功能

全新丰田普拉多正式发布 两种造型/配2.4T混动系统

郭艾伦是真闲不住!刚结束热身赛,又现身翟晓川球局,暑假玩疯了

国创高新:公司将受益于城中村改造和老旧小区改造

天津故意伤害罪量刑标准是怎样的

房地产、基建板块延续强势,绿地控股涨超3%,沪深300价值ETF(562320)交投活跃丨ETF观察

【融中早报】京东回复收购永辉传闻 工业富联再次辟谣在印度投资

科教赋能文化传承 非遗“破圈”绽放异彩

蕲春县科技局志愿服务队(关于蕲春县科技局志愿服务队简述)

预告:中国气象局周四召开8月新闻发布会