全球最强开源模型!阿里通义千问登顶国内第一:超越一众开闭源
2024-07-10 17:38:41AI云资讯5409
7月10日消息,根据SuperCLUE发布的中文大模型基准测评最新报告,阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一,更在全球范围内成为最强开源模型。
SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果,Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二,仅次于OpenAI的GPT-4o。
这一得分超越了百度文心一言4.0、讯飞星火V4.0、Llama-3-70B等开闭源大模型。

具体来看,在理科、文科和Hard三个维度的具体测评中,Qwen2-72B展现了全面而均衡的能力。
特别是在理科任务上,Qwen2-72B与GPT-4o的分差仅为5分,显示出其在计算、逻辑推理和代码测评方面的强劲实力。

在文科任务和Hard任务上,Qwen2-72B同样表现不俗,得分均达到了76分,与GPT-4o的得分相差无几。
特别值得一提的是,在端侧小模型测评中,Qwen2-7B以70亿参数的模型规模,超越了上一代320亿参数的Qwen1.5-32B和130亿参数的Llama-3-8B-Instruct,夺得了排名第一的宝座。

这一成绩不仅证明了Qwen2-7B在小尺寸模型中的极致性能,也极大提升了端侧小模型落地的可行性。
数据显示,截至目前Qwen系列模型的下载量已突破2000万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。
相关文章
- 生态共进:昆仑智云以阿里云认证伙伴身份,破解AI落地“最后一公里”
- 昆仑智云:以阿里云认证生态伙伴身份,破解企业AI“三无困境”
- 全来店亮相 2026 阿里云 PolarDB 开发者大会
- 阿里云支持鹰角3D新游《明日方舟:终末地》全球开服
- 风行在线携手阿里云通义大模型,AI漫剧创作平台“橙星梦工厂”,引领数字内容生产新范式!
- 阿里云AI火花大会:AI加速从单点创新迈向规模化落地
- 灵机一动亮相阿里云展:定义AI硬件的智能体操作平台
- Meta轻量MR头显Phoenix曝光,阿里巴巴/微美全息开启智能眼镜激烈争夺战
- 玻色量子计算云服务上线阿里云!面向全球开放,直面国际量子算力竞争!
- DFRobot亮相阿里云通义智能硬件展,软硬融合AI视觉方案获高度关注
- 定义AI时代隐私计算新标准,YoooTek联合阿里云无影发布 Glass-Box 架构
- 神眸携秋季新品亮相阿里云“秒物·智趣” 开启智能影像新纪元
- 西朗门业杨元嘉斩获阿里国际站2025真牛奖TOP10
- AI时代新媒体如何突围?在阿里巴巴北京举办
- 阿里云AI Landing Zone正式发布,助力企业从“上好云”到“用好AI”的战略升级
- 爱诗科技与阿里云达成全栈AI合作 AI视频服务全球化再启航









