全球最强开源模型!阿里通义千问登顶国内第一:超越一众开闭源
2024-07-10 17:38:41AI云资讯5624
7月10日消息,根据SuperCLUE发布的中文大模型基准测评最新报告,阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一,更在全球范围内成为最强开源模型。
SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果,Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二,仅次于OpenAI的GPT-4o。
这一得分超越了百度文心一言4.0、讯飞星火V4.0、Llama-3-70B等开闭源大模型。

具体来看,在理科、文科和Hard三个维度的具体测评中,Qwen2-72B展现了全面而均衡的能力。
特别是在理科任务上,Qwen2-72B与GPT-4o的分差仅为5分,显示出其在计算、逻辑推理和代码测评方面的强劲实力。

在文科任务和Hard任务上,Qwen2-72B同样表现不俗,得分均达到了76分,与GPT-4o的得分相差无几。
特别值得一提的是,在端侧小模型测评中,Qwen2-7B以70亿参数的模型规模,超越了上一代320亿参数的Qwen1.5-32B和130亿参数的Llama-3-8B-Instruct,夺得了排名第一的宝座。

这一成绩不仅证明了Qwen2-7B在小尺寸模型中的极致性能,也极大提升了端侧小模型落地的可行性。
数据显示,截至目前Qwen系列模型的下载量已突破2000万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。
相关文章
- 福客AI获阿里战略投资,让AI Agent成为电商企业新的生产力
- 阿里前同学推出零门槛 AI 开发工具 AgentMa,一句话生成可上线应用
- 阿里云推出企业级Agent构建平台JVS Crew:零代码“建龙虾工厂”
- 阿里妈妈AI万相:万相智识、万相智品、万相智造与万相智投的电商经营逻辑解析
- 经纬天地(02477.HK)换帅:阿里系高管入局,FoPay的战略意图与落地挑战
- 至强® 6处理器在阿里云第九代ECS实例中的应用案例:货拉拉大促高并发实践
- 合合信息亮相2026金融AI联盟大会,携手阿里云共同启动“超级智能体计划”
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 当虹科技获评阿里“玄铁优选伙伴” 加速适配新一代旗舰CPU
- 阿里云数字短信全量开放,终端全覆盖实现营销短信点击率3倍提升
- 杭州维丽杰携手阿里巴巴 达成JBP深度战略合作
- 阿里云Q3财报:增速36%创新高,AI连续三位数增长!
- 上海数据集团、阿里云、浩鲸科技深化战略合作 发力AI时代数据要素
- AWE 2026 展会盛大启幕,阿里巴巴/微美全息锚定智能眼镜强势加入“百镜大战”
- 连登顶会!阿里云研究成果大幅提升运维智能精度与效率
- 阿里云金山算力中心加速投产,基于“真武”芯片建设超大规模算力中心
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









