IBM 宣布在 watsonx 上提供开源的 Mistral AI 模型----扩大模型选择范围,帮助企业以可信和灵活的方式扩展 AI
2024-03-11 12:08:18AI云资讯1499
IBM 提供 Mixtral-8x7B 的优化版本,该版本可将延迟时间最多缩短 75%
IBM、第三方和开源模型的目录不断增加,为客户提供更多选择和灵活性
是watsonx 人工智能与数据平台上最新的开源模型,watsonx提供企业就绪的人工智能开发平台、数据存储和治理功能
北京2024年3月11日 -- IBM(纽约证券交易所代码:IBM)近日宣布,由Mistral AI公司开发的广受欢迎的开源Mixtral-8x7B大型语言模型(LLM)已经可在其watsonx人工智能与数据平台上使用。

IBM_watson_x_social
IBM 提供了Mixtral-8x7B 的优化版本,在内部测试中,与常规模型相比,该版本能够将吞吐量(即在给定时间段内可处理的数据量)提高50%[i]。这可能可以将时间延迟减少35-75%,从而加快获得洞察的时间,具体取决于批处理量的大小。这是通过一个称为量化的过程来实现的,该过程减少了LLM 的模型大小和内存需求,进而可以加快处理速度,有助于降低成本和能耗。
Mixtral-8x7B 的加入扩展了IBM 的开放、多模型战略,随时随地满足客户的需求,并为他们提供选择和灵活性,使其可以跨业务来扩展其企业级人工智能解决方案。通过数十年的人工智能研发、与Meta和Hugging Face开放式协作,以及与模型领导者的合作伙伴关系,IBM 正在扩展其watsonx.ai 模型目录,并引入新的功能、语言和模式。
IBM 的企业就绪基础模型选择及其watsonx 人工智能和数据平台可帮助客户利用生成式人工智能获得新的洞察力和效率,并基于信任原则创建新的业务模式。IBM 可帮助客户根据所针对的业务领域(如金融)的合适用例及性价比目标来选择合适的模型。
Mixtral-8x7B 结合了稀疏建模与专家混合技术来构建,"稀疏建模"是只查找和使用数据中最重要部分以创建更高效的模型的创新技术;而"专家混合技术"是把擅长并解决不同部分问题的不同模型("专家")结合在一起的技术。Mixtral-8x7B 模型因其能够快速处理和分析海量数据以提供与上下文相关的见解而广为人知。
IBM软件公司产品管理与增长高级副总裁Kareem Yusuf博士表示:"客户要求在部署最适合其独特用例和业务要求的模型时拥有选择权和灵活性。通过在watsonx上提供Mixtral-8x7B和其它模型,我们不仅为客户提供了部署人工智能的可选性,还为人工智能构建者和业务领导者提供了一个强大的生态系统,使他们能够利用工具和技术推动不同行业和领域的创新。"
在同一周,IBM还宣布在watsonx上提供由ELYZA公司开源的日本LLM模型ELYZA-japanese-Llama-2-7b。IBM 还在watsonx 上提供Meta 的开源模型Llama-2-13B-chat 和Llama-2-70B-chat 以及其它第三方模型,未来几个月还将推出更多模型。
有关IBM未来方向和意图的声明如有更改或撤回,恕不另行通知,仅代表目标和目的。
相关文章
- IBM咨询扩展人工智能能力,加速企业转型
- IBM全面发布IBM Sovereign Core,助力实现数字自主
- Think 2026全新发布:IBM推出“AI运营模式”蓝图,弥合日益扩大的AI鸿沟
- IBM Bob正式发布:贯穿软件开发全生命周期,助力企业从AI辅助编程迈向生产就绪软件
- 媒体观察:让AI走向数据,IBM重写存储“第一性原理”
- IBM咨询陈科典:问题出在“碎片化”,解法在“系统化”
- IBM携手中国伙伴“AI深耕”:从技术落地到价值共创,全面推动企业智能化升级
- 大湾区新五年:以「协同力」,抓住企业增长的新红利|IBM咨询张信一、李子彦
- IBM完成对Confluent的收购,让实时数据成为企业级AI与智能体的引擎
- IBM发布大中华区最新战略:以“创业”姿态、开放技术和行业深耕,开启“由守转攻”新阶段
- IBM发布《2026年X-Force威胁情报指数报告》
- IBM推出AI智能体驱动的FlashSystem全闪存产品组合,开启“自主存储”新时代
- IBM大中华区董事长、总经理陈旭东的2026新春寄语:携手开启下一个“黄金时代”
- 格莱美X IBM|技术与热爱共鸣,让百万乐迷‘AI'上新体验
- IBM发布 IBM Enterprise Advantage服务,助力企业规模化落地智能体AI
- IBM与客户共谱AI长期发展蓝图
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









