优刻得抢先接入DeepSeek-V3.2-Exp
2025-09-30 09:08:51AI云资讯1998
9月29日晚,DeepSeek-V3.2-Exp模型正式发布。优刻得模型服务平台UModelVerse极速完成接入,作为AI应用开发者,无需关注底层算力资源调度、基础环境的模型部署,UModelVerse控制台全面覆盖从模型训练到应用上线的全流程,轻松实现业务模型的快速落地与迭代,欢迎登陆体验!
UModelVerse控制台模型广场
官方表示DeepSeek-V3.2-Exp是一个实验性(Experimental)的版本,是迈向新一代架构的中间步骤。V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
稀疏注意力机制(DSA)
DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
V3.1-Terminus和V3.2-Exp在BrowseComp和SWE Verified上的强化学习训练曲线,实线和虚线分别表示准确率和平均输出tokens
V3.1-Terminus和V3.2-Exp推理成本对比
与之前模型最大的不同在于,DSA不再要求每个Token关注序列中的所有其他Token,而是引入了一个名为「闪电索引器」(lightning indexer)的高效组件。这个索引器能以极快的速度判断,对于当前正在处理的Token,序列中哪些历史Token是最重要的。随后,模型仅从这些关键Token中筛选出少量(例如Top-k,取2048个)进行精细计算,从而在处理长文本时显著提升效率。更重要的是,这种设计在实现效率飞跃的同时,并未牺牲模型的核心性能。
DeepSeek-V3.2-Exp的注意力架构
根据官方公布的评测结果,在与前代模型V3.1-Terminus严格对齐的训练设置下,V3.2-Exp在各大公开基准测试中的表现与前者基本持平。
V3.1-Terminus和V3.2-Exp在各基准下测评对比
此外,为支持社区研究,DeepSeek还开源了新模型研究中设计和实现的GPU 算子,包括TileLang和CUDA两种版本。官方团队建议在进行研究性实验时,优先使用基于TileLang的版本,以便于调试和快速迭代。
得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
登录UModelVerse一键调用
步骤一:注册并登录UCloud云平台
平台地址:https://console.ucloud.cn/modelverse/model-center
步骤二:实名认证
使用模型服务前用户需要完成实名认证。
步骤三:创建API Key
进入UModelVerse-API Key管理。
平台地址:https://console.ucloud.cn/modelverse/experience/api-keys
点击左上角创建一个Key,新用户注册免费50万tokens。
步骤四:发送请求
相关文章
- 优刻得抢先接入DeepSeek-V3.2-Exp
- 优刻得参加联合国工发组织全球工业与制造业人工智能联盟大会
- 优刻得模型服务能力获认可,入围清华大学权威榜单
- 优刻得参加第十届“一带一路”高峰论坛
- 优刻得携手贝塔智能:以长期技术投入,共筑AI普惠未来
- 优刻得x天河计算机,打造天津首个公共信创云
- 优刻得2025上半年业绩快报:营收利润双增长
- 深化战略合作,优刻得接入智谱最强开源多模态GLM-4.5V
- 优刻得x立昂云数据,战略共建AI智算资源池
- 多方协同,优刻得签署算力生态伙伴合作协议
- 优刻得x创新奇智,工业AI Agent一站式开发上岗
- 强!优刻得私有云再次榜上有名!
- 优刻得在行动!助力全球主权AI建设
- 优刻得「优启计划」,助力AI创业者梦想起航
- 这些高校都选择了优刻得
- 秘塔AI x 优刻得,让搜索回归本质