阿里开源模型万相2.1引爆视频赛道!谷歌/微美全息加入全模态AI开源新时代!
2025-03-04 15:48:58AI云资讯5478
据报道,阿里(BABA.US)生成基座模型万相2.1(Wan)宣布开源,在评测集中,超越Sora、Luma等模型,位列榜首。

开源最强视频大模型亮相
获悉,万相2.1共有两个参数规模,140亿参数模型适用于对生成效果要求更高的专业人士,13亿参数模型生成速度较快且能兼容所有消费级GPU,两个模型的全部推理代码和权重已全部开源。
在视频生成方面,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,同时支持文生视频、图生视频、视频编辑、文生图和视频生音频等多项任务。

据此前介绍,万相2.1支持中英文视频,可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等。
分析人士称,随着万相2.1模型开源,标志着阿里云实现了全模态、全尺寸的开源。这意味着更多的开发者,将能够低成本获取并使用该模型底层代码,进而用以开展与自身业务相关的各类视频生成应用。

开启全模态开源新时代
自2025年以来,开源趋势逐渐成为全球大模型领域的标配。国内方面,进入2月,多家企业纷纷推出了各自的开源模型,包括字节跳动的豆包以及百度的文心一言等,共同掀起了新一轮的开源热潮。
国际方面,随着万相2.1完全开源,OpenAI、谷歌等竞品也将直面商业化的挑战:更好的模型已经开源了,AI生成视频的定价也将面临挑战。谷歌Veo 2模型近期披露定价,每生成1秒视频需要付费0.5美元,相当于生成一个小时的视频需要花费1800美元。

微美全息开源多模态应用场景拓展
公开资料显示,微美全息(WIMI.US)在AI视频生成领域有显著布局,涵盖大语言、多模态等领域,面对开源视频生成大模型赛道,从大语言模型到视觉生成模型,从基础模型到多样化的衍生模型,实现了全模态、全尺寸的开源,微美全息AI开源生态的发展正不断被注入强大的动力。
事实上,近些年来,微美全息专注于多模态AIGC(生成式AI)研发,技术核心在于结合大规模预训练与多模态算法优化,提升生成内容的连贯性和物理合理性。同时在行业生态上,微美全息已逐步实现文本生成视频、图像生成视频等能力,支持剧情创作、短视频生成等场景,未来可能通过API或行业解决方案,加速AI快速生成视频能力技术迭代。
结语
未来,AI模型将进入一个分水岭,机构普遍认为,阿里此举将加速AI视频技术商业化落地,并推动算力、云计算、内容创作等全产业链升级。所以说,AI下半场,不是简单的技术竞赛,而是一场关于资源、效率和成本的综合博弈,这一新的革命正在加速中。
相关文章
- 牧原携手阿里云共建养猪大模型 AI赋能传统产业升级
- 阿里MuleRun上线多任务模式,打造永久留存、独立交互的Agent团队
- 阿里云发布AI视频创作平台“万镜一刻”,打通短漫剧和营销视频生成全流程
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 阿里云发布Token-Watt八大前沿课题,推动共建算电协同新业态
- 福客AI获阿里战略投资,持续加码电商数字生产力建设
- 福客AI获阿里战略投资,让AI Agent成为电商企业新的生产力
- 阿里前同学推出零门槛 AI 开发工具 AgentMa,一句话生成可上线应用
- 阿里云推出企业级Agent构建平台JVS Crew:零代码“建龙虾工厂”
- 阿里妈妈AI万相:万相智识、万相智品、万相智造与万相智投的电商经营逻辑解析
- 经纬天地(02477.HK)换帅:阿里系高管入局,FoPay的战略意图与落地挑战
- 至强® 6处理器在阿里云第九代ECS实例中的应用案例:货拉拉大促高并发实践
- 合合信息亮相2026金融AI联盟大会,携手阿里云共同启动“超级智能体计划”
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 当虹科技获评阿里“玄铁优选伙伴” 加速适配新一代旗舰CPU
- 阿里云数字短信全量开放,终端全覆盖实现营销短信点击率3倍提升
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









