可灵2.6模型上线!语音、音效与画面一键直出 重构AI视频创作工作流
2025-12-08 11:37:56AI云资讯2207
12月3日,可灵推出视频生成2.6模型,该模型提供了里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。它能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频,重构了AI视频创作工作流,极大提升创作效率。

▲ 可灵2.6功能界面
重构AI视频创作工作流 中文语音生成效果全球领先
可灵2.6模型升级了文生音画、图生音画两大功能,输入文本或是输入图片结合提示词文本,均可直接生成带有语音、音效及环境音的视频。语音当前支持生成中文以及英文,生成视频长度最长支持10秒。
该升级重构了传统AI视频创作“先生成无声的视频,再结合其他软件完成后期声音制作”的工作流,创作者使用可灵2.6模型,能够直接生成包含人声、环境与效果音效的视频,极大提升了创作者的工作效率。

▲ 可灵2.6能够生成包含人声、环境与效果音效的完整视频
通过对物理世界声音与动态画面的深度语义对齐,可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼。
音画协同上,可灵2.6模型生成的视频,在语音节奏、环境音与画面动作上紧密呼应,实现了对画面动态与声音节奏的深度对齐,避免了传统工作流可能产生的“画面一套、声音一套”的割裂体验。
音频质量上,在支持人声、音效、环境声等多类型声音生成的基础上,生成的音频音质更干净、层次更丰富,整体听感更接近真实的混音效果,满足专业级创作对声音细节的高要求。
语义理解上,该模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力,能够更准确地把握创作者意图,从而输出逻辑更严密、更贴合用户需求的音画内容。同时,可灵2.6模型在中文语音生成效果上保持全球领先。
一键“音画同出” 广告营销、自媒体、电商等创作场景迎来效率革命
可灵2.6模型支持的声音类型包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成,能够广泛地应用于广告营销、自媒体、电商等行业视频内容创作中,极大提升创作效率。
例如在广告营销行业,可灵2.6模型可一键生成含有旁白介绍、演员对白、商品展示音效等综合声音效果的广告短片,极大降低广告片拍摄的成本,提升效率。
在自媒体领域,可灵2.6模型的应用则更加广泛。通过多人对白能力,创作者可以创作包含访谈节目、剧情演绎、搞笑短剧等多类型的内容创作,还可以借助模型的音乐表演能力,进行唱歌、说唱表演、乐器演奏等类型的内容创作。运用可灵2.6模型,可大幅度降低自媒体创作者的创作成本与难度。

▲ 可灵2.6生成短片故事
在电商领域,通过单人独白、旁白解说等能力,能够完成商品展示、产品讲解等电商领域的视频内容创作,提升商家的经营效率。
可灵2.6模型的推出,进一步降低了内容创意行业视频创作的成本与难度,未来可灵AI也会持续开发更多实用功能,为创作者提供更优质、方便的AI视频创作工具。
相关文章
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 凤凰卫视×火山引擎:达成深度合作!豆包大模型助力媒体智能升级
- AI模型盛行,从哪些维度能识别最好的AI面试产品?
- 冲击百亿美金估值:阶跃星辰如何定义大模型“下半场“
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 因果大模型如何让垂直领域智能体“可解释”?零犀科技交付可靠结果的实践
- 微通人工智能科技到访百度智能云创新基地 共探大模型落地与企业AI转型新路径
- 昆仑万维携AIGC全家桶亮相2026中关村论坛,三大世界第一梯队模型正式发布
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
- 腾讯云与宇泛智能战略合作 推动机器狗“大小脑”模型优化
- 腾讯云与闪铸战略合作 混元3D大模型助力3D打印产业场景落地
- 同济大学 × 海光信息:筑牢高校大模型安全运行底座
- 重磅!中国首个民航端侧大模型标准发布 浩鲸科技牵头
- 26年大模型应用开发从现在开始学!稳了!
- 零犀科技:因果大模型+行业智能体,一家大模型应用标杆企业的技术底色与商业化路径
- 良策金宝AI 荣获 2026 GAIC“年度工程AI创新领军奖”,以垂直大模型推动“人工智能+工程设计”深度融合
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









