可灵AI又放大招!“多图参考”上线 解锁创意视频新姿势
2025-01-23 08:55:20AI云资讯28247
近日,快手可灵AI正式面向全球推出“多图参考”模式,该功能能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。

目前,全球用户均可在可灵1.6模型下,使用“多图参考”功能。用户只需选择图生视频,上传1-4张参考图,框选图片中需要使用的人物、动物、物品或场景,并通过“提示词”描述它们之间的变化或互动,可灵AI即可结合所有参考内容并遵从指令生成视频。

用户可以上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频,帮助用户在制作AI视频时保证多镜头中的主体一致。例如,用户上传猫、夹克、太阳镜三张图片,并输入提示词“一只身穿夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势,”随后进行生成,就可以得到符合指令的视频。

此外,用户还可以通过参考图来指定场景、服装和动作等,让人物在特定环境中完成特定“演出”,大幅提升创作的可控性。例如,我们分别上传一个老爷爷、一杯咖啡、咖啡馆场景三张参考图片,并输入相应提示词“一个卡通风格的老爷爷在咖啡馆里,端起咖啡杯”来进行生成,便可得到老爷爷坐在咖啡馆里喝咖啡的视频 。

同时,“多图参考”还可以支持不同角色之间的互动。用户可以上传多个人物、动物或者影视角色等图片,并用文字描述他们之间的互动。例如,我们分别上传小男孩、柯基犬两张参考图,并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”,即可生成下图所示的视频。

此前,可灵AI已在全球上线“人脸模型”功能,支持用户通过上传多段视频来训练、定制人脸模型,并参照该人脸模型继续生成视频内容。作为业内首个视频模型定制功能,“人脸模型”创新性地满足了用户创作多个包含同一人物镜头的需求。
随着“多图参考”功能的推出,可灵AI进一步解决了视频生成中的一致性难题,帮助用户充分发挥创造力,自由组合各种图片元素,打造独特的创意场景,探索更多可能。
相关文章
- 快手全新「检索数据引擎」CroPS 入选AAAI 2026 Oral
- 快手直播平台被黑灰产入侵,企业内网暴露的风险有多大?
- 让搜索更懂你 快手自研UniDex与UniSearch实现新一代工业级搜索
- 快手发布EMER框架,“自进化”AI重塑短视频推荐模式
- 登顶SWE-Bench,快手KAT-Dev-72B-Exp刷新开源SOTA
- 神眸荣获快手“品牌标杆奖”,以芯片级创新跻身行业前列
- 快手发布多模态大模型Keye-VL-1.5 8B性能领先、视频理解能力更强
- 累计生成超2亿视频,快手可灵AI引领“生成式AI应用元年”
- CVPR2025:快手可灵四大技术方向布局视频生成及世界模型
- 快手上线鸿蒙应用高性能解决方案 高效提升数据反序列化性能
- 快手与杜比实验室达成深度合作 短视频领域首家全链路支持“杜比视界”
- 快手与清华大学联合项目荣获钱伟长中文信息处理科学技术奖
- 人工智能智库网络在京启动,百度、快手、华为、蚂蚁、腾讯、阿里等发起
- 快手可灵AI面向全球发布1.5模型 新增“运动笔刷”效果业内领先
- 蓝色光标Blue AI携手快手可灵AI,共同引领AI视频生成新时代
- 快手出席2024中国多媒体大会:AI驱动多媒体创新 构建AI产学研生态
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+
- 媲美DeepSeek NSA!腾讯优图提出混合注意力机制SSA,长上下文外推更强
- SOTA达成!腾讯优图D-Search算法登顶国际AI权威榜单
- 智象未来团队荣获ACM Multimedia 2025最佳演示奖,多模态生成式AI技术领跑全球









