Adobe进军生成式人工智能视频领域 推出文生视频AI模型
2024-10-15 06:46:32AI云资讯10705

(AI云资讯消息)Adobe公司正进军生成式AI视频领域。自今年年初以来,Adobe的Firefly视频模型就已开始预热,现在将在包括Premiere Pro在内的一些新工具中推出,使创作者能够扩展视频片段并从静止图像和文本提示中生成视频。
第一款工具是生成式延伸,现已在Premiere Pro中进行beta测试。它可以用于延长略短的镜头的结尾或开头,或者在拍摄过程中进行调整,比如纠正因眼神飘移或意外动作而产生的问题。
剪辑只能延长两秒钟,因此生成性扩展仅适用于小的调整,但它可以取代重新拍摄镜头以纠正细微问题的需要。扩展的剪辑可以以720p或1080p的分辨率和24帧每秒的帧率生成。它也可以用于音频,帮助平滑剪辑。比如它可以将音效和环境音延长至多10秒。

另有两款视频生成工具即将在网络上推出。Adobe的文本转视频和图片转视频工具于今年9月首次亮相,现已作为有限的公开测试版在Firefly网页应用中推出。
文本转视频的工作原理与Runway和OpenAI的Sora等其他视频生成器类似,用户只需将所需生成的内容的文本描述输入其中即可。它可以模拟各种风格,如常规的真实电影、3D动画和定格动画,生成的片段还可以通过一系列模拟摄像机控制的设置进一步细化,这些选项模拟了诸如摄像角度、运动和拍摄距离等元素。

图像转视频功能更进一步,让用户在文本提示旁边添加参考图像,以更好地控制生成的结果。Adobe建议该功能可用于从图像和照片中生成备播片段,或通过上传现有视频中的静帧来帮助可视化重拍场景。然而,下图的前后对比显示,该功能实际上并不能直接替代重拍,因为在生成的结果中可以看到一些错误,如晃动的电缆和移动的背景等。

短期内也不可能用这项技术来制作完整的电影。目前,文本转视频和图片转视频的片段的最大长度为5秒,画质最高为720p和24帧每秒。相比之下,OpenAI表示Sora可以生成长达一分钟的视频同时保持视觉质量和遵循用户的提示,但这一功能虽然在几个月前就已宣布,但目前尚未对公众开放,比Adobe的工具晚了几个月。

文本转视频、图像转视频和生成式延伸功能都需要大约90秒的时间来生成,但Adobe表示正在开发加速模式来缩短这一时间。尽管目前存在局限,但Adobe表示其基于AI视频模型的工具在商业上是安全的,因为它们是基于创意软件巨头被允许使用的内容进行训练的。考虑到其他供应商如Runway的模型被指控训练数据来自数千个从YouTube上抓取的视频,对于某些用户来说,商业可行性可能是决定性的因素。
另一个好处是,使用Adobe的Firefly视频模型创建或编辑的视频可以嵌入Content Credentials,以帮助在发布到网上时披露AI的使用情况和所有权权利。目前这些工具还处于测试阶段,但至少它们已向公众开放——这比我们能对Open AI的Sora、Meta的Movie Gen和谷歌的Veo生成器说的要多。
Adobe在Adobe MAX大会上宣布了AI视频发布功能,还在其创意应用程序中推出了一系列基于AI的功能。
相关文章
- 中国—东盟人工智能产业创新中心成立
- 优步总裁称人工智能支出越来越难以证明其合理性
- 国家艺术基金《人工智能时代数字音乐产业人才培养》项目圆满收官
- 让AI进入真实法律交付环节——星云衡律携Nebulaw亮相2026全球人工智能终端展
- FONE正式加入中国人工智能产业发展联盟,引领业财AI智能体应用新范式
- 酷赛智能入选2026福布斯中国人工智能全球化标杆企业榜单
- 丈八科技与浪潮海若达成战略合作:共建人工智能产测一体化超级工厂
- 谷歌搜索的人工智能进化包含更多广告
- 马啸获评2026福布斯中国人工智能影响力人物,未来智能同步斩获商业落地示范企业奖
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









