百度研究院又出黑科技,AI新闻视频凭实力定义“剪辑大神”
2020-04-20 16:49:07AI云资讯1253
下面这个视频更是“萌”出新高度,百度研究院推出黑科技,AI竟然自己剪视频报道自己学会了做视频这个新闻。

(图片来源:视频截取,AI剪辑视频报道自己)
依托强大人工智能技术和海量数据资源优势,百度研究院孵化出业界首个支撑通用型、大规模生产的智能视频合成平台VidPress,用户仅需一键输入新闻图文内容链接,其余全部工作则交由平台自动化完成,视频素材智能化聚合、解说词生成、语音合成、音视频对齐和渲染导出整套制作流程在9分钟以内能够高效实施,生产效率和质量得到大幅提升,完美解决视频生产过程中人力成本、技术难度、素材有限、无法大规模生产等诸多难题,助力5G时代数字内容生产创作及视频化升级,实现信息更加普惠。

智能视频合成平台VidPress的高效率和高质量得到了实际验证,早已在各视频平台“遍地开花”。百度研发了分布式视频生成系统和对外服务的REST API,为好看视频大规模生产提供服务。根据好看视频使用数据, 目前生成一个时长2分钟左右的720p视频, 所需时长的中位数仅为2.5分钟;平台每天可以生产500到1000条视频,整个过程从热点发现到最终的视频生成完全无人化、自动化;此外,VidPress所生成的视频播放完成率比好看视频的大盘高出15个百分点,一些热门视频已经有了85万的播放量,足见AI新闻视频深受观众喜爱。

一键输入即可躺赢式完成新闻视频生产,剪辑界的“黑魔法”是如何实现的呢?
用户输入图文内容后, 例如输入某条新闻事件的链接,平台将基于NLP模型进行语义理解, 并通过主体模型聚合相关新闻素材,以及从同一主题相关新闻里抽取更多的素材及其语义表征,充分保障素材内容的丰富度和相关性。
紧接着,解说词语音生成和素材深度挖掘同步启动。一方面,平台基于多种语言模型对原文进行处理,自动生成一篇字数符合要求且适合视频呈现的解说词,并通过百度文字转音频服务(TTS)合成解说词语音,效果媲美播音员;与此同时, 平台会根据对原文的理解, 通过自有视频库和百度搜索引擎搜索,智能化聚合最新最适合呈现的内容,并基于人脸识别、物体识别、视频内容理解等计算机视觉服务进一步解析和理解,自动剪切和精选视频素材。
上述两个步骤完成后,平台将基于解说词音轨时间轴和所聚合的媒体片段,进入音视频对齐剪辑过程。百度升级后的第二代时间轴对齐算法,其关键在于选取出文本中的兴趣点,再将媒体片段与兴趣点进行相关度打分,将优质媒体片段优先放入时间轴,以此保证视频的整体观感和用户兴趣的持续激发。当时间轴生成完毕之后,数据转交给渲染器,从而生成一个完成的视频,整合过程耗时可以保证在9分钟以内,极其高效。
AI新闻视频仍在探索更多的可能性,例如针对不同垂直分类或投放渠道的定制合成、针对用户特点定制化视频生成以满足个性化需求等等。如有相关短视频合作需求,可联系邮箱:vidpress.support@baidu.com。不仅如此,百度并不满足于提供内容生产平台,还希望依托自身丰富的数据资源,对某一个热门新闻进行多角度观察和报道,让受众能够更客观的了解一个事件,在推动互联网内容的信息中立化中发挥更大作用。
目前,VidPress平台可以申请试用,无门槛化身“剪刀手”大神的机会你怎能错过,快来体验吧:https://ai.baidu.com/creation/external/labprojectlist。
相关文章
- 2026百度创作者大会:AI引擎赋能创作 共生共筑新生态
- 领跑中国乘用车NOA辅助驾驶地图市场份额 百度地图实力亮相2026北京车展
- 百度百科“繁星计划”再加码,投入2000万基金激励权威内容建设
- 行业首发!鸿蒙版雅迪智行App深度集成百度地图SDK,上线投屏导航,实现“抬头骑行,眼不离路”
- 百度APP用户数据再攀升:主动日活用户同比增长1.6倍、创作者规模同比增长近3成
- 行业首家!百度地图×雅迪首发支持鸿蒙投屏导航,两轮车智慧出行迈入“鸿蒙时代”
- 百度联盟启动“星云计划”:全面开放猎户座AI引擎
- 百度漫剧携手火星时代教育共建AI漫剧创作基地,打造漫剧研学产一站式生态
- 全域全场景覆盖、规模化量产领先 百度地图车道级SR导航登陆零跑D19
- 百度地图重磅发布Map Agent Plan:让每一只“龙虾”都能畅行物理世界
- 百度地图与零跑汽车合作,树立智能出行新里程碑!
- 百度地图亮相“来华通”推介会:AI重构入境游出行体验,让全球游客畅行无忧
- 天数智芯Day 0原生适配百度文心ERNIE-Image ,AI算力+开源文生图共筑AIGC新生态
- 显著降低Token消耗,百度百舸推出高效KV Cache系统
- 百度营销×喜临门:智能体守护好生意,这些人这样实现睡眠自由
- 百度智能云联合Founder Park举办AI硬件淘金局,聚焦OpenClaw驱动下的产业新机遇
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









