NVIDIA利用人工智能将标准视频转换为高清慢镜视频
2018-06-20 13:57:06AI云资讯1828
NVIDIA (NASDAQ: NVDA) 的研究人员日前研发出一个基于深度学习的系统,能够将每秒30帧的视频转换为高清慢镜视频,其效果优于其它同类方法当前能够实现的最佳效果。
研究人员在其研究论文中写道,“生活中有许多难忘时刻单凭肉眼很难看清,这时你可能想要用慢镜头记录下来,例如婴儿第一次蹒跚学步、高难度的滑板技巧、爱犬成功接球等。”“虽然可以用手机拍摄每秒240帧视频,但用手机以高帧率完成所有拍摄的做法也并不实际,因为这需要很大的内存空间,而且功耗很大。”
而基于这项新的研发成果,用户则可以在拍摄视频后制作慢镜视频。
研究团队利用NVIDIA Tesla V100 GPU和cuDNN加速的PyTorch深度学习框架,基于1.1万多个日常和体育活动视频,以每秒240帧的速率对系统进行了训练。训练完成后,卷积神经网络便能对更多的视频帧进行预测。
团队采用了另一套数据集来验证系统的精确度。结果表明系统能够使以较低帧率拍摄的视频看起来更加流畅且清晰。
研究人员表示:“NVIDIA采用的方法能够生成多个时空连贯的中间帧。我们的多帧法始终优于当前最佳的单帧法。”
为展示研究成果,研究团队从著名的在线科技系列视频《The Slow Mo Guys》中截取了多个片段,并进一步放缓了视频速度。以每秒30帧的速率拍摄,之后转换为每秒240帧的视频。
欲了解视频显示效果,请前往以下地址观看
Huaizu Jiang、Deqing Sun、Varun Jampani、Ming-Hsuan Yang、Erik Learned-Mille和Jan Kautz等研究人员将于6月21日(星期四)下午2:50 - 4:30在犹他州盐湖城举办的年度计算机视觉与模式识别(CVPR)大会上展示其研究成果。
关于NVIDIA
NVIDIA(纳斯达克股票代码:NVDA)是一家人工智能计算公司。它在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡,并且对并行计算进行了革新。最近,通过将GPU作为可以感知和理解世界的计算机、机器人乃至自动驾驶汽车的大脑,GPU深度学习再度点燃了全新的计算时代--现代人工智能。
相关文章
- Akamai携手NVIDIA实现首个全球规模化部署的NVIDIA AI Grid平台
- Qt Group 加入 NVIDIA Halos 认证计划,加速物理AI的安全自动化
- NVIDIA 通过 RTX PRO 服务器实现游戏开发虚拟化
- NVIDIA 推出代理式 AI 蓝图与电信推理模型,推动自主网络发展
- Check Point 携手 NVIDIA 构建企业级AI 全栈安全体系
- 超聚变专用计算旗舰产品X3智能工作站,搭载NVIDIA驱动打造AI就绪算力
- FLUX.2 图像生成模型发布,针对 NVIDIA RTX GPU 优化
- 超擎数智亮相 NVIDIA 中国开发者日2025,携手开发者,探索AI无限前景
- 超擎数智亮相 NVIDIA 中国开发者日2025,携手开发者,探索AI无限前景!
- 实现吉瓦级灵活部署:维谛推出面向NVIDIA Omniverse DSX蓝图的快速交付系统级参考架构
- 三星携手NVIDIA 以全新AI工厂引领全球智能制造转型
- 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动!
- NVIDIA DLSS 4 技术加速游戏体验,沉浸3A首选华硕天选6 Pro锐龙版
- 从概念愿景到工程就绪:维谛携手NVIDIA推进800 VDC 平台设计,助力下一代AI工厂建设
- 亚信科技融合NVIDIA Omniverse,驱动制造业向“智造”跃升
- 绝影亮相NVIDIA展台,端侧多模态大模型落地成果显著
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









