华为云盘古媒体大模型:三大技术创新重塑数字内容生产与应用
2024-06-23 18:52:36AI云资讯10088
在6月21日举行的华为开发者大会(HDC 2024)上,华为云推出了盘古媒体大模型,通过在语音生成、视频生成和AI翻译三方面的技术创新,重塑了内容生产和应用的新模式。
盘古媒体大模型在视频生成方面取得了显著成果。通过盘古,可以将实拍视频转换为不同风格的高清动漫。在现场演示的生成视频中,演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。这一技术的突破,为视频制作领域带来了全新的可能性,也大大提升视频制作效率,作品一次拍摄多元化制作,实现价值最大化。
在语音生成方面,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型,确保不同语言对应的口型一致,使得跨语言沟通更加自然流畅。
此外,在AI翻译方面,华为云盘古大模型也对云会议系统进行了升级。通过基于大模型的语音复刻、AI文字翻译以及TTS技术,实现了语音的同声传译。这使得不同国家的人在云视频会议中可以畅快地使用母语交流。结合数字人技术,在不方便开摄像头时,用户还可以通过数字人参会,并通过口型驱动实现数字人以各种语言说话都能精准匹配口型,如同本人说话一般。这一技术的应用,将为全球用户提供更加便捷、高效的跨语言沟通体验。华为黄超在现场演示了新的云会议系统。

华为云盘古大模型5.0的推出,将进一步推动媒体内容生产和应用的创新发展,为用户带来更多便利和价值。
相关文章
- 华为云AI战略升级:以行业智能体为中心,打造企业级AI创新“黑土地”
- 华为云陈林:只有深入了解行业、用好“数据+AI”,才能真正解决问题、创造价值
- 华为云TaurusDB数据库智胜开年季,为高并发业务打造“既稳又弹”的数据引擎
- “政策+产品+激励”三箭齐发,华为云开年采购季动员会吹响开门红冲锋号
- 华为云码道(CodeArts)代码智能体公测版正式发布,开启智能体编码新实践
- 华为云核心网开启体验经营新纪元
- 华为云完成智谱GLM-5适配,多款产品已接入可在线体验
- 华为云黄瑾:做难而正确的事,用AI解行业难题
- 高并发业务如何兼顾稳定与弹性?华为云TaurusDB给出“存算分离”新解
- 华为云安全“铁三角”,筑牢企业数智化安全底座
- 华为云发布2026年全球销售伙伴政策,与合作伙伴共赢AI时代
- 昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
- 双云并行,全球开放!玻色量子云服务又上线华为云!
- 聚力成林丨观测云荣膺华为云年度生态合作共赢奖
- 华为云CEO周跃峰:要避免AI成为“泡沫” 必须要提升行业生产力
- 让开发者无惧创新!观测云 x 华为云开发者年度会议收官
人工智能企业
更多>>人工智能硬件
更多>>- 一加 15T 搭载小屏唯一 165Hz 旗舰小直屏,引领小屏屏显体验大换代
- 鲲鹏 为更先进的数智世界而计算——李义在鲲鹏伙伴峰会2026上的主题发言
- 拥抱赋能OpenClaw智能生态,此芯科技CIX ClawCore螯芯系列芯片震撼首发
- 机械革命硬核新品京东首发 耀世18Pro巨幕旗舰、无界14轻薄本开启预约
- 无折痕折叠旗舰引爆市场:OPPO Find N6首销日湖南门店现抢购热潮
- AMD锐龙 AI MAX+ 392 移动处理器加持 华硕天选Air 2026 锐龙 AI Max版开启高效学习
- 聚焦 COSP 户外展:BleeqUp 超影擎如何用 AI 眼镜重新定义户外运动交互?
- 一加 15T 搭载 LUMO 凝光影像系统,3.5 倍潜望长焦加持拍人拍景更出彩









