华为云盘古媒体大模型:三大技术创新重塑数字内容生产与应用
2024-06-23 18:52:36AI云资讯10292
在6月21日举行的华为开发者大会(HDC 2024)上,华为云推出了盘古媒体大模型,通过在语音生成、视频生成和AI翻译三方面的技术创新,重塑了内容生产和应用的新模式。
盘古媒体大模型在视频生成方面取得了显著成果。通过盘古,可以将实拍视频转换为不同风格的高清动漫。在现场演示的生成视频中,演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。这一技术的突破,为视频制作领域带来了全新的可能性,也大大提升视频制作效率,作品一次拍摄多元化制作,实现价值最大化。
在语音生成方面,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型,确保不同语言对应的口型一致,使得跨语言沟通更加自然流畅。
此外,在AI翻译方面,华为云盘古大模型也对云会议系统进行了升级。通过基于大模型的语音复刻、AI文字翻译以及TTS技术,实现了语音的同声传译。这使得不同国家的人在云视频会议中可以畅快地使用母语交流。结合数字人技术,在不方便开摄像头时,用户还可以通过数字人参会,并通过口型驱动实现数字人以各种语言说话都能精准匹配口型,如同本人说话一般。这一技术的应用,将为全球用户提供更加便捷、高效的跨语言沟通体验。华为黄超在现场演示了新的云会议系统。

华为云盘古大模型5.0的推出,将进一步推动媒体内容生产和应用的创新发展,为用户带来更多便利和价值。
相关文章
- 华为云空间Cloud Kit全新升级:开放Web端与云图库接入,赋能全场景数据协同
- 华为云Stack携手灵雀云发布企业级AI云智一体化联合解决方案
- 2026华为云全球销售伙伴峰会:发布AI场景化解决方案,携手伙伴共赢AI时代
- 华为云正式启动首届具身智能大赛,汇聚力量攻克机器人应用技术瓶颈
- 华为云郭婷:破解企业的“AI焦虑”,关键在于选对场景
- 明源云亮相2026华为云创想者大会,发布最新不动产AI实战成果
- 2026华为云创想者大会|华为云数据库全系AI升级,拥抱Agentic新时代
- 技术开放、行业共创、应用繁荣,华为云加速构建AI共赢生态
- 华为云发布十余款AI新品,全面布局Agentic AI时代
- 周跃峰:华为云要在智能体时代成为一朵最开放的云
- 华为云联合TOP模型厂商发布“百模千态,云聚共赢”生态合作计划
- 深耕九载结硕果,中软国际亮相2026华为云全球销售伙伴大会
- 华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”
- 以“安全稳定高质量”为生命线,华为云超1000天无重大事故
- 华为云发布“行业AI梦工厂”四大专区 加速实现AI普惠
- 打造连接人类世界与硅基世界的“翻译器”,华为云码道用户数突破十万
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









