声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互
2025-09-08 18:24:24AI云资讯6172
据声网兄弟公司 Agora 的blog,近日 Agora 宣布对OpenAI Realtime API的支持进一步升级和优化,新增自动问候、混合模态交互、选择性注意力锁定等更先进的功能,这些功能现已全面开放,将为用户与AI 智能体提供更自然的交互体验。

Agora与OpenAI于去年10月达成合作,Realtime API是首个集成到 Agora平台中的多模态大语言模型(MLLM)。该联合解决方案通过降低开发复杂度,同时释放实时互动中的先进功能,助力开发人员打造更自然、响应更迅速且更具人性化的 AI 智能体。
Agora 对话式 AI 引擎现新增以下功能,助力实现人与 AI 智能体的自然交互:
●自动问候:确保实时感知会话状态,并提供自然、友好的初始交互体验。
●混合模态交互:支持在单个交互会话内,实现语音与文本输入的无缝切换。
●灵活的话轮检测选项:为开发者提供对对话流程和话轮转换行为的精细化控制。
●无中断输入:通过选择性注意力锁定技术,可过滤环境噪音与干扰语音,确保交互过程不中断。
这套方案不仅能简化Realtime API的应用流程,还能为多模态 AI 智能体解锁全新功能与应用场景。将 OpenAI的实时语言模型与声网的全球实时网络基础设施(SD-RTN)及定制化开发者工具包相结合后,开发者既能缩短产品上市时间、简化应用开发流程,又能交付更优质的实时对话式 AI 体验。
据悉,机器人技术初创公司Carbon Origins已在通过 Agora的技术以及 OpenAI RealtimeAPI 实现重型设备的无接触操作,提升操作人员的工作效率。
相关文章
- 物理世界智能的优化:从文本思考到多模态思考
- 深耕AI+音视频二十载,佰锐科技多模态行为风险识别跻身行业第一梯队
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 算力与模型同频共振:天数智芯Day 0 深度适配 SenseNova U1,共筑多模态AI新底座
- 专攻AI供应链治理痛点!多模态SCA智能情报驱动,以AI治理AI实现全域风险可控!
- VPU:多模态AI时代下的视频算力变革
- 海康威视徐习明:聚焦感知多模态大模型,为中国制造业发展服务
- 天数智芯完成Qwen3.5 多模态模型全量适配 全栈技术筑牢生态适配硬实力
- 直击AI多模态媒资痛点!当虹科技荣获浙江省科学技术进步奖
- 小度全系产品将集结亮相AWE 2026,“超能小度”多模态能力成最大看点
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 合合信息发布多模态大模型文本智能白皮书,破解复杂文档处理困局
- 合合信息发布多模态大模型文本智能白皮书,五大核心能力标准引领复杂文档处理变革
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 三维天地推出多模态数据湖产品SW-DBLake,重新定义AI时代的数据基石
- 从“物理堆叠”到“化学反应”:喜相逢以多模态融合重塑智能驾驶感知生态
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









