声网发布Linux Server SDK 支持大模型Python与Go语言
2024-07-29 12:23:58AI云资讯1440
AIGC 和 大语言模型 LLM 的快速发展正推动人工智能领域的进步和创新,LLM 作为 AIGC 的核心模块,其发展尤为引人注目。随着技术的不断进步,大语言模型的能力也不断进化,一方面,训练数据量与算力的提升,AI 的生成内容更精准、更智能;另一方面,大模型的交互方式,也从文本升级为音频、视频的多模态,可以支持人与AI的语音对话等。
在多模态大模型的趋势下,RTC成为了人与AI交互中的重要一环,越来越多的企业与开发者纷纷探索在大语言模型或者AI应用场景中快速集成高效的音视频能力,构建AI陪聊、AI口语老师等一系列场景。
对此,声网推出Linux Server SDK,支持当下大模型编程最主流的两类语言Python与Go,企业可基于声网Linux SDK,快速接入大模型,上线具备RTC传输能力的AI应用场景,如AI语音助手、AI口语老师、虚拟恋人、多人语音游戏等。
声网Linux Server SDK以API的形式提供了一系列的功能,例如Linux Server SDK for Go可支持连接管理、信令发送、音频订阅与推送、事件回调通知等,其中信令传输能力不仅可应用于创建DataStream数据流,并发送信令,也能应用在大模型中发送数据流消息,例如将TTS、STT和LLM的结果发送给客户端。
此外,Linux Server SDK还提供了使用时序的教程,从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述,帮助开发者快速上手。

声网LinuxServer SDK客户集成实践图
凭借在RTC行业日积月累的深耕细作,声网Linux Server SDK在RTC的低延时、抗弱网、跨国传输、并发等方面具备优秀的性能。
·低延时与全球部署:声网自研的SD-RTN™实时传输网络覆盖了全球200多个国家与地区,音视频的全球端到端延迟平均达到200ms。声网还通过优化网络传输协议和算法,进一步降低音视频传输的延迟。
·智能路由与抗弱网:针对网络环境的波动,声网的智能路由技术能够根据用户的网络状况自动选择最优的网络路径,确保通话的稳定性和流畅性。声网的抗弱网传输与抗丢包算法,结合网络探测、抗丢包技术、自适应jitter buffer、网络拥塞控制策略等,为用户在各种网络环境下提供流畅的互动体验。
·30000+终端机型适配:由于不同的设备可能对于语音处理效果产生影响,声网的RTC SDK支持30000+终端机型适配,中低端机型覆盖广,帮助大模型与客户解决了多设备兼容性的后顾之忧。
·并发性能:客户集成声网Linux Server SDK后可支持上百路的音视频并发。
·支持多频道多路流:声网SDK支持用户同时加入多个频道,同一时间可以在多个频道中接收和发布音视频流。
目前声网Linux Server SDK为Alpha版。相关文章
- 万亿分钟级验证 能嵌入业务系统的声网智能云会议引擎来了
- 赋能中小企业智能化升级:声网对话式 AI 引擎荣膺“AI+ 行业优秀案例奖”
- 爆火Elys + 声网对话式AI引擎,把社交交给AI赛博分身
- 从0到1亿用户:声网 与Monkey十年合作,把实时互动做到“无感“
- MiniMax IPO 落地!声网与其战略合作再深化
- 定义“情感科技”新赛道,二白智能获千万融资,并携手声网登陆CES 2026
- 声网联合博通集成于CES 2026发布 R2 全场景 AI 机器人开发套件
- 声网在CES 2026期间宣布开源 AOSL,构建AI硬件开放新生态
- 声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖
- 声网斩获三项大奖:当 RTE 遇上对话式 AI ,实时互动就“活”了
- 声网对话式 AI Studio 零代码也能快速开发对话式 Agent
- 声网联合中国信通院牵头发布实时音视频类 SDK 安全标准
- 双奖印证路径:声网以“ RTE + AI ”驱动产业纵深与体验革新
- AI 有声,对话有温度,声网发布《2025对话式 AI 发展白皮书》
- 声网AI模型评测平台新增多项评测维度,模型选择数量提升3倍
- 声网联合展锐、谨讯发布R1-4G开发套件 让AI硬件随身相伴
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









