扎进流程,抠到极致,走向全球:三个讯飞人的AI产业化攻坚
2026-06-17 20:28:16AI云资讯1372
AI竞争已走进产业现场:它能不能进入真实流程?能不能被装进终端、推向全球?能不能降低成本、提升效率,最终沉淀为长期可用的系统能力?
6月9日,科大讯飞27周年司庆之际公布了第九届“华夏创新奖”名单,获奖者中,郑贵、王振豪、章伟提供了三个观察切面:如何让AI扎进企业流程,把AI压进硬件终端,将中国AI推向全球市场?
企业级智能体开源项目
如何帮企业“扎进流程”?

第一个产业现场,在企业的日常系统里。
在OA、CRM、财务、法务、客服、运营等系统中,大量工作不是缺一个答案,而是卡在跨系统流转、重复录入、权限控制、任务拆解、数据核对和结果回填上。AI如果停留在聊天框里,只是一个更聪明的入口;要真正提效,就必须变成可编排、可调用、可管理、可执行的任务系统。
星辰智能体平台研发总监郑贵和团队,正是从这样的实际需求出发的。传统开放平台更多是提供标准化AI能力,开发者接入能力后自己做产品。但大模型时代,开发者和企业需要围绕模型做应用、做智能体、做业务流程,平台必须从“提供能力”转向“提供产品形态”和“落地价值”。
星辰智能体平台在企业级智能体方向进行了系统的创新探索,围绕开源、RPA原生支持和Skill全生命周期管理等关键方向,构建起面向企业级落地的智能体工程体系。在生态规模上,平台已汇聚约265万开发者。
郑贵解释道:Agent可以理解任务、拆解步骤、判断下一步怎么做;RPA可以操作电脑、手机或各种系统,把具体动作执行下去。也就是说,Agent解决决策和规划,RPA解决执行,两者结合,一个任务就能从“决策规划”走到“最终执行”。RPA解决了跨系统的链接,可以通过非侵入的方式,让老旧系统也能通过Agent实现在真实场景中提效。
以一个常见的场景为例,用户要比较多个电商平台上同一款手机的价格和评价,只靠大模型回答,数据可能不准,也无法真正进入平台操作;结合RPA后,系统可以访问平台、采集数据,再由Agent分析总结。在企业内部,简历筛选评分、单据审核、合同要素提取、舆情分析、商品详情生成、数据填报和核对,也都不再只是“问答”,而是流程被重新组织。
这背后还有一层工程能力:让Agent从“能运行”走向“可评测、可优化、可交付”。企业场景不是Demo,要求稳定、可控、可评测、可复用。MaaS负责提升模型调用效率,Agent评测保障工程可靠性,Skill生命周期管理则把流程、经验和能力沉淀为可治理、可扩展的企业级资产。
郑贵认为,过去很多企业软件,是按照人的操作界面设计的;未来,如果每个人、每个企业都有自己的数字员工或智能体,很多流程未必还需要复杂UI,而是通过Agent、API和流程编排完成。
这背后,是企业软件范式的变迁。当AI进入产业现场,真正有价值的不是多一个聊天入口,而是让AI进入组织协作的毛细血管,成为流程重构的总开关。
软硬一体
如何将AI眼镜从45克“抠到”40克?

AI进入真实世界,并不只是模型能力问题,它要进入学习机、翻译机、办公本、眼镜、机器人等终端设备,需要软硬件一体的能力。在这里,结构、材料、重量、寿命、噪声、散热、功耗和量产一致性,都会决定最终体验。
科大讯飞硬件中心结构设计二部经理王振豪负责的是精密微型传动系统。这个词听起来专业,换成大白话,就是把AI硬件里的“小机关”做到极致。用户看到的是按一下设备自然打开,是眼镜戴起来不压鼻梁,是学习机摄像头能翻转到合适角度;工程师看到的,则是电机、减速箱、铰链、阻尼、材料、散热和成百上千次一丝不苟的验证。
最能说明这种“极致工程化”的,是讯飞AI眼镜的减重。眼镜戴在脸上,每一克都关乎体验。王振豪和团队定下一个“小目标”:把重量从约45克降到40克。办法朴素得近乎“笨”——把所有零部件全部拆成几十个“零件”,每个部件多少克、能不能减重、换什么材料,逐一列出来:结构物料能不能换更轻的材质;外壳哪里可以减薄;镜框哪些位置可以优化。一个零件减0.1克,几十个零件加起来就有机会发生明显变化。这件事不是一次做完的,而是近10个月里的持续“死磕”——从45克、44克、42克、41克一步步“抠”到40克,越到最后,“抠掉”0.1克,都是挑战。如今,能实现122种语言及口音翻译的讯飞AI眼镜已成为业界同类产品中超轻的AI眼镜。
散热同样不能软硬分家。AI眼镜搭载大模型和多模态能力后,算力上来了,温升也上来了。软件要做算法优化,减少不必要的算力调用;硬件要调整材料和结构,把热量导向用户不容易感知的镜腿位置。只有软硬目标一致,产品体验才能实现“最大公约数”的效果。
翻译机的故事更像一场“工程攻坚战”。第二代双屏翻译机希望做到一键自动打开。很多供应商最初觉得做不了,因为空间太小,速度难控,传统铰链思路不适用。王振豪和团队把目标拆开:先实现功能,再控制速度,再保证寿命,再解决工程化量产。仅仅是速度控制方案,就做了30多种验证;不同油脂的种类、粘稠度、机构尺寸配合,不断反复调试。最后,团队把液态阻尼器融合进铰链,让设备不是“啪”一下弹开,而是匀速打开。
学习机的翻转模组也是同一逻辑。它不是单纯外观变化,而是让指读、作业诊断、坐姿检测进入多角度场景。摄像头能不能转到合适角度,噪声是否可接受,寿命能不能支撑长期使用,都会影响AI功能是否可以真正被用户使用。
王振豪说,硬件是软件的载体。AI如果只停留在屏幕里,就很难真正走到人的生活中。软件决定智能的高度,硬件决定这些智能是不是可以真正落到用户身边。如果将大模型看作“大脑”,那么,硬件则是让智能接触真实世界的“身体”。
“硬件最终还是为软件功能服务的,同时,有了可靠终端,AI才可能进入人的眼前、手边、车里、课堂和家庭”,王振豪这句朴素的话,也是科大讯飞“软硬一体”实践的生动诠释。
如何将中国AI智能座舱
卖给全世界司机?

一台已经量产的车,一台最新效果的车机台架,被科大讯飞智能汽车团队带到了泰国本田客户面前。
客户要解决的问题很具体:车能不能听懂当地人说话?在真实道路、真实噪声和真实网络环境中是否稳定?后续版本怎么演进?科大讯飞智能汽车海外业务部总经理章伟后来把这件事浓缩成一句话:“一个车,一个台架,就扛到客户门口。”
中国汽车工业协会数据显示,2026年1-5月,中国汽车出口405.9万辆,同比增长63%;其中,新能源汽车出口183.3万辆,同比增长1.1倍。汽车出海已经不仅仅是整车出口,而是品牌、技术、生态、本地化服务和用户体验的综合竞争。智能座舱里的语音交互,看似只是一个入口,实际影响海外用户对“中国智能化”的第一印象。
章伟最初接手汽车海外产品时,海外交互更多还停留在“有无”阶段:车上有语音,能打出智能化标签。但随着中国车企在海外规模化量产,真实用户的声音开始传回来。弱网、地库、荒郊野外、高噪道路、不同口音、不同文化习惯,都在重新检验产品。
他们很快形成两个判断。第一,海外市场的离线产品方案效果必须做好。很多地区网络条件不稳定,用户在弱网甚至无网场景下仍要完成基础车控和语音功能。第二,海外交互场景不是简单的照搬和翻译国内座舱。泰国用户特别关注降低道路噪音,中东用户有宗教与祈祷时间场景,不同市场的用车习惯、语言表达和交互风格也大不相同。
这些需求,坐在国内办公室里很难真正想清楚。章伟团队把评测搬到当地市场,和客户一起制定方案,一起选择当地最强竞品,在欧洲测英语,在中东测阿拉伯语,在日本测日语,在拉美测西班牙语。每到一个城市,靠着一台搭载自己产品的客户量产车和两台竞品车,跑出数千条体验指令,同时请当地用户上车现场打分。在一路“死磕”的路上,建立起客户的深度信任。
章伟并没有把海外交互的市场需求理解为“多做几个语言包”。他推动的是海外交互V2.0:从传统命令词,升级为多语种自由交互;从单点语音能力,走向“海外生态+海外语种”的开放融合方案。地图、音乐、新闻、天气、搜索等生态服务,都可以通过语音和智能体做统一入口,帮助车企降低多方对接成本,也改善用户体验。
这也是从项目交付到主产品建设的转变。项目交付解决眼前问题,主产品回应客户未来产品竞争力的持续需求。在章伟看来,主产品的标准模块可以复用,但每个客户、每个车型的特有需求仍要一起打磨——这套看似“笨功夫”的方法,持续在构建着别人短期难以复制的行业壁垒。据悉,至今,国车出海销量TOP10车企中有8家与科大讯飞深入合作,量产覆盖全球30多个语种、60多个国家和地区、100多个车型。
2026年5月,章伟团队拿下了本田在泰国的海外交互项目,在海外日系车企市场,第一次由中国的AI企业提供AI智能座舱解决方案,实现了“0的突破”,这也为后续中国AI进入海外本土化车企市场打下供应体系基础。
未来,这些搭载了中国AI智能座舱解决方案的汽车从泰国销往全球48个国家,覆盖8个语种。在此背后,是科大讯飞长期积累的多语种技术能力。当前,讯飞星火大模型已实现支持130+种语言,覆盖全球200多个国家和地区;星火X2升级后,多语言综合能力持续提升,尤其在欧盟、独联体、中东、拉美、东盟等区域的14个重点语种上保持效果领先。在IDC发布的《中国AI翻译技术评估》中,科大讯飞的翻译能力在全部8项评测中均获行业第一。
在章伟看来,哪里有生意就做一下、没生意就放着的“出海”,带有机会主义色彩,讯飞更想做的,是长期的全球化市场。对中国汽车产业而言,这也是从“产品出海”走向“品牌出海”的关键一步,而对章伟来说,“将中国AI智能座舱卖到全世界去,让全球汽车听见来自中国的声音”,是他的梦想。
从让AI扎进OA、CRM、财务的日常流程,到把AI眼镜一克一克抠到40克,再到把中国AI智能座舱推向全球——郑贵、王振豪、章伟做的是三件不同的事,凭的却是同一种本事:在真实现场里,把AI能力一寸一寸做“实”。把AI“烙进产业的骨架”,靠的正是这种近乎“笨”的坚持——重构流程、死磕重量、硬钢头部,这就是科大讯飞人共有的精神特质——敢为天下先、敢啃硬骨头,顶天立地,长期主义。
骨架之下,AI持续还要渗进越来越深的产业肌理。当AI走进那些最讲专业、最依赖信任的“挑剔”场景,它能不能扎得下去、扎得住,被人们放心使用?科大讯飞在继续回答这些问题。
相关文章
- 科大讯飞与万新光学集团达成战略合作,共筑AI眼镜产业新生态
- 讯飞AI眼镜亮相世界市长大会 意大利市长现场求购
- 讯飞AI眼镜登场 科大讯飞自主可控软硬一体战略再落一子
- 全国首家!讯飞AI虚拟人交互平台全量功能通过国标认证
- 涉密会议记录安全无忧,讯飞AI录音笔S6系列筑起政企办公信息防护墙
- 未来智能发布viaim讯飞智能体耳机:迈出“AI Agent”战略第一步
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 讯飞星火党政智盒发布,打造国内首个安全可控、敢用易用的党政“龙虾”
- 科大讯飞发布玲珑Agent OS,让AI真正走进企业核心业务流
- 全球首发|讯飞Astron开源项目矩阵,构建企业级智能体完整技术生态
- 2026中国翻译协会年会召开,科大讯飞携多语言AI翻译产品矩阵亮相并获评5A级企业认证
- 科大讯飞佛山人工智能产业基地正式启用,助力南海构建AI产业生态
- 科大讯飞重磅布局智能穿戴,讯飞AI眼镜开启跨语言沟通新时代
- 科大讯飞AstronClaw升级,引领AI Agent从对话走向执行
- 科大讯飞亮相2026联合国中文日,让语言无界,让文化共鸣
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









