RockAI参与上海市政协重点课题调研,共话大模型技术发展与实践革新
2024-04-22 17:06:01AI云资讯1701
4月18日,上海市政协经济和金融委员会开展“加快新旧动能转换,推动制造业高质量发展”重点课题调研,围绕人工智能产业邀请相关部门和企业座谈交流。岩山科技旗下上海岩芯数智(以下简称“RockAI”)以其在人工智能技术领域的深厚积累和创新能力,受邀参与此次座谈,共话大模型产业发展新趋势。

本次座谈会由市政协经济和金融委员会主任严旭主持,特别邀请市政协副主席肖贵玉、寿子琪参与,徐汇区委书记曹立强陪同调研。座谈会上,市领导就“通用人工智能大模型国内外企业差距”的话题询问企业的发展意见。部分企业认为,国内人工智能大模型已经从去年的“百模大战”进入“淘汰赛”阶段,当前大模型企业发展的痛点主要是算力和人才。作为以认知智能为基础、专注于自然语言理解及人机交互等核心技术的创新型企业,岩芯数智代表行业前沿,积极参与并贡献了专业见解。
RockAI企业代表邹佳思认为,虽然在短期内算力和人才是推动大模型发展的关键要素,但从长远看,底层技术的创新可能才是关键所在。以GPT4大参数大算力的相关数据为例,GPT4由16个1100亿的模型通过MOE架构组成,经过百天在两万张卡上完成训练,耗电量巨大,应验了算力的尽头是电力。而GPT5拥有更大的参数、更大的数据,需要更多的GPU算力,这些要素都是目前国内大模型企业面临的困难。另一方面,目前主流基于Transformer架构的模型有着与生俱来的幻觉问题,在个人场景也许是创造力的表现,但是跟很多企业落地场景是有天然冲突的。
提及“GPT5会给国内大模型企业带来哪些挑战”,邹佳思表示,虽然主流架构的Scaling Law依然生效且没到天花板,但是我们也注意到Transformer架构跟人脑的工作模式是不一致的,人的大脑有800-1000亿神经元,不但可以局部激活而且能工作在20瓦的低功率之下。国内一方面固然需要沿着OpenAI路线进行追赶,但是换个角度,底层架构的创新以及针对企业场景的模型创新或许是新的机遇。
据悉,通过持续加强核心算法自研和技术探索,RockAI已从零开始完全自主研发设计了Yan架构,并于2024年1月发布了国内首个非Attention机制的通用大模型——“Yan1.0模型”。该创新架构重点关注大模型算力和幻觉问题,可助力大模型在金融、能源、制造、医疗等风险敏感领域实现广泛应用,提供性价比更高、更便捷、更可控的AI服务。目前,RockAI已与上海工创中心、华为昇腾、广电五舟等科技企业达成战略合作,接下来将携手生态伙伴进一步推动创新升级和生态建设。
“我们现在要做的是种一个种子下去,让这个种子具有良好的基因,发育成一个胚胎,最后形成一个巨人。”市政协副主席肖贵玉说,人工智能背后有巨大的想象空间,而大模型正引领新一轮人工智能变革,已经成为全球科技竞争的焦点。他希望各位企业家脚踏实地为“打造基因”献计献策。针对现有教育难以支撑先导产业和未来产业发展的局面,他表示,要在机制层面解决人才问题:在教育端创新改革,连接高校和企业的合作渠道,达到依靠自身的教育体系为企业提供高端人才人力资源支撑的目的。
“上海要打造AI高地,重点在落地应用,赋能各行各业解决各类问题。”座谈会进入尾声,市政协副主席寿子琪总结到,希望能聚焦“基础大模型怎么做”“架构上如何寻找更优解”“是否能打造本地人工智能企业”等展开调研,争取率先在具体领域应用取得突破,对上海推进人工智能产业发展意义重大。
此次座谈会为RockAI提供了与政府部门、专家学者以及行业同仁深度对话的平台,进一步促进了产学研合作,强化了企业在人工智能领域的发展共识。RockAI期待与各方携手,共同推动上海乃至全国人工智能产业迈向更高水平,为我国经济“数实融合”与持续健康发展添砖加瓦。
相关文章
- 携手共建“物理世界大模型”联合实验室,洞察时空与上海电信达成战略合作
- 东软添翼医疗大模型领跑 医疗AI进入“可信时代”
- 直接上智能体,还需要统一基座大模型吗?医院智能化走到十字路口
- 云知声 U2-ASR 2.5上线:首个中文方言语义转写大模型
- 全国首个内容审核大模型过审 云从科技破解Agent时代谣言难题
- 湖北移动AI实验室让中小企业零门槛用上大模型
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 荆华密算入选主流价值语料生态联盟首批成员,护航大模型时代,为AI系上“安全带”
- 稳居第一梯队!东软添翼医疗大模型用实力回应“医疗AI”
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 唯一聚焦制造业!创新奇智入围IDC大模型私有化市场前五
- 可视、可管、可算、可追溯!浩鲸科技重磅推出鲸智大模型Token运营平台
- 数字峰会探新“智”| 数字中国AI竞速:大模型从“能力竞赛”转向“可信落地”
- 数字峰会探新“智”|为AI装上“质检员”,浪潮软件集团发布大模型“体检”方案
- AI大模型智能体独角兽再落子!探迹科技完成真爱美家收购交割,持股达 43%
- 北京亦庄设立大模型生态服务站 助力AI产业合规发展
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









