网易伏羲中文预训练模型玉言登顶FewClue榜单,助力中小企业降本节能
2021-12-31 16:05:30AI云资讯1548
近日,网易伏羲在中文语言理解权威评测基准FewClue榜单登顶,在IFLYTEK(长本文分类 )、 CLUEWSC(代词消歧)、CSL(论文关键词识别)、CSLDCP(学科文献分类)等多项单任务中取得第一。这也是FewClue榜单上,第一次有人工智能模型与人类标注水平的差距缩小到10分以内,其中CSLDCP(学科文献分类)任务首次超过人类水平。

据了解,FewCLUE是CLUE推出的一项中文小样本学习评测榜单,用来评估预训练模型是否能够通过小样本学习来掌握特定的自然语言处理任务。同时,研究人员也可通过相关测试评估AI模型再学习能力和快速应用能力。而从结果来看,网易伏羲的模型玉言对中文的理解能力,已经接近甚至在部分任务上超过一个受过相关训练的人类。
更值得一提是,玉言具备的自然语言处理能力可应用于语音助手、智能客服、新闻传媒、游戏创作、智能决策等领域。而在获得这些能力背后的模型训练体系及应用方法则验证了基于超级模型进行二次训练和快速应用的可能性。在目标领域通过少量标注样本极大的提升应用的效果,从而节省大量的人力成本。
人工智能研究的诞生到现在已经有60多年的历史,近些年的深度学习掀起了人工智能的新一波浪潮。OpenAI发布的GPT系列模型将自然语言处理水平推向了新的高度,也证明了大规模预训练的潜力,为智能服务应用场景提供最重要的基石。但是,这些如雨后春笋般涌现的大规模预训练模型都是以文本生成为导向,在语义理解方面受限于其技术局限,效果不佳。
因此,业界为语义理解任务重新训练模型,例如BERT、DEBERTA等。文本生成任务和语言理解任务分别训练,这不仅是对算力和成本的巨大消耗,也不符合当下社会对低碳发展的要求。是否将预训练生成模型通过少量的二次训练转换为理解模型?玉言模型正是基于这个出发点的一次成功尝试,将生成模型通过少量的二次训练转换为高准确度的语义理解模型。更重要的是,这一方法的成功实践,能有效帮助中小企业降本节能。
据该项目团队介绍,玉言模型的前身是网易伏羲自研的50亿GPT2生成模型,通过二次训练变成语义理解能力较好的Prefix-LM,相比于原来的GPT2模型,只是attention mask形状不同,Prefix-LM可以直接使用许多开源的GPT加速库进行推断加速。
玉石二次训练的主要方法包括在Prefix部分增加MLM损失函数,同时使用增强PositionEmbebedding的方法去进一步强化Prefix部分的编码效果等。在任务数据集处理方面使用类似于T0的基于模板的方法,将FewClue的数据集在二次训练时混入训练语料中。
另外,FewClue提供的无标签数据同样被构造模板,处理完成后加入训练语料中。使用模板的方法可以自然地实现多任务学习,大大降低语义理解大模型的训练成本,更加有利于工程落地。“同时也非常感谢浪潮共享了他们的部分预训练文本,为玉言模型训练提供了充分的数据。”项目团队相关负责人表示。
网易伏羲成立于2017年,是国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构。网易伏羲已经发表100多篇AI顶会论文,拥有200多项发明专利,以及数字人、智能捏脸、AI创作、AI反外挂、AI推荐匹配、AI竞技机器人等多个领域的领先技术。目前,网易伏羲正在向游戏、文旅、文娱等产业开放AI技术及产品,目前已服务超100家客户,应用日均调用量超数亿次。
相关文章
- 极空间携手网易爆米花,重塑家庭影音生态
- 网易云音乐连续12日回购 共回购超115万股
- 还在为Agent“能用不好用”而困扰 网易智企让AI知识库真正为业务而生
- 网易云音乐2025财报:营收78亿元 AI驱动音乐体验创新
- 网易传媒AI内容营销白皮书:千梦引擎让AI创作有温度、有态度
- 荣获国家级科技奖一等奖,网易伏羲产学研协同创新获权威认可
- TMA盛典携手网易传媒,共话AI时代内容营销新叙事
- 网易云音乐上线AI歌曲激励金活动 鼓励真正优质的AI音乐创作
- 鸿蒙版网易有道词典单词本与发音设置功能正式上线,高效背词不迷路
- 网易知数发布,以 AI 驱动企业智慧决策
- 显著提升音乐推荐效果!网易云音乐大模型获全球学术会议CIKM2025最佳论文奖
- 网易云信10周年宣布品牌升级,从“基础通信管道”到“AI交互引擎”
- 群英荟萃,智汇泉城 | 2025网易创新创业大赛济南站总决赛圆满收官!
- 「新声LIVE+·耀现场」走进成都 荣耀音乐携手网易音乐人陈一豪Clear打造沉浸Live舞台
- 数字浪潮聚北京 创新力量启新程——2025网易创新创业大赛济南站北京分赛圆满落幕
- 远程控制软件横评:更新4.0的网易UU远程追上向日葵了么
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









