英伟达的人工智能进展 自然语言处理变得越来越快
2019-12-27 17:49:31AI云资讯1554
当英伟达(NVIDIA)宣布在实现实时人工智能对话的语言理解方面取得突破时,我们措手不及。我们还在努力消化ACL的过程,这是全世界计算语言学最大的研究事件之一,Facebook、Salesforce、微软和亚马逊都参与了其中。虽然这代表了两种不同的成就,但它们仍然紧密相连。以下是英伟达的突破,以及它对整个世界的意义。

正如ZDNet昨天报道的,英伟达表示,其人工智能平台目前拥有迄今为止最快的训练记录、最快的推理和最大的训练模型。NVIDIA已经成功地在53分钟内训练了一个大型的BERT模型,并且让其他的BERT模型在2.2毫秒内产生结果。但我们需要把它放在背景中来理解它的重要性。BERT(来自《变形金刚》的双向编码器表示)是研究人员于2018年底在谷歌AI语言上发表的研究论文(论文、开放源代码和数据集)。伯特最近在自然语言处理领域取得了一系列突破,并在人工智能领域引起了轰动,因为他在各种各样的自然语言处理任务中展示了最先进的成果。
NVIDIA所做的是使用谷歌发布的数据集(两种风格,BERT- large和BERT- base)和它自己的gpu,以减少训练BERT机器学习模型所需的时间,然后将其用于应用程序。这就是机器学习的工作原理——首先是一个训练阶段,在这个阶段中,模型通过显示大量数据来学习,然后是一个推理阶段,在这个阶段中,模型处理新的数据。
NVIDIA使用了不同的配置,产生了不同的结果。NVIDIA DGX SuperPOD使用92台运行1472台NVIDIA V100 gpu的DGX- 2h系统来训练BERT模型,而同样的任务需要一个NVIDIA DGX-2系统2.8天。2.2毫秒的推理结果在不同的系统/数据集上(运行NVIDIA TensorRT / BERT-Base的NVIDIA T4 gpu)。
最重要的是,英伟达将BERT训练提高了好几天,而以前这是常规训练。但这里的神奇之处在于硬件和软件的结合,这就是为什么whyNVIDIA要发布自己对BERT的调整,这可能是整个社区最大的胜利。
数据、人工智能、物联网:零售业的未来
零售购物的数字化转型将电子商务的许多好处带入实体店,其结果也同样具有颠覆性。
阅读更多
我们询问了英伟达如何以及为什么选择解决这个问题。英伟达发言人表示,他们认为人工智能对话是人类与智能机器和应用程序互动的基本组成部分。然而,这是一个非常具有挑战性的问题,无论是在计算上还是在算法上;他们补充说,这是他们非常感兴趣的地方。这是一个跨公司的努力,许多不同的团队为实现这些突破做出了贡献。这些团队包括英伟达人工智能研究、数据中心规模基础设施、人工智能软件和工程。英伟达表示,这表明它可以将其人工智能平台的市场领先性能扩展到新兴用例。这有两个方面。它是技术上的奇迹,它的实际适用性。让我们打开。
就BERT的培训而言,NVIDIA阐明了软件优化包括在PyTorch中实现的自动混合精度和在一篇论文中阐述的兰姆大批量优化技术的使用。关于更多细节,有一篇关于此的博客文章,人们也可以访问NVIDIA的BERT github存储库中的代码。为了实现NVIDIA T4推理优化GPU上的BERT推理的2.2毫秒延迟,NVIDIA开发了针对TensorRT、NVIDIA推理编译器和运行时的若干优化。工作的重点是Transformer层的有效实现和融合,它是BERT(BERT-base有12个Transformer层)和当今可用的最先进的NLU模型的核心构件。TensorRT包含几个关键功能,可以实现非常高的推理吞吐量,从融合内核到自动选择精度等等。NVIDIA进一步增加了新的优化来加速NLU模型,并计划继续改进库来支持人工智能工作负载。
NVIDIA比以前更快地处理BERT自然语言
简而言之,所有这一切意味着,你现在可以训练出比以往更好、更快的语言模型,并将它们部署到会话人工智能应用程序中,并以比以往更快的速度运行。当然,这很好。从理论上讲,英伟达的做法可能会让所有人受益。BERT的优化以开源的形式发布,NVIDIA硬件可供所有人使用。但是,通常的警告是适用的。尽管能够在很短的时间内训练出像BERT这样的语言模型,与之前的技术相比,这是很好的,但这还不够。
即使假设NVIDIA发布的是可用的,有多少组织能够真正做到这一点?
首先,从他们的存储库中获得这些开源模型,让它们运行,提供正确的数据,然后将它们集成到会话AI应用程序中,这不是很多人能做的事情。是的,企业中缺乏数据科学技能已经被多次提及。但是记住这一点很有用——对于一般的组织来说,这并不容易。
然后,从他们的Github盒子里拿出来,NVIDIA的BERT模型处理特定的数据集。这意味着,如果你严格按照规定的流程操作,而你的竞争对手也这么做,你最终将拥有一个以同样方式响应的人工智能会话应用程序。
将大数据转化为商业见解
企业擅长收集数据,而物联网正将其带入一个新的阶段。但是,最先进的组织正在使用它来推动数字转换。
相关文章
- 三星HBM4高带宽内存正式进入英伟达Vera Rubin人工智能芯片平台
- 英伟达已瞄准台积电1.6nm产能,特斯拉/微美全息加速扩展AI芯片集群生态!
- 黄仁勋为何见她?英伟达中国行背后的工业AI落地逻辑
- 英伟达与OpenAI的千亿美元超级合作陷入停滞
- AMD与高通计划追随英伟达,下一代AI产品也将采用SOCAMM内存
- AI浪潮汹涌芯片突围战打响!英伟达/特斯拉/微美全息竞速引领基建突破新高度!
- 三星或将成为英伟达Vera Rubin平台首批HBM4内存供应商
- 英伟达CEO黄仁勋与AMD苏姿丰谈及当初选择台积电代工的决策如今收获丰硕
- 三星凭借与英伟达和苹果等巨头的长期合作,已在代工领域对英特尔形成压倒性优势
- 马斯克全力出击芯片制造,AI5芯片性价比远超英伟达Blackwell
- 国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍
- 英伟达开源加速产业进程,均胜电子等相关Tier1迎来价值重估
- 英伟达AMD亮相CES 2026加速硬件进化 万兴科技引领应用层迭代
- 英伟达新一代Vera Rubin AI系统预计未来几年将消耗几百万TB的NAND闪存固态硬盘
- 英伟达CES预言自动驾驶未来,文远知行融合双技术路线领跑行业
- 苹果或将与英伟达在台积电争夺相同的3D封装产能资源









