- 昆仑万维旗下Opera全新AI服务器集群成功落地 大模型推理速度提高30倍
- 昆仑万维旗下海外信息分发及元宇宙平台Opera宣布,公司在冰岛凯夫拉维克部署了一套全新的、完全由绿色能源驱动的人工智能(AI)服务器集群。该集群能够为Opera提供先进的AI超级计算能力,并有效简化生产级AI应用的开发和部署过程,为Opera未来更多生成式AI服务打下基础。
- 优刻得为智谱AI构建超千卡推理集群,让全球用户畅享大模型智能生活
- 智谱AI致力于打造全球领先的认知智能大模型,其新一代基座大模型GLM-4性能大幅提升,逼近GPT-4,展现了业界领先的多模态大语言模型能力。通过智谱大模型与优刻得算力的强强结合,大模型推理应用稳定、高效运行于云端,并具备大规模实时推理能力,其推理速度更快,并发性更高,而成本则显著降低。这一创新使得智谱大模型能够深入理解用户需求
- 携英特尔®至强®CPU Max系列,宝德服务器为大模型推理提供澎湃算力
- 作为中国AI服务器市场的TOP3和中国领先的计算产品方案提供商,宝德坚持技术创新,基于英特尔AI软硬件技术基础等打造多样性的AI算力和解决方案,为AI产业快速发展和AI大模型落地应用做出积极的贡献。
- 青云科技智算2区:面向 HPC 和大型模生成式 AI 训练和推理服务
- 人工智能技术的持续发展不断推动各行业的创新变革,然而,随着人工智能应用的不断深入,对算力的需求也日益增长。传统的算力资源已难以满足复杂人工智能任务的需求,成为了制约人工智能应用发展的主要瓶颈。
- Neousys宸曜科技强固型Jetson AGX Orin边缘计算平台,赋能视觉边缘计算AI推理应用
- 工业级强固型嵌入式平台厂商Neousys宸曜科技发布了新的NVIDIA Jetson无风扇嵌入式计算平台NRU-220S系列。NRU-220S系列搭载了Jetson AGX Orin 32GB/ 64GB系统模块(SOM),并以一系列综合的工业设计体现了Neousys宸曜科技的强固DNA,不仅能提供高达275(具有稀疏性)INT8 TOPS人工智能算力,还支持-25°C至70°C宽温范围运行,非常适用于部署在路侧、车载、食品生产线或多粉尘环境的工厂,用于智能视频分析、监控或检测应用。
- AI技术光芒四射!云天励飞发布国内首创14nm Chiplet大模型推理芯片
- DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。
- Moonshot AI大模型服务Kimi Chat开始内测,火山引擎提供训练推理加速解决方案
- 10月9日,北京月之暗面科技有限公司(Moonshot AI)宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着Moonshot AI在这一重要技术上取得了世界领先水平。
- NVIDIA扩大AI推理性能领先优势,GH200 超级芯片在MLPerf一骑绝尘
- GH200将一颗Hopper GPU和一颗Grace CPU连接到一个超级芯片中。这种组合提供了更大内存、更快带宽,能够在CPU和GPU之间自动切换计算所需要的资源,实现性能最优化。
- AI推理服务平台升级,阿里云机器学习PAI推出新规格
- 阿里云机器学习平台PAI宣布全面升级模型服务平台PAI-EAS,面向文图生成、大语言模型等各类模型提供弹性稳定的推理服务,并推出全新规格GU30,与传统规格相比价格平均优惠45%。
- 只靠CPU,AlphaFold2推理通量提升达23倍!英特尔:正是在下
- 搅翻计算生物界的AlphaFold2一开源,各种加速方案就争相涌现。妹想到啊,现在居然有了个CPU的推理优化版本,不用GPU,效果也出人意料的好
- 联想十大AI创新技术首次公开,实现类人推理高阶体验
- 8月18日,联想在北京全球总部举办创新开放日活动,来自联想集团智能设备、联想研究院、供应链等业务部门,包括智能设备、关键零部件、应用以及服务领域的180余项技术创新成果在活动上集中展示。
- 阿里云联合NVIDIA举办TensorRT模型优化赛 探索AI加速推理方式
- 深度学习深刻改变了计算机应用程序的功能与形态,为了加速深度学习模型的推理,NVIDIA 英伟达推出了高性能深度学习推理优化器TensorRT。经过多年的更新迭代,TensorRT不断为深度学习提供低延迟、高吞吐率的部署推理,在保持优越性能的同时极大提高了易用性,已经成为GPU推理计算的必备工具。
- Supermicro加速推理和新智能结构支持,增强广泛边缘到云端人工智能系统产品组合
- Super Micro Computer, Inc. (SMCI) 为企业级运算、储存、网络解决方案和绿色计算技术等领域的全球领导者,近日宣布扩大最广泛的人工智能(AI)GPU服务器产品组合,此系列整合了最新的NVIDIA Ampere系列GPU,包括NVIDIA A100、A30和A2。
- 浪潮发布新版AIStation推理服务平台,可高效调度多元AI芯片
- 9月17日,在苏州举行的第四届全球人工智能产品应用博览会(AIExpo2021)上,浪潮发布了新版AIStation人工智能推理服务平台,为快速发展的人工智能应用提供强大的服务管理支撑,并可统一高效调度多款国际国内领先的AI芯片的算力,帮助企业和智算中心充分发挥多元算力作用,加速AI应用场景落地。此次发布是为了应对日趋丰富的人工智能应用对多元化AI芯片算力的需求,以及智能计算中心日益复杂的异构计算资源管理调度挑战。
- 飞桨全新发布推理部署导航图,助力打通AI应用最后一公里
- 5月20日,由深度学习技术及应用国家工程实验室与百度联合主办WAVE SUMMIT2021深度学习开发者峰会在北京盛大举行。百度首次揭晓人工智能融合创新趋势下的AI工业大生产实现路径,飞桨深度学习平台带来全新发布,持续引领深度学习技术发展。
- NVIDIA两款全新GPU首秀:刷新AI推理纪录、性能314倍于CPU
- 时隔半年,MLPerf组织发布最新的MLPerf Inference v1.0结果,V1.0引入了新的功率测量技术、工具和度量标准,以补充性能基准,新指标更容易比较系统的能耗,性能和功耗。
- 清华大学崔鹏:探索因果推理和机器学习的共同基础
- 近期很多研究方向的工作都或多或少地与因果推理有所结合。在11月27日由智源举办的 NeurIPS 2020中国预讲会上,来自清华大学计算机科学与技术系的崔鹏副教授发表了主题为「稳定学习:发掘因果推理和机器学习的共同基础」的演讲,崔老师表示,「我们将站在机器学习的角度,探讨如何看待因果推理。」
- 用光速跑云端AI推理 美国公司推光子芯片,商业产品明年见
- 在刚落幕不久的Hot Chips 32大会上,脱胎于麻省理工学院的初创公司Lightmatter展示了用于通用AI加速的光子计算测试芯片。该处理器利用硅光子和MEMS技术,以光速处理矩阵向量乘法,由毫瓦级激光光源供电。据悉,在相同芯片面积上,光子器件的速度比电子器件快1000倍,而功耗仅有电子器件的1/1000。
- 国产化边缘推理首选 高性价比AI盒子——比特大陆SE5 AI计算盒
- 人工智能、机器深度学习技术的发展和应用使图像识别技术获得了关键性的突破,不同应用场景的图像识别率已经可以满足各方面的应用要求,并开始逐步应用于身份识别、商品识别、金融支付、安全防范、智能安检等诸多领域,呈现出高速发展势态,使视频监控系统的功能和效能出现质的飞跃,而这些智能功能的实现都离不开算力的支持。
- 阿里AI研究成果入选国际顶会ICML 2020,AI推理速度提升3倍
- 人工智能国际顶会ICML 2020公布了论文收录结果,阿里巴巴7篇论文入选,是入选论文数量最多的中国科技公司。ICML是机器学习领域全球最具影响力的学术会议之一,今年接受率仅为21.8%。
推荐文章
更多>>- 森马集团S-mall奥莱全新启航
- 16小时前
重点文章
更多>>- 英特尔发布新一代神经拟态系统Hala Point,11.5亿神经元,12倍性能提升
- 百度AI开发者大会为何只选跨越速运 科技实力+定制服务给答案
- 引领大模型创新实践,加速迈向高阶自智网络
- 国内首个类脑智慧农业黑科技是一台田间“小货车”
- 中国电信开源12B星辰大模型,携手昇腾推进大模型全栈国产化进程
- ABeam(德硕)大语言模型系列 (2) :大语言模型的商业模式及应用
- 百度何俊杰:智能体,创造AI原生未来
- 李彦宏:开源模型会越来越落后
- 解码「天工SkyMusic」,填补AI音乐领域技术空白
- 苹果携手百度共探AI合作新机遇,微美全息竞速开展AIGC应用构建竞争优势
- 昆仑万维旗下Opera全新AI服务器集群成功落地 大模型推理速度提高30倍
- 融合视觉能力,OpenAI向开发人员提供GPT-4 Turbo with Vision