登顶SWE-Bench,快手KAT-Dev-72B-Exp刷新开源SOTA大规模强化学习作为关键路径,能够有效激发大模型的复杂推理能力并显著提升其任务泛化性。近期,快手Kwaipilot团队重磅发布的KAT-Dev-72B-Exp,在软件开发能力评测基准 SWE-Bench Verified上取得了74.6%的卓越表现,创下开源模型领域新纪录。6天前1966
科大讯飞联合团队成果登上核聚变领域顶刊《Nuclear Fusion》中国科学技术大学语音及语言信息处理国家工程研究中心、中国科学院等离子体物理研究所、合肥综合性国家科学中心能源研究院及科大讯飞研究院AI For Science联合团队,在AI赋能聚变等离子体领域提出最新研究成果PaMMA-Net模型,正式发表于核聚变领域顶级期刊《Nuclear Fusion》。1星期前2808
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。3星期前3378
DeepSpark开源社区正式发布百大应用开放平台25.09版本由上海天数智芯半导体股份有限公司(以下简称“天数智芯”)主导的DeepSpark开源社区正式发布了百大应用开放平台25.09版本。百大应用开放平台作为国内领先的AI和通用计算应用开发及评测平台,甄选数百个与行业应用深度耦合的开源算法和模型,支持主流生态应用框架,并针对行业需求构建多维度评测体系,广泛支持各类落地场景。3星期前3753
陈天桥创立的AI公司MiroMind成为全球顶尖预测型大模型,性能领先行业基准9月18日,全球创新企业家、慈善家陈天桥旗下的MiroMind团队在这一AI未来大考中,连续第二周蝉联冠军。与专注文本输出的生成式模型不同,MiroMind 采用记忆驱动机制,专为预测与决策设计,旨在打造全球最好的预测大模型。4星期前4100
腾讯开源框架 Kuikly 再升级!率先适配 “液态玻璃”,原生体验更极致Kuikly是腾讯广泛应用的跨端开发框架,基于Kotlin Multiplatform技术构建,为开发者提供了技术栈更统一的跨端开发体验,由腾讯大前端领域 Oteam(公司级)推出。目前已有20+业务深度使用,服务业务的总页面数1000+、日活用户超5亿,满足了这些业务在众多场景下的各类复杂需求(应用场景案例 )。Kuikly 作为腾讯端服务联盟的重要成员,将持续推动跨端开发的技术创新和生态建设。1个月前4108
外滩大会首发! 蚂蚁密算推出AI密态升级卡 实现零改动“即插即用”9月12日,在2025 Inclusion·外滩大会上,国内领先的数据要素技术服务商——蚂蚁密算发布AI密态升级卡,通过“即插即用”的创新解决方式,实现在不更换现有xPU硬件、不修改AI应用代码与驱动的前提下,完成从“明文计算”到“密态计算”的安全改造。1个月前4957
腾讯优图携Youtu-Agent开源项目亮相上海创智学院首届TechFest大会9月11日,上海创智学院首届TechFest在上海举行,15场深度闭门研讨会讨论议题涵盖五大科研方向,与学界大拿、产业专家、学院师生共同探讨AI未来的无限想象。此次,腾讯优图实验室、清华大学、浙江大学、上海人工智能实验室等也受邀参加Agentic Al:大模型智能体关键技术与行业论坛。1个月前4491
2025外滩大会:王坚畅谈AI变革,普天科技锚定空天算力新赛道在2025 Inclusion·外滩大会上,阿里云创始人、之江实验室主任王坚发表了题为《人工智能:从代码开放到资源开放》的重磅演讲,其前瞻性观点在AI及相关领域激起千层浪,也与当下普天科技在空天算力领域的布局产生了奇妙的共振。1个月前3826
腾讯正式开源Youtu-GraphRAG,图检索增强技术迎来落地新突破2025年9月11日,腾讯优图实验室宣布,正式开源全新图检索增强生成框架——Youtu-GraphRAG。这一框架在成本优化、推理精度和跨领域适配性上取得突破性进展,加速推动大模型在复杂问答场景从“能用”走向“好用”。1个月前3743
OpenAI携AI动画电影《Critterz》进军好莱坞OpenAI希望凭借《Critterz》的低预算和快制作周期,说服心存疑虑的电影公司高管接纳AI技术。1个月前3077
声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互近日 Agora 宣布对OpenAI Realtime API的支持进一步升级和优化,新增自动问候、混合模态交互、选择性注意力锁定等更先进的功能,这些功能现已全面开放,将为用户与AI 智能体提供更自然的交互体验。1个月前3452
Qwen-Image-Edit 模型上线基石智算,图像编辑更精准青云科技旗下AI算力云——基石智算CoresHub 上线图像编辑新模型 Qwen-Image-Edit。该模型基于 200 亿参数的 Qwen-Image 架构构建,支持中英文双语精准文本编辑,在保持原有风格的同时完成修改。1个月前4213
火山引擎多模态数据湖落地深势科技,提升科研数据处理效能深势科技是全球AI for Science开拓者,依托在交叉学科领域的深耕,构建了“深势·宇知”AI for Science大模型体系,并进一步解决科学研究和工业研发领域的关键问题,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”。1个月前4064
斑马AI大模型:为每个孩子提供专属学习方案斑马儿童研究院副院长翦悦介绍,在斑马英语、斑马阅读、斑马思维等方向,斑马的AI大模型通过AI写作、题目讲解、跟读评分、AI点评等,可以实现为每个孩子提供专属学习方案,有效帮助儿童提升学习能力、学习效率。1个月前3672
亿信华辰发布智问4.0,打造企业级多智能体平台在人工智能技术迅猛发展的今天,大型语言模型(LLM)正以前所未有的速度重塑企业运营与决策方式。然而,如何将大模型的强大能力真正落地于复杂多变的企业场景,实现“用得上、敢用、用得好”,仍是众多企业面临的挑战。1个月前3420
微软人工智能推出首批自研模型MAI-Voice-1语音模型与MAI-1预览版微软与OpenAI复杂的合作关系正迎来新变数,微软即将发布与GPT-5、DeepSeek等模型竞争的自研AI产品。1个月前5139
万字长文详解优图RAG技术在信息爆炸的时代,如何从海量数据中精准获取知识并生成智能回答,已成为AI落地的核心挑战。腾讯优图实验室凭借前沿的RAG体系,突破传统检索与生成的局限,打造了一套覆盖语义检索、结构化表检索、图检索的全栈解决方案。1个月前4042
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步DeepSeek API 也已同步升级,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式,且上下文均已扩展为 128K。同时,API Beta 接口支持了 strict 模式的 Function Calling,以确保输出的 Function 满足 schema 定义。2个月前5051
北大团队提出2比特复数模型iFairy{±1, ±i},精度反超量化前,可手机部署为破解大模型部署与推理成本高昂的困境,北京大学杨仝老师团队首次提出名为iFairy的超低比特量化方案。该方案创新性地利用复数{±1, ±i}对模型权重进行2-bit量化,在实现1/8极致压缩与“无乘法”推理加速的同时,语言建模能力和下游任务表现甚至反超了其全精度的LLaMA基座模型。2个月前4082