值得买科技与人大高瓴联合研究成果入选计算机视觉顶级会议CVPR20256月11日-15日,2025国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition 2025,简称CVPR2025)在美国田纳西州召开。值得买科技与中国人民大学高瓴人工智能学院在多模态领域的最新联合研究成果《图像转有声视频》(《Animate and Sound an Image》)成功入选CVPR2025会议。3天前1280
国内首个搜索超级智能体发布!纳米AI超级搜索上新8大核心能力当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。3天前773
Soul成果亮眼:实时人像视频生成研究成果被CVPR2025录用AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》,成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破,更意味着其在AI社交领域的探索,正逐步引领行业走向新的阶段。1星期前1279
超越ControlNet!腾讯优图实验室联合复旦大学提出AI生图新框架,解决多条件生成难题自回归的机制通过Image Stream Block(ISB)能够注意到各类视觉特征中已被挑选的patch和备选patch的隐含关联,并基于当前时间步下图像去噪的状态获取更优的统一信号以优化流匹配路径。2星期前1383
云知声4篇论文成果入选自然语言处理顶会ACL 2025,大模型研究再获突破第63届国际计算语言学年会ACL 2025(Annual Meeting of the Association for Computational Linguistics,简称ACL)论文接收结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大语言模型可解释性等关键领域,提出的创新理论和方法,为行业研究提供了新的思路。3星期前1867
昆仑万维正式开源Matrix-Game:从图像出发构建可控交互世界,重塑交互式世界生成标杆5月13日,昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。1个月前1928
百度搜索发布AI开放计划,每日数亿精准搜索流量扶持优质应用4月25日,百度搜索开放平台·AI开放计划发布,免费开放数亿流量,让开发者的AI应用精准连接用户。该计划提供两种零门槛接入方案——AI应用和MCP Server。此外,百度还提供了丰厚的开发者扶持政策,开发者可在百度搜索“百度搜索开放平台”进行注册加入。1个月前1464
文心4.5Turbo、X1Turbo和多款AI应用发布!李彦宏:应用创造未来4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上,发布文心大模型4.5 Turbo、文心大模型X1 Turbo、高说服力数字人、通用多智能体协作APP“心响”等AI新品,并宣布将帮助开发者全面拥抱MCP。1个月前1367
谷歌最新发布Agent2Agent 协议 (A2A)谷歌发布了 Agent2Agent (A2A) 协议,旨在补充 Anthropic 的模型上下文协议 (MCP),后者为代理提供了实用的工具和上下文。这是一个由 50 多家技术合作伙伴共同贡献的开放协议。A2A 协议旨在使 AI 代理能够在各种企业平台之间进行通信、安全地交换信息和协调行动,而无需考虑其底层技术或供应商。2个月前31218
云从科技与重庆大学团队联合研发智能编程助手CoSEFA 入选国际顶会FSE 2025云从科技与重庆大学大数据与软件学院联合研发的编程智能体——CoSEFA(Code SEcurity and Fix Agent)被软件工程领域顶尖会议ACM SIGSOFT软件工程基础国际会议(FSE 2025)正式录用。2个月前46289
CVPR2025:中科视语发布首个具身物理空间大模型PhysVLM!战略布局“AI+机器人”新生态作为首创“环境感知、本体理解、决策执行”全链条技术突破的AI企业,中科视语以PhysVLM的发布为起点,正逐步构筑面向工业4.0、智慧交通、具身机器人等领域的核心技术底座,重新定义“AI+机器人”协同发展新范式。2个月前82036
哈尔滨工业大学(深圳)成功举办2025 InsunICC学术研讨会2025年3月15日上午9:00,Insun Intelligent Computing Conference(InsunICC)学术研讨会于哈尔滨工业大学(深圳)信息楼L416会议室举行。上午为主题演讲,由漆舒汉教授主持;下午为博士生学术论坛,由孙承杰老师主持。3个月前65041
深度整合通义万相2.1 + ComfyUI,RunningHub打造零门槛AI视频生产力平台2025年2月25日,阿里云正式开源视觉生成基座模型万相2.1(Wan),这一重磅动作在AI视频生成领域掀起技术浪潮。作为全球率先实现万相2.1全功能整合的在线AIGC创作平台,RunningHub以“零门槛、高性能、全生态”的优势,让创作者零门槛驾驭尖端AI技术。3个月前101405
AAAI 2025丨TeleAI多篇论文入选,赋能化学、医疗交叉学科研究2月25日,人工智能国际顶级学术会议AAAI 2025开幕,在此次大会论文录用结果中,中国电信人工智能研究院(TeleAI)科研团队10篇论文成功入选,不仅覆盖大语言模型偏好对齐、视觉模型参数微调、正激励噪声(PI Noise)采样和表征对齐等技术方面的突破,更包括人工智能与化学、医疗的交叉研究等多个方向的系列创新。3个月前110479
上海AI独角兽MiniMax发布新一代开源模型,创新突破受海内外好评1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3.5等海外领军模型的基础上,能够高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。4个月前235583
AAAI 2025 | 2080Ti也能4K图像抠图 !美图&北交大提出超高分辨率自然图像抠图算法MEMatte美图影像研究院 (MT Lab) 联合北京交通大学提出了超高分辨率抠图方法 MEMatte (Memory Efficient), 一个显存友好的自然图像抠图框架用于在显存受限的场景下 (如商用显卡与边缘设备) 进行高清图像的精细抠图。文章已被人工智能顶会 AAAI 2025 接收。4个月前159756
全球首个!飞算 JavaAI 让开发者一天成为 Java 高手一款名为飞算JavaAI 的开发助手在软件开发领域引发热议,其宣称可助力开发者在短短一天内实现从新手到Java高手的蜕变,这一消息令众多在高压下工作的开发者们兴奋不已。4个月前156150
一文读懂智能体:AI不再仅仅是人类使用的工具,而是能够从环境中学习的半自主实体AI智能体时代已经到来,它被宣传为人工智能研究的下一个重大突破。AI智能体能够独立运作,不需要持续的直接监督,同时还能与用户协作,自动化那些单调乏味的任务。4个月前270874
中国大模型公司提出新架构 解决Context无限长问题 开启Agent时代1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3.5等海外领军模型的基础上,能够高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。5个月前176582
两大AI模型性能提升 登上国际榜单由盛大AI团队研发的模型Watt-tool-70B和Newsbang/homer-72B,登上国际知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt团队研发的旗舰模型,目前位列BFCL Leaderboard总榜单第一。5个月前169974