腾讯云数据库2篇论文入选行业顶会SIGMOD,技术创新获权威认可
2024-06-13 16:04:47AI云资讯100847
6月13日消息,腾讯云数据库TDSQL和中国人民大学合作的2篇论文成功入选行业顶级会议SIGMOD,被SIGMOD 2024 Research Full Paper(研究类长文)收录。
SIGMOD(Special Interest Group on Management Of Data)作为数据库领域的“风向标”,拥有40余年发展历史,每年为数据库领域提供大量高质量的研究论文和研究成果,具有重要的学术价值和行业引导意义,与VLDB、ICDE并称数据库三大顶级会议。
本次收录的研究成果中,同态压缩理论和SALI学习索引框架均属于业界首次提出,表明腾讯云数据库在存储、压缩以及学习索引等方面的前沿创新获得国际权威认可。

面对现代社会数据量的爆发式增长,行业普遍使用数据压缩来减少存储空间和提升传输效率。
但目前,多数压缩方案专注于只读文本处理任务,涉及文本修改操作必须将文本进行解压后再执行,这会对数据处理的性能和存储空间带来负面影响。
在腾讯云和人大合作入选SIGMOD会议的论文《Homomorphic Compression: Making Text Processing on Compression Unlimited》中,研究团队创新性提出了同态压缩理论,并在此基础上开发了高效文本数据管理引擎HOCO。HOCO引擎结合了三种代表性压缩方案,通过数据结构和算法设计实现对不同数据集语法规则的解析,实现了在压缩文本上直接进行多种处理任务。
实验表明,在不影响压缩效果的情况下, HOCO可以实现9.18倍的吞吐量提升,文本分析任务的延迟缩短7.16倍。
另一篇入选论文《SALI: A Scalable Adaptive Learned Index based on Probability Models》提出了基于概率模型的可扩展自适应学习索引框架。
在数据库中,索引是提高数据库查询性能的重要方式。为了提高索引的性能和效率,业内引进了学习索引,通过学习模型来预测数据存储位置,进一步提高查找效率。但传统学习索引存在技术局限,一旦数据集发生频繁查询更新等工作负载变化,学习索引也会频繁调整,多线程高并发情况下会面临阻塞。SALI通过概率模型感知工作负载的变化,使学习索引可动态“进化”局部结构以适应新的负载。此方法在尽可能减少结构变化对性能的影响的同时,大幅降低线程间阻塞问题,从而实现高可扩展性、提高效率并增强学习索引的鲁棒性。
实验数据显示,SALI在64个线程下提高了2.04倍的插入吞吐量。
作为国产数据库行业的开拓者,腾讯云在数据库领域已深耕十余年,服务超过50万客户。而中国人民大学作为数据库研究的摇篮,为数据库技术在中国的持续发展奠定了坚实基础。2020年,腾讯与中国人民大学共同建立中国人民大学-腾讯协同创新实验室,聚焦数据库前沿技术探索和突破。据悉,合作至今,双方在科研方面研发超过10项前沿技术原型系统、申请数十项专利、多篇论文入选SIGMOD、VLDB、ICDE、TKDE等国际顶会顶刊。未来,腾讯将持续发挥其多年的技术研发创新成果和产业应用经验,联合人大一起推动国产数据库的学术进步和技术成果转化。
相关文章
- 腾讯云联合TC601提出国产 Data+AI平台五步转型路径
- 北京无限迭代与腾讯云和中国电信等公司共同荣获全球AI生态基石大奖
- 金山文档Skill、专家与连接器上架腾讯云WorkBuddy
- 腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路
- 东软智行与腾讯云达成战略合作 共筑AI智能座舱新生态
- 腾讯云与阶跃星辰达成战略合作,共塑大模型时代智能座舱新体验
- 腾讯云与赞同科技深化金融科技合作——技术研讨凝共识 装机实操促落地
- 从Agent 浪潮到组织变革,腾讯云携手业界专家共探OpenClaw时代的安全边界与企业进化
- 腾讯云TVP走进招商局,共探具身智能与 Agent 协同演进新路径
- 腾讯云发布ADP Agent Portal:企业级智能体统一纳管、高效运营
- 腾讯云与聚水潭战略合作 助力电商SaaS全链路智能化与全球化升级
- 腾讯云吴运声:构建实用、可靠、易管的企业级Agent平台,让AI人人可用
- 腾讯云与宇泛智能战略合作 推动机器狗“大小脑”模型优化
- 腾讯云与特看科技战略合作 携手共探AI漫剧等领域内容生产新范式
- 腾讯云与闪铸战略合作 混元3D大模型助力3D打印产业场景落地
- 腾讯云与MiniMax战略合作 共同打造AI智能体基础设施行业标杆
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









