2025-03-24
2025年3月21日,上海期智研究院第13期“SQZ Talk”学术论坛邀请清华大学助理教授张焕晨带来专题报告“Debunking the Myth of Join Ordering: Toward Robust SQL Analytics”。论坛由姜建娟博士主持。
报告人简介
张焕晨
上海期智研究院PI
清华大学助理教授
张焕晨,清华大学交叉信息研究院(姚班)助理教授,研究方向为数据库系统。他于卡内基梅隆大学计算机科学系获得博士学位。加入清华之前,他曾在 Snowflake 担任博士后研究员。他曾获得 ACM 中国新星奖提名(2022),世界人工智能大会云帆奖(2021),SIGMOD Jim Gray 博士论文奖(2021)和 SIGMOD 最佳论文奖(2018)等。
专题报告
查询优化器(query optimizer)是关系数据库中至关重要且最难开发的组件。经过了数十年的研究和实践,现代查询优化器仍然难言可靠:它们偶尔还是会生成比最优方案慢几个数量级的查询计划。在众多挑战中,连接顺序选择(join ordering)是查询优化问题“皇冠上的明珠”。张焕晨教授在本次报告中介绍Robust Predicate Transfer (RPT),即稳健谓词传递算法。该算法对于无环查询的任意连接顺序具有可证明的稳健性。团队在DuckDB(一款SOTA分析型数据库)上的实验结果表明,RPT使端到端查询性能提高约1.5倍的同时,对连接顺序的稳健性有多个数量级的提升。由于RPT具有强大的理论保证和实际效率,连接顺序选择问题将大概率不再成为未来数据库优化器的首要挑战。
报告结束后,科研人员们探讨了布隆过滤器参数选择对半连接过滤有效性与计算开销的权衡机制,动态选择哈希函数在保证满足鲁棒性的连接查询操作中的有效性问题,以及是否能够结合传统连接顺序相关的优化工作进一步地提升存在环形查询计划时连接操作的鲁棒性,最后讨论了工业实践中优化器成熟度对查询重写的影响边界。
沈马成 SQZ PI
郭晓杰 SQZ博士后
李彪 SQZ高级工程师
李朝 SQZ高级工程师