SQL里是否可以使用JOIN
2023-04-18 14:49:33 时间
很多公司都禁止程序员在 SQL 中使用 JOIN,至于原因则出奇的一致:用 JOIN 慢。不过我从没见过谁来论证为什么用 JOIN 慢,结果这个人云亦云的结论越传越广,让我觉得是时候来讨论一下这个看似正确的结论了。
举个例子:查询最新的十篇帖子和对应的用户信息,用 JOIN 是这样的:
SELECT posts.id, posts.content, users.name, ...
FROM posts
JOIN users on posts.user_id = users.id
ORDER BY posts.created_at DESC
LIMIT 10
如果不使用 JOIN 的话,那么大概会改写成如下两条 SQL:
SELECT id, content, ...
FROM posts
ORDER BY created_at DESC
LIMIT 10
SELECT name, ...
FROM users
WHERE id in (...)
第一次查询得到帖子数据,然后在程序代码里收集好想要的 user_id,第二次查询通过 user_id 得到用户数据,接着在程序代码里把两份数据组合起来。
哪个快?我就不用跑个 bench 了吧,正常人都能看出来是用 JOIN 的快!
JOIN
在我看来,JOIN 的问题不是性能,而是当你执行 posts JOIN users 的时候,实际上相当于做出了一个承诺:posts 和 users 两个结婚的表将永远住在同一个 DB 实例上,以后无论贫穷还是富有,疾病还是健康,永不分离。不过实际上,随着项目的发展,很可能会出现 posts 和 users 两个表不得不离婚的情况,结果它们会被划分到不同 DB 实例,一旦出现此类情况,那么当初使用 JOIN 的地方将不得不大量改写。
至于 SQL 里是否可以使用 JOIN,如果相关的表以后有独立部署的可能性,那么就要考虑避免使用 JOIN,否则用 JOIN 也无妨。当然,有人会找出一些使用 JOIN 后效率奇差的例子,不过这样的问题一来可能是索引不佳,二来可能是特殊情况,用不用 JOIN 都会有类似的问题,只要使用的时候留意即可。下次如果大家再听到别人以性能为由反对 JOIN 的使用,那么不妨把本文的链接发给他,因为他多半没有搞清楚真正的原因是什么。
相关文章
- 淘宝网应用Oracle技术强化基础架构和数据仓库环境
- 高频考点之六大进程通信机制
- 如何在Windows上运行Apache Kafka?
- 微软第二财季净利润狂增33%:云计算大爆发、Windows系统被边缘化
- 嵌入式笔试面试题目系列(五)
- 详解基于Cortex-A9,I2C外设
- 企业采用云计算的好处和挑战
- 边缘计算如何缓解生命科学中的挑战
- 最大化云存储的最佳方法
- 跬智信息全新推出云原生数据底座玄武,助力国产化数据服务再次升级
- 边缘计算的未来:五个值得关注的趋势
- 国际足联如何在世界杯上使用人工智能
- 数字孪生和城市可持续发展
- 边缘计算预测:服务提供商将成为大赢家
- 迁移到云端时确保数据安全的贴士和技巧
- 如何借助边缘计算提升物联网性能?
- 端边云协同:从云到边缘
- 理解 Net Device Ingress 和 Egress 双重角色
- 2023年影响设建筑施管理发展的技术趋势
- 美国金融业监管局CIO Steve Randich推动公有云勇往直前