作者JeremyJoung (J.J.)
看板Database
标题Re: [SQL ] JOIN TABLE时WHERE的用法会影响效能吗?
时间Thu Aug 11 16:02:33 2016
JOIN 不是不可以用子查询 而是多半会造成过度记忆体载入
在MySQL中 A JOIN B 的原理是
读取A 然後"一行一行"匹配B
也就是 B是"需要"多少才读取多少 不会整个载入
但是如果是 A JOIN (B)的话
则会强迫先把B完全载进记忆体TEMP 然後才开始做逐行JOIN
因此 子查询动作会造成过度的记忆体负担
但在MSSQL中 就完全不是这麽一回事喔
MSSQL 是真的会先把两边的表都读出来後(并赋予临时表INDEX) 才在记忆体中做JOIN
这是两边SQL的行为差异
MSSQL的临时表都会尽可能的赋予INDEX(依据来源TABLE INDEX)
所以MSSQL 非常擅长做复杂的JOIN运算
因为每一个TABLE都可以使用INDEX加速
就算是临时表中 真的没有原生INDEX
他也会先强迫制作一个HASH INDEX後才拿去汇总 但是就很耗时
但是 这并不表示MySQL中子查询就是万恶的
如果 今天的条件是
# A JOIN B 并且使用B的统计运算
SELECT ID, COUNT(B.*)
FROM A JOIN B ON ID
GROUP BY A.ID
那麽B使用子查询GROUP 且B的INDEX写的非常理想的话
A JOIN (SELECT ID, COUNT(*) FROM B GROUP BY ID) B2 ON ID
就会有"绝对性"的加速
因为 原本 A JOIN B 要将整个表SCAN出来後 并且用FILE SORT才能完成的动作
在简单查询中 B可以直接实现COUNT/SUM/MIN/MAX BY INDEX 立即产生解答
而另一方面 当只要A,B已经被JOIN起来之後
就再也无法使用任何INDEX 就只能交由TEMP SORT慢慢排列
所以 根据条件来使用SUB-QUERY GROUP BY 会有飞快的效果
另外 如果是 A JOIN B JOIN C GROUP BY A
这种更复杂的条件的话的话
这种[先压缩再组合]的效果会更明显 大约是加快10~100倍以上
因为3个表串连以後 记忆体体绩通常会膨胀数千到数十万倍
所以 先压缩(GROUP BY)再组合(JOIN) 可以有效的避免记忆体的肥大化
-
另外
原始的SQL写的不是很理想 完全无法使用任何的INDEX
首先 命令可以这样改写
SELECT * FROM A
LEFT JOIN B ON A.key=B.key AND B.name like '%k%'
WHERE A.key like '%k%'
这样就够了 其余都是多余的
对B的过滤 可以在JOIN ON 同时执行 效果和WHERE是没两样的
甚至你高兴的话 也可以在ON过滤A
但是结果不会有意义 因为是LEFT JOIN
另外
B SUB-QUERY中呼叫 WHERE A.name like '%k%'
A.name 应该是打错字吧?? 要用B.name才对吧?
如果在B中呼叫A.name 也是会过的喔 因为B的视野中有A
但是会造成无效查询 记忆体无限膨胀
然後
外部的 (A.key like '%k%' OR B.key like '%k%') 是没有意义的
因为你已经用JOIN 把 A.key=B.key 所以两者必然相同
使用OR 只会使INDEX无效化而已
虽然在使用 LIKE '%k%' 时 本来就已经无效化了
※ 引述《JYHuang (夏天到了,冷不起来了说)》之铭言:
: 今天在写MySQL时,发现条件比较宽时会出现捞资料捞到SERVER没回应
: 便有点好奇WHERE先後顺序和配对会不会影响效能?
: Table A和B大概都是有几千比的资料
: 两着的关联是由一个可能为空白(不是null)的值
: 在下了指令
: SELECT * FROM A
: LEFT JOIN (SELECT * FROM B WHERE A.name like '%k%' ORDER BY x) B
: ON A.key=B.key
: WHERE (A.key like '%k%' OR B.key like '%k%')
: 然後就执行到没回应了,
: 猜想用括号括起来是不是会先JOIN 再做条件
: 要是如果改下
: WHERE A.key like '%k%' OR B.key like '%k%'
: 会不会先把A做饰选後再去JOIN饰选後的B?
: 另外
: WHERE (A.key like '%k%' OR B.key like '%k%') AND (A.id = n OR B.id)
: 跟
: WHERE A.key like '%k%' OR B.key like '%k%' AND A.id = n OR B.id
: 应该是不一样结果的吧?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.163.72.102
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Database/M.1470902555.A.0D6.html
※ 编辑: JeremyJoung (118.163.72.102), 08/11/2016 16:07:27
1F:推 neo5277: 推 08/13 01:53
2F:→ hhhomerun: 长知识了 08/15 12:45
3F:推 dali17dali17: 好猛 08/26 23:45