作者stevekevin10 (hippo泡)

看板Soft_Job

标题

[请益] 资料库join後count速度问题

时间Sun May 8 16:47:27 2016

抱歉又来请益个资料库问题m_ _m 需要join 500万跟 3万笔的表格根据筛选条件後再根据後者的栏位做count 但现在下完query後都会卡住请问该如何是好 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.97.130 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1462697249.A.497.html

1^F：推 abc0922001: 弱弱问一下，资料库有建立索引吗05/08 16:53

2^F：→ stevekevin10: 有05/08 16:53

3^F：推 sivid: 能不能搬到cloud上面 scale up?05/08 17:03

目前没有cloud能用。。 ※ 编辑: stevekevin10 (114.136.97.130), 05/08/2016 17:03:49

4^F：推 longlongint: 可以先用小笔测试资料来估计 500万join3万会是几笔吗05/08 17:11

5^F：→ ga013077: 500万的能先下条件缩小范围??05/08 17:11

6^F：推 andyjon: 该用hash join 看看05/08 17:13

好我试试看以前没用过m_ _m

7^F：推 brucetu: 3万笔的那张表 , 先筛过再来join?05/08 17:34

是要join完後再筛@@

8^F：推 alog: 以前用过两张数百万笔的资料做join 结果性能悲剧05/08 17:37

9^F：→ alog: 为了解决这个问题把整套db放到ram disk05/08 17:37

10^F：→ alog: 结果还是跑了一整天没有结果05/08 17:38

11^F：→ alog: 调了db各种参数还是没用05/08 17:38

QQ ※ 编辑: stevekevin10 (114.136.97.130), 05/08/2016 17:41:11

12^F：→ alog: 後来我就异想天开想说分批查询试试就把两张表的资料用LIMI 05/08 17:40

13^F：→ alog: T 先控制住范围 05/08 17:40

14^F：→ alog: 然後分几次查询大概一次查询只花了半分钟 05/08 17:41

15^F：→ alog: 当天干了要死XD 05/08 17:41

16^F：→ ian90911: 可以检查是不是有开多线程搜寻? 05/08 17:42

17^F：推 gn01838335: Union不同条件的select 05/08 17:56

18^F：→ yyc1217: 可以用explain看看 05/08 17:59

19^F：→ yyc1217: 还是想看看query 也许会变成500万*3万个再筛选的结果 05/08 18:00

20^F：→ brucetu: 原本查询长什麽样子为什麽一定要join完再筛@@ 05/08 18:18

21^F：推 yourinfo: 问的太龙统了，简单说就是先处理500万，再join 05/08 21:19

22^F：→ yourinfo: 为什麽一定要先join才能查!? 05/08 21:20

23^F：推 sing10407: 太笼统了 sql贴出来才知道 05/08 21:23

24^F：推 et69523820: 我的作法是都不join 单独读取出500万放阵列单独读取 05/08 21:28

25^F：→ et69523820: 3万笔放阵列用key当元素马上就可以指到你要的资料 05/08 21:30

26^F：→ et69523820: 这样总共读取出503万笔资料大概几分钟就可以跑完 05/08 21:33

27^F：推 et69523820: join会有乘积效应所以我基本上都不会用join都改用阵 05/08 21:39

28^F：→ et69523820: 列处理 05/08 21:39

29^F：推 kiwatami: 我猜你的资料库启动後没有把资料读到记忆体内 05/08 21:56

30^F：→ kiwatami: 而是用硬碟在跑才会这麽慢然後你建的索引 05/08 21:56

31^F：→ kiwatami: 跟你 join 的栏位有一样吗 05/08 21:56

32^F：→ kiwatami: 把 schema 跟 SQL 都放上来比较好判断 05/08 21:56

33^F：→ kiwatami: 500万 * 3万正常应该不至於会卡住 05/08 21:56

34^F：推 et69523820: 要看3万对应出来有几笔如果对应出来有1000笔 05/08 22:13

35^F：→ et69523820: 500万 * 1000笔 = 50亿 2000笔就 100亿... 05/08 22:14

36^F：→ alan3100: 大哉问你这样问从头到尾都有东西可以讲等於没讲 05/08 22:16

37^F：推 abc0922001: 希望index的栏位有在查询的栏位中XDD 05/08 22:29

38^F：推 sorianotw: 即便放到ram里面，可以思考看看这样的资源成本是否过 05/09 09:11

39^F：→ sorianotw: 高 05/09 09:11

40^F：→ sorianotw: 效能不是只有速度而已，资源耗用多少会影响整个系统的 05/09 09:13

41^F：→ sorianotw: 吞吐量，这也是需要去思考的议题 05/09 09:13

42^F：推 sorianotw: 蛮多使用join的情景，都可以拆分成数个simple select, 05/09 09:15

43^F：→ sorianotw: 资料量大的状况下，速度反而更快，且资源耗用量更小 05/09 09:15

44^F：推 kiwatami: 启动时没读搜寻後也是会存进去只是先後顺序而已 05/09 13:34

45^F：推 iamshiao: 推 05/10 19:30

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Soft_Job 板

[请益] 资料库join後count速度问题

热门看板

赞助商连结