Re: [请益] 用PHP做运算还是用MYSQL做运算 ?

时间Mon Nov 5 05:46:57 2012

我居然认真写完了，测试报告都没写这麽详细... =_= ※ 引述《sunlights (sunlights)》之铭言： : 当时的环境是mssql : (mysql我没有测过..但是当时资料笔数大概快5万笔..现在己经10几快20万) : A表放的是调查者的姓名和姓别,B放填写统计表的项目(共有20笔复选) : 分别以b1,b2,b3...b20个栏位代表,栏位型态tinyint,有选为1,没有选为0 # 使用者：使用者可以建立问卷，也可以回答问卷 CREATE TABLE user ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, realname VARCHAR(255), gender TINYINT UNSIGNED ); # 问卷 CREATE TABLE report ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, user_id INT UNSIGNED ); # 问题 CREATE TABLE question ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, description TEXT ); # 一份问卷有很多问题 CREATE TABLE report_question ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, report_id INT UNSIGNED, question_id INT UNSIGNED ); # 一个使用者对於一个问题有一个答案 CREATE TABLE answer ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, question_id INT UNSIGNED, user_id INT UNSIGNED, answer TINYINT UNSIGNED ); : 要做出 : b1 b2 b3............b20 : --------------------------------------- : 男 : 女 SELECT question_id, gender, COUNT(*) FROM answer LEFT JOIN user ON answer.user_id = user.id WHERE question_id IN (SELECT question_id FROM report_question WHERE report_id = ?) GROUP BY question_id, gender; 写得有点随便，不过应该意思有到... : 那时是用 : select count(*) from A left join b on A.pid=b.pid where A.sex='F' and b.b1=1 : select count(*) from A left join b on A.pid=b.pid where A.sex='M' and b.b1=1 : select count(*) from A left join b on A.pid=b.pid where A.sex='F' and b.b2=1 : select count(*) from A left join b on A.pid=b.pid where A.sex='M' and b.b2=1 : ...... : select count(*) from A left join b on A.pid=b.pid where A.sex='F' and b.b20=1 : select count(*) from A left join b on A.pid=b.pid where A.sex='M' and b.b20=1 这可以看 https://en.wikipedia.org/wiki/Database_index 这边讲到的 Index architecture，这跟资料库能提供的 index 架构有关。 : pid是帐号 : 结果跑到快吐血.. 是效能太差，还是写 40 条觉得很麻烦？ : 後来直接select index 栏位用php去run 才OK : 我现在都找不到用sql解决的方法.. : 欢迎大家尝试.. 前面提到的十万不知道是什麽，我就当作十万个使用者，而且 user 都有参与吧。塞十万个 user：(跑百万次) INSERT INTO user (gender) VALUES (ROUND(RAND())); 产生一个报表： INSERT INTO report SET id = 1, user_id = 1; 产生 20 个问题：(从 id = 1 跑到 20) INSERT INTO question SET id = 1; 把这 20 个问题绑到报表上：(从 question_id = 1 跑到 20) INSERT INTO report_question SET report_id = 1, question_id = 1; 对十万个使用者、二十个问题灌资料：(两百万笔) INSERT INTO answer SET question_id = 1, user_id = 1, answer = ROUND(RAND()); 没有其他 index 的情况下 (只有建立表格时提供的 primary key) 是 26 秒： mysql> SELECT SQL_NO_CACHE question_id, gender, COUNT(*) FROM answer LEFT JOIN user ON answer.user_id = user.id WHERE question_id IN (SELECT question_id FROM report_question WHERE report_id = 1) GROUP BY question_id, gender; +-------------+--------+----------+ | question_id | gender | COUNT(*) | +-------------+--------+----------+ | 1 | 0 | 50172 | | 1 | 1 | 49828 | [...] +-------------+--------+----------+ 40 rows in set (26.43 sec) 这样算快吗？我不知道... 不过这是极限状况，很少有一张问卷超过一万人填 XD 接下来改 DB schema： ALTER TABLE answer ADD COLUMN (gender TINYINT UNSIGNED); 把本来的 gender 塞进去：(跑十万次，从 id = 1 到 id = 100000) UPDATE answer SET gender = (SELECT gender FROM user WHERE id = 1) WHERE user_id = 1; 然後把 SELECT 改成： SELECT SQL_NO_CACHE question_id, gender, COUNT(*) FROM answer WHERE question_id IN (SELECT question_id FROM report_question WHERE report_id = 1) GROUP BY question_id, gender; 结果是： 40 rows in set (22.66 sec) 22 秒，快了一点点，然後补上 index： CREATE INDEX question_id_gender ON answer (question_id, gender); 然後重跑： 40 rows in set (20.95 sec) 再快了一些... 然後这边有一个 SQL issue (maybe MySQL only)，如果你把 subquery 拆出来自己做就会很快： SELECT SQL_NO_CACHE question_id, gender, COUNT(*) FROM answer WHERE question_id IN (1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20) GROUP BY question_id, gender; 速度是： 40 rows in set (1.09 sec) 这样能解答你的问题吗？XDDD --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 210.242.135.97

1^F：推 carlcarl:我刚才也在作实验不过觉得他的schema好像没那麽复杂XD 11/05 06:21

2^F：→ carlcarl:IN subquery 这个我记得有看过建议是千万不要这样作 11/05 06:23

3^F：推 carlcarl:我看他的好像是1:1的关系所以用10万:10万笔资料下去跑 11/05 06:28

4^F：→ carlcarl:不过也才4.6秒不知道他的为什麽可以跑那麽久= =a 11/05 06:28

5^F：推 cjoe:用in应该还好吧? 前题是where条件里面的东西最好都要建index 11/05 09:07

6^F：→ cjoe:如果是index状况下，我想都是log(n)的状况吧 11/05 09:07

7^F：推 cjoe:最後一个sql，gender怎麽来的? answer没看到gender 11/05 09:24

8^F：→ DarkKiller:後面有 ALTER TABLE 测试啊... 11/05 09:25

9^F：推 cjoe:XD ~ 3Q 11/05 09:25

10^F：→ cjoe:可以跟你借Data吗晚上我也想玩玩看我想试看看我的方式 11/05 09:26

11^F：→ cjoe:answer加上gender有点作弊了XD不过算空间换时间但是违反正规 11/05 09:28

12^F：推 carlcarl:嗯嗯如果是IN一般固定的值效能就比较没问题了 11/05 10:09

13^F：→ carlcarl:如果效能差的话用点反正规化OK吧~~ 11/05 10:10

14^F：→ carlcarl:我加上反正规化避开join 时间就从4.5加快到1.X秒了 11/05 10:11

15^F：→ DarkKiller:产生资料的方式我有写啊，就真的 loop 下去塞 XD 11/05 10:36

16^F：→ arrack:反正规化是常有的事情:D 11/05 10:54

17^F：推 knme:实测结果跟这篇几乎一样 XD 11/07 20:58

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

PHP 板

Re: [请益] 用PHP做运算还是用MYSQL做运算 ?

热门看板

赞助商连结