作者zeroexe306 ()
看板C_and_CPP
标题[问题]关於大量资料各种不同条件规范之个数统计
时间Thu Apr 30 21:17:21 2009
在此想请教版上各位高手
目前我手上有一堆.csv档案的row data (大约有5000个左右的.csv档)
其主要档案内容如下
ex:
1,a1,b1,c1,d1,e1,............,x1,y1
2,a2,b2,c2,d2,e2,............,x2,y2
3,a3,b3,c3,d3,e3,............,x3,y3
.
.
.
20000,a20000,b20000,c20000,d20000,e20000,............,x20000,y20000
其中a1~a20000、b1~b20000、c1~c20000、d1~d20000..... 皆为数值
a、b、c、d...代表某个样品其个别对应特性
每个.csv档大约都有19000~21000笔样品的row data
在此想请问若我想建立以下格式
条件1:b>10
条件2:c>250
规范:
┌────┬─────┬─────┐
│ │0.1<y≦0.2│0.1<y≦0.2│
├────┼─────┼─────┤
│0<x≦5 │ Grade1 │ Grade2 │
├────┼─────┼─────┤
│5<x≦10 │ Grade3 │ Grade4 │
├────┼─────┼─────┤
│10<x≦15│ Grade5 │ Grade6 │
├────┼─────┼─────┤
│15<x≦20│ Grade7 │ Grade8 │
└────┴─────┴─────┘
以上的意思是在b特性值大於10与c特性值大於250时候
x特性值大於0且小於等於5 与 y特性值大於0.1且小於等於0.2时候
Grade1栏由初始值0累计为1 其他Grade栏同理
主要是要得到所有样品其不同特性下之分布
目前我主要卡在如何读取n档内第n行开始的row data
与如何将累积的数量输出成一个新的档案表格(ex:csv档或者txt档)
烦请各位高手帮忙解答了 感恩 @@
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 122.123.133.217