作者reader (读者)
看板CSSE
标题Re: [问题] 行与列
时间Fri Aug 18 12:23:05 2006
※ 引述《micklin (mick)》之铭言:
: 最近在处理基因序列, 资料的储存一直让我很头痛,
: 在传统资料处理时, 我都把column对应到feature, 把row当成一笔资料.
: 但是现在的问题是MySQL不能处理2000个column (colon dataset),
: 更别说另一个五万多个基因的dataset了.
: 转成文字模式再用UltraEdit处理, 在4096个字元後就强迫断行了 = =
: 虽然可以自己用程式接起来就是了....
: 所以我的问题是,
: 在处理行与列的时候有没有什麽不同呢?
: 为什麽我们平常处理文字档或资料库的时候,
: 会偏好row很多而不是column很多?
: 是档案结构的问题还是什麽地方的限制呢?
: 谢谢回答.
比较技术性的解法,是使用 data_index, feature_index, feature 三个栏位,
并设定 index 在 data_index 栏位上。
电脑系统本来就倾向处理大量资料,而不是复杂资料,单是要处理复杂资料,就
会需要建立复杂的输出入介面,大大地减低电脑对於复杂资料的处理能力。
如果不需要建立复杂的介面,也就等同於可以拆解资料了。
而且,避开极端性状况来设计通用系统,原本就是一个有效降低软体开发困难、
增加系统效能的好方法。这几乎是所有便宜好用的系统的共同设计理念。
所以无论就介面、效能、开发上,多数资料系统都会倾向以处理简单资料 (栏位
较少) 而不是复杂资料 (栏位较多) 为主要目的,并适度加上限制。
就你的情况,使用二进位资料档,写程式来储存处理,其实是比较适合的做法,
要有几个栏位都随你。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.222.173.30
1F:→ micklin:谢谢您的回答 08/18 16:25