[讨论] 关於读入档案做後续处理

时间Wed Oct 5 01:28:54 2016

最近在写程式时遇到一个疑问，想提出来大家讨论看看，看怎样做比较好我有一个文字档，里面大概有20几万行的资料内容大概是这样，某一个item，後面有一组数值 a 5 b 6 c 79 ... 那我今天要对这个文字档做搜寻的动作，而搜寻的关键字大概有7-8个我以结构的方式储存这些关键字与其相关的值这时候我考量到一个问题，因为文字档有20几万行，那要搜寻7-8次 1.会直接用while-loop方式，从头搜寻到尾，然後以fseek的方式，将档案指标指回档案起始位置 2.会搜寻完一次先fclose，然後再fopen一次 3.将档案内容先全部读进来记忆体，并且以资料串结方式储存我这人是用3，因为以我的认知，档案读写虽然有经过缓冲区，但是还是必须对硬碟存取那搜寻7-8次，就得存取超多超多次如果我只对档案存取一次，接着就是对记忆体做读写，是否会比较快一点呢?? 这次叙述说真的，不是很清楚，我承认我不太会表达我想表达的所以如果有需要补充的，请告诉我感谢 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.228.250.47 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1475602137.A.B2B.html

1^F：→ Schottky: 也不需要读 8 次档，也用不着全部读进来储存 10/05 01:31

2^F：→ Schottky: 一次读一行，用 8 个关键字都搜过，再读下一行就好 10/05 01:32

这样子阿~~~我还真的突然没想到这个方法，感谢指教 ※ 编辑: jacky1989 (61.228.250.47), 10/05/2016 01:33:50

3^F：→ Schottky: 这样缓冲区的效果也很好，你写起程式也很方便 10/05 01:33

4^F：→ Schottky: 回到你问的问题，当然整个档案读进记忆体再料理比较快 10/05 01:44

5^F：→ Schottky: 反正输入档也很小，20 万行大概 20MB 而已，OK 的 10/05 01:45

6^F：→ Schottky: 如果输入档有 4GB 那就会开始遇到一些额外的麻烦事了 10/05 01:46

7^F：推 CaptainH: 可以先sort再binary search 10/05 11:45

8^F：推 james732: 如果关键字有唯一性的话我会想建字典 10/05 11:53

9^F：→ MOONRAKER: shell grep 喔耶 10/05 13:57

10^F：推 longlongint: grep 或写个 inverse index table 10/05 20:08

11^F：推 longlongint: 不过还是推个1楼现阶段最实用 10/05 20:12

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

C_and_CPP 板

[讨论] 关於读入档案做後续处理

热门看板

赞助商连结