作者hpo14 (雨)
看板EZsoft
标题Re: [请问] 比对两个文章内容软体
时间Wed Nov 14 01:31:08 2018
: 我有两个文字档,大约有40万行
: 这两个文字档重复性很高,
: 例如:
: 文件A 的第一行 , 可能出现在文件B第1000行
: 文件A 的第20行 , 可能出现在文件B第10000行
:
: 我希望比对这两份文件 各缺什麽资料
:
: → hpo14: https://askubuntu.com/questions/845502 11/14 01:08
: → hpo14: grep -Fvxf file2 file1 11/14 01:08
linux 内建 grep 指令 / windows 的话请自己去下载 grep
ex:
http://unxutils.sourceforge.net/
grep -Fvxf
file2 file1 > file1_extra
~~~~~ file1 有,但 file2 没有 的内容
grep -Fvxf
file1 file2 > file2_extra
~~~~~ file1 没有,但 file2 有 的内容
参数说明: grep [-参数]
PATTERN FILE
搜寻对象
搜寻内容
-F PATTERN 是以"断行"分隔的内容
-f 从档案取得 PATTERN
-v 选出没找到的内容
-x PATTERN 必须完全符合
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.34.17.25
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/EZsoft/M.1542130273.A.EDD.html
1F:推 zchien: 谢谢,等下马上测试 11/14 06:54
2F:推 zchien: 测试过 可以用,非常感谢 11/15 22:27
3F:→ zchien: 我发现windows内建findstr和grep一样功能强大 11/15 22:28
4F:→ kobe8112: Windows上我是习惯用notepad++的套件 11/15 23:35
5F:推 zchien: K大,请问是什麽套件 11/16 21:36
6F:→ dennisxkimo: notepad++ 有比对两个文件的套件 11/17 10:30
7F:→ kobe8112: notepad++的compare plugin 11/18 14:50
8F:推 yimean: 所以能分享一下,比对花了多少时间吗? 11/22 07:05
9F:推 zchien: 几秒钟就比完了,速度很快 12/03 22:49