作者hpo14 (雨)
看板EZsoft
標題Re: [請問] 比對兩個文章內容軟體
時間Wed Nov 14 01:31:08 2018
: 我有兩個文字檔,大約有40萬行
: 這兩個文字檔重複性很高,
: 例如:
: 文件A 的第一行 , 可能出現在文件B第1000行
: 文件A 的第20行 , 可能出現在文件B第10000行
:
: 我希望比對這兩份文件 各缺什麼資料
:
: → hpo14: https://askubuntu.com/questions/845502 11/14 01:08
: → hpo14: grep -Fvxf file2 file1 11/14 01:08
linux 內建 grep 指令 / windows 的話請自己去下載 grep
ex:
http://unxutils.sourceforge.net/
grep -Fvxf
file2 file1 > file1_extra
~~~~~ file1 有,但 file2 沒有 的內容
grep -Fvxf
file1 file2 > file2_extra
~~~~~ file1 沒有,但 file2 有 的內容
參數說明: grep [-參數]
PATTERN FILE
搜尋對象
搜尋內容
-F PATTERN 是以"斷行"分隔的內容
-f 從檔案取得 PATTERN
-v 選出沒找到的內容
-x PATTERN 必須完全符合
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.17.25
※ 文章網址: https://webptt.com/m.aspx?n=bbs/EZsoft/M.1542130273.A.EDD.html
1F:推 zchien: 謝謝,等下馬上測試 11/14 06:54
2F:推 zchien: 測試過 可以用,非常感謝 11/15 22:27
3F:→ zchien: 我發現windows內建findstr和grep一樣功能強大 11/15 22:28
4F:→ kobe8112: Windows上我是習慣用notepad++的套件 11/15 23:35
5F:推 zchien: K大,請問是什麼套件 11/16 21:36
6F:→ dennisxkimo: notepad++ 有比對兩個文件的套件 11/17 10:30
7F:→ kobe8112: notepad++的compare plugin 11/18 14:50
8F:推 yimean: 所以能分享一下,比對花了多少時間嗎? 11/22 07:05
9F:推 zchien: 幾秒鐘就比完了,速度很快 12/03 22:49