作者zchien (小建)
看板EZsoft
標題[請問] 比對兩個文章內容軟體
時間Wed Nov 14 00:17:15 2018
我有兩個文字檔,大約有40萬行
這兩個文字檔重複性很高,
例如:
文件A 的第一行 , 可能出現在文件B第1000行
文件A 的第20行 , 可能出現在文件B第10000行
我希望比對這兩份文件 各缺什麼資料
我知道EXCEL 有vlookup 函數可以比對
但是跑40萬行,EXCEL 可能就死了
WinMerge 這軟體,只能每行去比對, 不是我要的需求
不知道是否有軟體可以做到
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.163.194.7
※ 文章網址: https://webptt.com/m.aspx?n=bbs/EZsoft/M.1542125838.A.6AA.html
1F:→ vernc: UltraCompare Beyond Compare試試 11/14 00:42
2F:→ vernc: 以前寫過vbs比對同人清單,2x萬筆跑了25h 11/14 00:44
3F:→ hpo14: 先將文件A篩選,重複的合併。然後拿文件A的每一行 11/14 01:01
4F:→ hpo14: 去 grep 文件B 11/14 01:01
5F:→ hpo14: 去找 文件b 11/14 01:05
7F:→ hpo14: grep -Fvxf file2 file1 11/14 01:08
8F:→ zchien: Vernc大 推薦那兩個和winerg功能相同,不可以 11/14 01:14
9F:→ Bellkna: kdiff3? 11/14 08:04