作者zchien (小建)
看板EZsoft
标题[请问] 比对两个文章内容软体
时间Wed Nov 14 00:17:15 2018
我有两个文字档,大约有40万行
这两个文字档重复性很高,
例如:
文件A 的第一行 , 可能出现在文件B第1000行
文件A 的第20行 , 可能出现在文件B第10000行
我希望比对这两份文件 各缺什麽资料
我知道EXCEL 有vlookup 函数可以比对
但是跑40万行,EXCEL 可能就死了
WinMerge 这软体,只能每行去比对, 不是我要的需求
不知道是否有软体可以做到
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.163.194.7
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/EZsoft/M.1542125838.A.6AA.html
1F:→ vernc: UltraCompare Beyond Compare试试 11/14 00:42
2F:→ vernc: 以前写过vbs比对同人清单,2x万笔跑了25h 11/14 00:44
3F:→ hpo14: 先将文件A筛选,重复的合并。然後拿文件A的每一行 11/14 01:01
4F:→ hpo14: 去 grep 文件B 11/14 01:01
5F:→ hpo14: 去找 文件b 11/14 01:05
7F:→ hpo14: grep -Fvxf file2 file1 11/14 01:08
8F:→ zchien: Vernc大 推荐那两个和winerg功能相同,不可以 11/14 01:14
9F:→ Bellkna: kdiff3? 11/14 08:04