作者geo317 (加油!!)
看板Database
标题[SQL ] Access上作去除重复资料(de-dupe)问题
时间Mon Mar 15 22:33:46 2010
各位前辈好,目前我在尝试作大量资料dedupe,以access 2003实作。
档案格式如下:
file 1
name address
-----------------------------
Abc Xyz 123 blk xy road
file 2
name address
-----------------------------
Xyz Abc 123 blk xy rd.
问题有3:
1. dedupe name时,有前後顺序的问题。我有想过将name作切割作比对,但不知道是否有
更好的作法
2. dedupe add时,会有缩写的问题。目前也是想到以字串函数抓缩写作比对。同样的,不
晓得是否有更好的作法..
3. 目前是要用SQL+VBA写,不知道各位大大在coding上有什麽建议..
问题可能蛮接近是data clean的问题,若有任何的资源可以提供,感激不尽!
这是小弟尝试写的第一个资料库,问题若问的不好,还请见谅。感恩!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 58.185.35.134
※ 编辑: geo317 来自: 58.185.35.134 (03/15 22:36)
1F:推 PsMonkey:你要不要举例说一下你想要的 dedupe 规则 ==.==== 03/16 00:48