作者nini200 (200妮妮)
看板Python
标题[问题] 多栏位去除重复元素方式?(求思路)
时间Sat Feb 23 09:06:57 2019
多栏位去除重复元素方式?(求思路)
目前爬取公司名称和电话
将各个网站爬取资料整合起来时
会有以下状况
栏位一(地区) 栏位二(公司名) 栏位三(电话)
台中市 公司名1 123456
中市 公司名1- 123456
中市西区 公司1 123456
以电话相同为基准去重 公司名任意留一个
三列处理完 希望只剩下一列
请问有什麽方式处理吗
提个思路或套件都可以
感谢大家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.218.52.174
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1550884019.A.C9F.html
2F:→ charlie11438: 重 02/23 09:16
3F:→ nini200: 好 谢谢分享 02/23 21:34
4F:推 CodingMan: if key in list: del else: add to list 02/24 09:32
5F:→ CodingMan: key = 你的电话 02/24 09:33
这只处理单一栏位吧?
6F:推 adrianshum: [c.tel:c for c in company_list].items() ? 02/24 18:29
看不懂 还是谢谢您
※ 编辑: nini200 (101.13.177.69), 02/25/2019 09:38:22
7F:推 adrianshum: 打错了orz { c.tel : c for c in company_list}.value 02/26 13:10
8F:→ adrianshum: s() 才对 02/26 13:10
9F:推 adrianshum: 解释另回文吧 02/26 13:13