作者myIDis7 (个字)
看板HatePolitics
标题Re: [讨论] 王义川得意说用手机监控分析青鸟支持者?
时间Tue May 28 14:44:35 2024
大概讲一下GDPR
其实要符合很简单,就是做hash就好
做到是不是同一个人 其实没那麽好做
要看raw data是怎麽做的
因为现在很多都会做rehash
所以同样门号 印出来可能是不同hash值
举例来说小明是某电话号码A,男,学生,18岁
重点在於小明与A的连结
所以小明+A hash成B 在基地台x注册可以正常使用网路
小明从北平东路走到青岛东路
小明+A hash成C 在基地台y注册也能正常使用网路
验证都会通过
显示资料就是18岁男学生参加两个活动,但不同人
实际上可能同一个
但这部分你不知道他的架构是怎麽做的
所以你不知道B跟C是谁
有可能电信公司没做rehash 所以都存B
也有可能是lifetime机制 一周後重新注册
方法太多
但能确定的是 两个活动都至少有一个 18岁男学生参加
而除掉可辨别个资部分
就符合GDPR了
依王所说的内容
发现都不同人 这比较奇怪
除非数据是有很明显的落差 不然很难看都不同人
例如
519:男生90%,女生10%,年龄层20-40,来源北部县市
521:男生55%,女生45%,年龄层遍布,来源北部县市
524:男生50%,女生50%,年龄层遍布,来源各县市
这样应该很清楚看三波人不一样吧
※ 引述《sgtotoro (哈哈)》之铭言:
: : 重点在於王直接将三次不同日期不同地点的人
: : 来做比较
: : 当然 第一个有可能他随便唬烂的
: : 拿个不知道什麽东西的来做比对
: : 发现三场都不同人
: : 这有可能呀
: : 想想都知道怎麽可能选前之夜的人群一个都没来
: : 助理不用来吗
: : 可是如果是真的
: : 去识别资料理论上不可能做这样的连结
: : 中华电信更不可能违法提供未去识别的资料
: : 如电话号码 身份证 姓名 出生年与年龄等
: : 年龄区块本身已经是去识别的资料
: : 没人能从年龄区块去三场比对出不同人吧
: 办法是人想的(小草肯定想不出来):
: 数据代码AAAABCDEFGHIJ
: AAAA=门号代码(非门号自身) B=年龄 C=性别 ....以下自行举例带入
: 你只要数据代码无从识别特定之当事人即不违反个资法
: 之後只要比较三次的数据代码不就做到了且不违反个资法是吧!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 112.78.92.165 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/HatePolitics/M.1716878678.A.2DA.html
1F:推 GYGY5566: 你这样不好啦111.71.212.223 05/28 14:46
2F:推 alanjiang: 推推1.168.209.190 05/28 14:47
3F:→ CHADA: 太专业小草看不懂== 122.121.10.89 05/28 14:47
4F:推 lono: 代表王义川有hash前的资料119.77.141.116 05/28 14:48
这是不太可能的 就连高层都不太可能有...有资料的通常都是最底层工程师
他们的工作就是负责hash,然後各部门资料才能加值拿来卖
如果是先卖资料再hash,难以想像...一次个资泄漏事件可能会倒
5F:→ WeGoYuSheng: 小草:完全看不懂你要表达什麽,真是111.71.212.54 05/28 14:49
6F:→ WeGoYuSheng: 空洞111.71.212.54 05/28 14:49
7F:推 ymx3xc: 推114.38.90.34 05/28 14:51
※ 编辑: myIDis7 (112.78.92.165 台湾), 05/28/2024 14:52:41
8F:推 TristyRumble: TA MEDIA之类的广代都有用这投广了 125.227.6.208 05/28 14:53
9F:→ TristyRumble: 不知道他们在大惊小怪什麽... 125.227.6.208 05/28 14:53
10F:嘘 tomet: 就制造对DPP的不信任,前几年不都这样搞? 42.79.94.70 05/28 14:55
11F:→ blade0314: 超棒的又在洗这很常见都是这样的 你不 111.249.200.66 05/28 14:58
12F:→ blade0314: 懂 这问题根源明明就是要嘛王乱讲要 111.249.200.66 05/28 14:58
13F:→ blade0314: 嘛拿到不该有的资料好吗(指推文的 111.249.200.66 05/28 14:58
14F:推 JaccWu: 这篇也有提到 如何辨别不同场的人/小草223.136.111.221 05/28 15:02
15F:→ JaccWu: 这个疑问啦223.136.111.221 05/28 15:02
16F:推 cobrasgo: 我猜是电信商的锅,拿未去识别化的资料 42.72.66.224 05/28 15:02
17F:→ cobrasgo: 来处理客户要求,把结果去识别化交出去 42.72.66.224 05/28 15:02
18F:→ JaccWu: 也有提到理论上的去识别方法 给推223.136.111.221 05/28 15:03
19F:→ BIGETC: 他自己说是用孤狗 更神奇啦 101.12.100.218 05/28 15:05
20F:推 yhyang1991: 正常是不应该有hash前的资料 啊王义 111.71.75.31 05/28 15:11
21F:→ yhyang1991: 川讲成这样…== 111.71.75.31 05/28 15:11
22F:→ moonh2580: 执政党就是用电信资料监控人民活动 61.231.91.150 05/28 16:02
23F:→ myIDis7: 其实事实上就是分不出主体,也没有违反GD 112.78.92.165 05/28 16:06
24F:→ myIDis7: PR的问题 112.78.92.165 05/28 16:06
25F:推 coldstan123: 怎麽会有人洗这个啦,这都做几年来 211.20.219.155 05/28 18:22
26F:→ coldstan123: 了XD 211.20.219.155 05/28 18:22