作者myIDis7 (個字)
看板HatePolitics
標題Re: [討論] 王義川得意說用手機監控分析青鳥支持者?
時間Tue May 28 14:44:35 2024
大概講一下GDPR
其實要符合很簡單,就是做hash就好
做到是不是同一個人 其實沒那麼好做
要看raw data是怎麼做的
因為現在很多都會做rehash
所以同樣門號 印出來可能是不同hash值
舉例來說小明是某電話號碼A,男,學生,18歲
重點在於小明與A的連結
所以小明+A hash成B 在基地台x註冊可以正常使用網路
小明從北平東路走到青島東路
小明+A hash成C 在基地台y註冊也能正常使用網路
驗證都會通過
顯示資料就是18歲男學生參加兩個活動,但不同人
實際上可能同一個
但這部分你不知道他的架構是怎麼做的
所以你不知道B跟C是誰
有可能電信公司沒做rehash 所以都存B
也有可能是lifetime機制 一週後重新註冊
方法太多
但能確定的是 兩個活動都至少有一個 18歲男學生參加
而除掉可辨別個資部分
就符合GDPR了
依王所說的內容
發現都不同人 這比較奇怪
除非數據是有很明顯的落差 不然很難看都不同人
例如
519:男生90%,女生10%,年齡層20-40,來源北部縣市
521:男生55%,女生45%,年齡層遍佈,來源北部縣市
524:男生50%,女生50%,年齡層遍佈,來源各縣市
這樣應該很清楚看三波人不一樣吧
※ 引述《sgtotoro (哈哈)》之銘言:
: : 重點在於王直接將三次不同日期不同地點的人
: : 來做比較
: : 當然 第一個有可能他隨便唬爛的
: : 拿個不知道什麼東西的來做比對
: : 發現三場都不同人
: : 這有可能呀
: : 想想都知道怎麼可能選前之夜的人群一個都沒來
: : 助理不用來嗎
: : 可是如果是真的
: : 去識別資料理論上不可能做這樣的連結
: : 中華電信更不可能違法提供未去識別的資料
: : 如電話號碼 身份証 姓名 出生年與年齡等
: : 年齡區塊本身已經是去識別的資料
: : 沒人能從年齡區塊去三場比對出不同人吧
: 辦法是人想的(小草肯定想不出來):
: 數據代碼AAAABCDEFGHIJ
: AAAA=門號代碼(非門號自身) B=年齡 C=性別 ....以下自行舉例帶入
: 你只要數據代碼無從識別特定之當事人即不違反個資法
: 之後只要比較三次的數據代碼不就做到了且不違反個資法是吧!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.78.92.165 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/HatePolitics/M.1716878678.A.2DA.html
1F:推 GYGY5566: 你這樣不好啦111.71.212.223 05/28 14:46
2F:推 alanjiang: 推推1.168.209.190 05/28 14:47
3F:→ CHADA: 太專業小草看不懂== 122.121.10.89 05/28 14:47
4F:推 lono: 代表王義川有hash前的資料119.77.141.116 05/28 14:48
這是不太可能的 就連高層都不太可能有...有資料的通常都是最底層工程師
他們的工作就是負責hash,然後各部門資料才能加值拿來賣
如果是先賣資料再hash,難以想像...一次個資洩漏事件可能會倒
5F:→ WeGoYuSheng: 小草:完全看不懂你要表達什麼,真是111.71.212.54 05/28 14:49
6F:→ WeGoYuSheng: 空洞111.71.212.54 05/28 14:49
7F:推 ymx3xc: 推114.38.90.34 05/28 14:51
※ 編輯: myIDis7 (112.78.92.165 臺灣), 05/28/2024 14:52:41
8F:推 TristyRumble: TA MEDIA之類的廣代都有用這投廣了 125.227.6.208 05/28 14:53
9F:→ TristyRumble: 不知道他們在大驚小怪什麼... 125.227.6.208 05/28 14:53
10F:噓 tomet: 就製造對DPP的不信任,前幾年不都這樣搞? 42.79.94.70 05/28 14:55
11F:→ blade0314: 超棒的又在洗這很常見都是這樣的 你不 111.249.200.66 05/28 14:58
12F:→ blade0314: 懂 這問題根源明明就是要嘛王亂講要 111.249.200.66 05/28 14:58
13F:→ blade0314: 嘛拿到不該有的資料好嗎(指推文的 111.249.200.66 05/28 14:58
14F:推 JaccWu: 這篇也有提到 如何辨別不同場的人/小草223.136.111.221 05/28 15:02
15F:→ JaccWu: 這個疑問啦223.136.111.221 05/28 15:02
16F:推 cobrasgo: 我猜是電信商的鍋,拿未去識別化的資料 42.72.66.224 05/28 15:02
17F:→ cobrasgo: 來處理客戶要求,把結果去識別化交出去 42.72.66.224 05/28 15:02
18F:→ JaccWu: 也有提到理論上的去識別方法 給推223.136.111.221 05/28 15:03
19F:→ BIGETC: 他自己說是用孤狗 更神奇啦 101.12.100.218 05/28 15:05
20F:推 yhyang1991: 正常是不應該有hash前的資料 啊王義 111.71.75.31 05/28 15:11
21F:→ yhyang1991: 川講成這樣…== 111.71.75.31 05/28 15:11
22F:→ moonh2580: 執政黨就是用電信資料監控人民活動 61.231.91.150 05/28 16:02
23F:→ myIDis7: 其實事實上就是分不出主體,也沒有違反GD 112.78.92.165 05/28 16:06
24F:→ myIDis7: PR的問題 112.78.92.165 05/28 16:06
25F:推 coldstan123: 怎麼會有人洗這個啦,這都做幾年來 211.20.219.155 05/28 18:22
26F:→ coldstan123: 了XD 211.20.219.155 05/28 18:22