作者hay955940 (hay955940)
看板Ptt-Press
標題[新聞] 一個PTT重度使用者的新聞幕後:八卦板變得愈來愈怪
時間Tue Apr 23 19:31:40 2019
https://www.cw.com.tw/article/article.action?id=5094900
Web Only 文 林佳賢 2019-04-23
身為PTT重度使用者,每天掛在上面好幾小時,不難發現種種奇怪跡象。
但這些觀察,如何有憑有據?以往揪出惡意使用者的方式,就是看IP位址
;但當網軍部隊進化到每次發文都會切換IP位址,我們可以怎麼做?其實
,只要鎖定網軍三大習性,掌握三步驟舉證,還是能用資料分析的技巧讓
PTT網軍現形。
從高中玩PTT到現在,每天都要掛在PTT上好幾個小時,上下左右鍵始終是
鍵盤最容易髒掉的按鍵,被問到五樓上面是幾樓,下意識都會回答「四樓」
,中餐晚餐想吃什麼好吃的,第一個反應就是進Food板搜尋「台北」,每次
PTT當機或維修,手指還是會忘記有這回事,一直去點開手機的PTT應用程式
。這就是台灣最大網路論壇PTT的魅力。
身為一個PTT重度使用者,在PTT出現一些奇怪的變化時,也會比較敏感。
這幾年來,每次到了重要選舉年,八卦板就會變得熱鬧起來。雖然八卦板
具備政治最大板的功能是被大家默認的,但有些奇怪的跡象愈來愈頻繁出
現,像是排版精美、圖文並茂的政治爆卦文愈來愈多,攻擊特定政治陣營
的文章被推爆的速度愈來愈快,特定帳號每天轉貼立場偏頗媒體的新聞報導。
這些跡象讓許多PTT使用者開始懷疑,有心人士操控大量帳號,在PTT帶風
向。但是,懷疑歸懷疑,要從PTT找出所謂的網軍,並不是單純覺得誰可疑
就能指控誰。在過去,揪出PTT惡意操作的方式,是查IP位址找出分身帳號
。不過現在用這個方法,幾乎很難找到網軍,原因是網軍已經學會使用跳
板程式,每次更換帳號發文或推文時,都更換一次代理IP,這樣PTT就會記
錄每個帳號的IP是不同的,儘管使用者可能都是同一個人。
網軍3大行為模式
無法從IP找出網軍,要從哪裡下手,揪出集體行動、帶特定風向的網軍帳號
?要回答這個問題,需要釐清網軍到底是怎麼打仗的。
在《天下雜誌》決定調查台灣網軍生態後,我先整理了自己在PTT上觀察到
或別人提出的網軍三大行為模式:
1.狂發爆卦文:由於爆卦文在八卦板較稀少,容易吸引眼球,網軍在攻擊敵
方候選人的時候很常採用爆卦的形式。
2.多個連續推文或噓文:八卦板文章洗得很快,只要一篇文章沒有被推爆,
一小時內就會被淹沒在一天幾千篇的文章海之中。只有被推爆或噓爆,才能
延長一篇文章的壽命,讓發文幾小時後才登入PTT的人看到這篇文章。因此,
網軍會操控多個帳號,在自家文章上線時大量推文,幫助文章短時間內被推爆。
3.外國跳板狂發新聞:在熱心的工程師寫出查PTT帳號IP來源的外掛程式之後
,不時有人回報在PTT有許多使用外國IP的帳號,一直轉發中時、中天等親藍
媒體的新聞。
針對以上三大行為模式,要怎麼從資料出發,找出八卦板的網軍,以下我把
我的做法一步一步地詳加說明。(完整報導:【獨家分析PTT數據】跟著資料
記者追網軍,挺韓反韓全現形)
揪出狂發爆卦文的網軍
1.找出選舉期間張貼最多政治爆卦文的帳號:找出張貼最多政治爆卦文的帳號
只是第一步,因為發最多篇不代表就是網軍,只是可疑跡象之一,還需要更多
的證據。
2.分析第一步找到的帳號有沒有分身帳號:前面有講過,現在很難用查IP的方
式找到分身帳號,所以需要設計新的方法找分身帳號,當然查IP還是要做,可
以找到比較不小心的網軍帳號。
要怎麼不查IP找分身帳號?靠計算「推文死忠度」。假設A帳號只會在B帳號張
貼的文章出現推文,其他文章一概不出現,這樣代表A對B的推文死忠度是100%。
具體計算公式:A帳號推B帳號文章次數/A帳號總推文次數
我針對第一步找到的帳號,計算所有推過這些帳號發過的文章的帳號的推文死
忠度。為了對照,一般來說隨便一個帳號對其他帳號的平均推文死忠度是7.29%
。在我主觀判斷後,發現推文死忠度超過33.3%的帳號較可疑。
3.檢查帳號與其死忠帳號,是否發過類似的文章:推文死忠度高不代表就是分
身,還要看這些死忠帳號的行為與其死忠對象是否類似。這時候就需要調出這
些帳號發過哪些文章,推文內容有哪些,如果十分類似,就可以認定其為網軍。
揪出連續推文帶風向的網軍
1.先撈出八卦板選舉期間的政治文章及其推文,找出推文次數最多的一百個帳
號,這些就是在八卦板的政治文章最有推文影響力的一百個帳號。
2.推文次數多不代表就是網軍,還需要證明裡面有帳號是會一起行動,連續推
、噓文。這要怎麼證明?靠計算「同時推文率」。假設A帳號和B帳號總是在相
同的文章推文,其他文章都不會出現,這樣代表A對B的同時推文率是100%。
具體計算公式:A帳號和B帳號在同篇文章的推文次數/(A帳號總推文次數+
B帳號總推文次數)
我針對第一步找到的帳號,計算一百個帳號之間的同時推文率。為了對照,一般
來說隨便一個帳號對其他帳號的平均同時推文率是3.66%。接著我計算一百個帳
號之間的同時推文率,這樣就能找到在這些特愛推政治文章的帳號裡,有沒有一
群帳號是特愛同時出現的。
3.檢查同時推文率高的帳號群,都在推哪些文章。如果這些文章具有很高的同
質性,例如總是在攻擊特定陣營候選人,這樣我就會認定該帳號群是網軍。
揪出外國跳板狂發新聞的網軍
1.由於外國跳板狂發新聞的現象從大選開打以前就開始了,而且選後更加嚴重,
因此撈的資料區間從去年3月到今年2月,撈的是標題標記為新聞的政治文章。
2.撈出政治新聞之後,計算哪些帳號發得最多。但和前面兩個做法一樣,找發
文篇數最多的帳號只是起點,要用其他方法找出這些帳號誰有鬼才是關鍵。
3.接著我使用網路上找到的免費查IP的API(應用程式),查這些發最多政治
新聞的帳號使用哪些國家的IP,只要大量使用過外國IP的帳號都打上星號。
4.大量使用外國IP的帳號,發的是哪來的政治新聞?我把外國跳板帳號發的新
聞的新聞來源擷取出來統計,跟非使用外國IP的帳號做對照,發現使用外國IP
的帳號,前五大新聞來源依序是中時、聯合、ETtoday、TVBS和中天,一面倒被
認為是親藍媒體。作為對照,非使用外國IP的帳號前五大新聞來源是蘋果、中
時、聯合、自由、三立,親藍和親綠媒體幾乎是一半一半。由此可證明外國跳
板帳號狂發新聞的確有宣傳特定立場的目的。
三種找網軍的方法,其實都是同一個邏輯:
找出做某件事做最多的帳號→找出這些帳號有沒有其他網軍特徵→檢查具備多個
網軍特徵的帳號發過或推過哪些文章
以第一個做法為例,最後找出來的帳號,就是發過最多政治爆卦文,擁有推文
死忠帳號,發的文章都在攻擊特定陣營,符合至少三個網軍特徵。用至少三個
證據指認網軍,就能更有把握,挑出真的有問題的帳號。(責任編輯:曹凱婷)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.132.220.69
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Ptt-Press/M.1556019102.A.53B.html