作者hay955940 (hay955940)
看板Ptt-Press
标题[新闻] 一个PTT重度使用者的新闻幕後:八卦板变得愈来愈怪
时间Tue Apr 23 19:31:40 2019
https://www.cw.com.tw/article/article.action?id=5094900
Web Only 文 林佳贤 2019-04-23
身为PTT重度使用者,每天挂在上面好几小时,不难发现种种奇怪迹象。
但这些观察,如何有凭有据?以往揪出恶意使用者的方式,就是看IP位址
;但当网军部队进化到每次发文都会切换IP位址,我们可以怎麽做?其实
,只要锁定网军三大习性,掌握三步骤举证,还是能用资料分析的技巧让
PTT网军现形。
从高中玩PTT到现在,每天都要挂在PTT上好几个小时,上下左右键始终是
键盘最容易脏掉的按键,被问到五楼上面是几楼,下意识都会回答「四楼」
,中餐晚餐想吃什麽好吃的,第一个反应就是进Food板搜寻「台北」,每次
PTT当机或维修,手指还是会忘记有这回事,一直去点开手机的PTT应用程式
。这就是台湾最大网路论坛PTT的魅力。
身为一个PTT重度使用者,在PTT出现一些奇怪的变化时,也会比较敏感。
这几年来,每次到了重要选举年,八卦板就会变得热闹起来。虽然八卦板
具备政治最大板的功能是被大家默认的,但有些奇怪的迹象愈来愈频繁出
现,像是排版精美、图文并茂的政治爆卦文愈来愈多,攻击特定政治阵营
的文章被推爆的速度愈来愈快,特定帐号每天转贴立场偏颇媒体的新闻报导。
这些迹象让许多PTT使用者开始怀疑,有心人士操控大量帐号,在PTT带风
向。但是,怀疑归怀疑,要从PTT找出所谓的网军,并不是单纯觉得谁可疑
就能指控谁。在过去,揪出PTT恶意操作的方式,是查IP位址找出分身帐号
。不过现在用这个方法,几乎很难找到网军,原因是网军已经学会使用跳
板程式,每次更换帐号发文或推文时,都更换一次代理IP,这样PTT就会记
录每个帐号的IP是不同的,尽管使用者可能都是同一个人。
网军3大行为模式
无法从IP找出网军,要从哪里下手,揪出集体行动、带特定风向的网军帐号
?要回答这个问题,需要厘清网军到底是怎麽打仗的。
在《天下杂志》决定调查台湾网军生态後,我先整理了自己在PTT上观察到
或别人提出的网军三大行为模式:
1.狂发爆卦文:由於爆卦文在八卦板较稀少,容易吸引眼球,网军在攻击敌
方候选人的时候很常采用爆卦的形式。
2.多个连续推文或嘘文:八卦板文章洗得很快,只要一篇文章没有被推爆,
一小时内就会被淹没在一天几千篇的文章海之中。只有被推爆或嘘爆,才能
延长一篇文章的寿命,让发文几小时後才登入PTT的人看到这篇文章。因此,
网军会操控多个帐号,在自家文章上线时大量推文,帮助文章短时间内被推爆。
3.外国跳板狂发新闻:在热心的工程师写出查PTT帐号IP来源的外挂程式之後
,不时有人回报在PTT有许多使用外国IP的帐号,一直转发中时、中天等亲蓝
媒体的新闻。
针对以上三大行为模式,要怎麽从资料出发,找出八卦板的网军,以下我把
我的做法一步一步地详加说明。(完整报导:【独家分析PTT数据】跟着资料
记者追网军,挺韩反韩全现形)
揪出狂发爆卦文的网军
1.找出选举期间张贴最多政治爆卦文的帐号:找出张贴最多政治爆卦文的帐号
只是第一步,因为发最多篇不代表就是网军,只是可疑迹象之一,还需要更多
的证据。
2.分析第一步找到的帐号有没有分身帐号:前面有讲过,现在很难用查IP的方
式找到分身帐号,所以需要设计新的方法找分身帐号,当然查IP还是要做,可
以找到比较不小心的网军帐号。
要怎麽不查IP找分身帐号?靠计算「推文死忠度」。假设A帐号只会在B帐号张
贴的文章出现推文,其他文章一概不出现,这样代表A对B的推文死忠度是100%。
具体计算公式:A帐号推B帐号文章次数/A帐号总推文次数
我针对第一步找到的帐号,计算所有推过这些帐号发过的文章的帐号的推文死
忠度。为了对照,一般来说随便一个帐号对其他帐号的平均推文死忠度是7.29%
。在我主观判断後,发现推文死忠度超过33.3%的帐号较可疑。
3.检查帐号与其死忠帐号,是否发过类似的文章:推文死忠度高不代表就是分
身,还要看这些死忠帐号的行为与其死忠对象是否类似。这时候就需要调出这
些帐号发过哪些文章,推文内容有哪些,如果十分类似,就可以认定其为网军。
揪出连续推文带风向的网军
1.先捞出八卦板选举期间的政治文章及其推文,找出推文次数最多的一百个帐
号,这些就是在八卦板的政治文章最有推文影响力的一百个帐号。
2.推文次数多不代表就是网军,还需要证明里面有帐号是会一起行动,连续推
、嘘文。这要怎麽证明?靠计算「同时推文率」。假设A帐号和B帐号总是在相
同的文章推文,其他文章都不会出现,这样代表A对B的同时推文率是100%。
具体计算公式:A帐号和B帐号在同篇文章的推文次数/(A帐号总推文次数+
B帐号总推文次数)
我针对第一步找到的帐号,计算一百个帐号之间的同时推文率。为了对照,一般
来说随便一个帐号对其他帐号的平均同时推文率是3.66%。接着我计算一百个帐
号之间的同时推文率,这样就能找到在这些特爱推政治文章的帐号里,有没有一
群帐号是特爱同时出现的。
3.检查同时推文率高的帐号群,都在推哪些文章。如果这些文章具有很高的同
质性,例如总是在攻击特定阵营候选人,这样我就会认定该帐号群是网军。
揪出外国跳板狂发新闻的网军
1.由於外国跳板狂发新闻的现象从大选开打以前就开始了,而且选後更加严重,
因此捞的资料区间从去年3月到今年2月,捞的是标题标记为新闻的政治文章。
2.捞出政治新闻之後,计算哪些帐号发得最多。但和前面两个做法一样,找发
文篇数最多的帐号只是起点,要用其他方法找出这些帐号谁有鬼才是关键。
3.接着我使用网路上找到的免费查IP的API(应用程式),查这些发最多政治
新闻的帐号使用哪些国家的IP,只要大量使用过外国IP的帐号都打上星号。
4.大量使用外国IP的帐号,发的是哪来的政治新闻?我把外国跳板帐号发的新
闻的新闻来源撷取出来统计,跟非使用外国IP的帐号做对照,发现使用外国IP
的帐号,前五大新闻来源依序是中时、联合、ETtoday、TVBS和中天,一面倒被
认为是亲蓝媒体。作为对照,非使用外国IP的帐号前五大新闻来源是苹果、中
时、联合、自由、三立,亲蓝和亲绿媒体几乎是一半一半。由此可证明外国跳
板帐号狂发新闻的确有宣传特定立场的目的。
三种找网军的方法,其实都是同一个逻辑:
找出做某件事做最多的帐号→找出这些帐号有没有其他网军特徵→检查具备多个
网军特徵的帐号发过或推过哪些文章
以第一个做法为例,最後找出来的帐号,就是发过最多政治爆卦文,拥有推文
死忠帐号,发的文章都在攻击特定阵营,符合至少三个网军特徵。用至少三个
证据指认网军,就能更有把握,挑出真的有问题的帐号。(责任编辑:曹凯婷)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.132.220.69
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Ptt-Press/M.1556019102.A.53B.html