作者zkow (逍遥山水忆秋年)
看板AfterPhD
标题[新闻] 学术诈骗/论文期刊「一条龙造假服务」
时间Sun Mar 17 13:48:57 2024
学术诈骗/论文期刊「一条龙造假服务」 学者指Google学术搜寻恐有漏洞
2024-03-12 07:30
联合报 / 记者冯靖惠
当学术界以「发表数」和「被引用数」作为评价指标,却衍生越来越多「恶性操弄」,制
造假论文更是破坏科学求真的初衷。纽约大学教授用ChatGPT制造多篇假文章,并让各文
章之间互相引用,藉此发现Google学术搜寻(Google Scholar)上的引用数是可以作弊的
,甚至可以用买的,堪称论文工厂、期刊「一条龙服务」。
台大医学院教授分析,制造假论文,不外乎为了升等、奖金或学术奖等世俗利益,客观量
表如论文的影响指数(Impact factor)、引用数都是参考就好;台大社会科学院教授则
表示,培养对学术成果的品味、监别能力更为重要,看到引用数明显与其学术质量不搭配
,就要警觉。
引用数牵动教职 Google Scholar成查询工具
由於大学教职的申请和升等除了会看发表数,还会看引用数,最常用来查询论文引用数的
工具之一是 Google Scholar。政治学者王宏恩日前在脸书提到,四名纽约大学资工领域
的学者,2月发表在「开放预印论文网站」(arXiv)的文章,透过多种实验来证明
Google Scholar上的引用数是可以作弊的。
Google Scholar是提供免费搜寻学术文章的网路搜寻引擎,由电脑专家Anurag Acharya开
发。2004年11月,Google第一次发布了Google学术搜寻试用版。该项索引包括了世界上绝
大部分出版的学术期刊、书籍、会议纪要、专利报告、技术及实验报告等更多学术成果。
纽约大学学者 发现引用数可直接购买
四名纽约大学资工领域学者,爬梳了Google Scholar上面超过1600万名科学家的档案资料
,并与其他指标比较发现。学者的Google Scholar引用数跟文献资料库「Scopus」的引用
数,平均大概会差50%,但有些学者会差96%。尤其是那些发表10篇以上论文和有超过200
个引用的学者,其中有逾千人的论文引用数在短短一年内增长了十倍。
他们接着用ChatGPT假造一个作者,并写了20篇论文,发表在Arxiv等三个不同的「开放预
印论文网站」(preprint)上,并让这20篇文章相互引用。不久後Google Scholar的搜寻
结果就显示这名假作者累积了引用数。之後在40天内有5篇论文发表,每篇引用了假作者
的10篇论文。夸张的是,假作者的论文和化学无关,但这5篇论文中,有4篇被引用在一本
化学期刊内。
这四名纽约大学资工领域学者也发现,在网路上可以直接找到增加引用数的商品,也就是
可以直接购买引用数,让引用数暴增。
引用数操弄 可以有两种形态
一名台大社会科学院资深教授进一步厘清,这篇文章展示出的引用数操弄有两种形态。
第一个型态是,用 ChatGPT 制造多篇虚假的文章,并让文章之间互相引用并上传到几个
开放预印论文网站 之後,过不久Google Scholars就会找到这几篇文章,并把他们相互引
用的次数列入作者的Google Scholars引用数中。
第二个型态是,向一些不良机构购买引用数。这些机构用各种手段,包括出版期刊的专刊
(Sepcial Issue),在其中放入莫名其妙的文章,这些文章将购买人的论文大量列在参
考文献中,以此冲高购买人的文章引用数。
这名资深教授说,这篇文章显示GS没有严格审查筛选机制,容易被钻漏洞、被操弄。GS不
会检查文章是否是真的论文。Web of Science 或 Scopus 的引用数比较不会有这种问题
,他们收录的期刊有限定范围,都是比较可靠的期刊,也不包含「开放预印论文网站」里
的文章。
这名教授还提到,GS的引用数仍被学界广泛使用,一方面是免费但同时缺少审查机制,另
一方面它包含的期刊类型广,只要它能搜到都会包括在内,「如果不是有心人利用漏洞恶
搞 GS,其实它的引用数有一定的价值」。只能说学术成就的评量不能依赖单一标准。培
养对学术成果的品味、监别能力很重要,看到引用数明显与其学术质量不搭配,就要警觉
。只是这种主观的评判需要以诚信爲前提,如果沦爲党同伐异的自由心证,伤害力更大。
台大医学院教授杨伟勋表示, 为了引用次数造假,如果造假的东西没有什麽价值,根本
也没有人会引用,所以引用多少不是重点。制造假论文,不是为了升等,就是为了奖金,
不然就是学术奖,都是为了世俗的利益,破坏了原本科学求真的初衷。
杨伟勋说,当人类没有办法真正了解科学的价值时,就用一些客观的量表来判断,论文的
影响指数,引用的次数都是,所以才会有这些问题。
全球前2%顶尖科学家 也是种世俗量表
最近每年都会被炒的「全球前2%顶尖科学家」也是一种世俗的量表。杨伟勋举例,其中有
一项指标是「一篇论文的单独一位作者」,被加权很高,但是,现在有什麽研究是可以自
己一个人做?所以「单独作者」排到很前面,就是一个很奇怪的指标。
杨伟勋认为,所有的量表其实参考就可以了,引用次数高的文章,如果能够长久甚至进入
教科书,或实际改变医疗或人类的生活,那才是真正重要的研究。
「这些指数的确对於各种学术奖项有重要的影响」,一名台大政治系教授则表示,由於各
系之间的差异,太强调这些引用指标,也会对於不同的系所之间造成不公平现象。据他所
知,台大政治系并未将此作为升等的指标,但是社科院的一些奖励项目,则必须填写这些
指标来作为评判的标准。如果这些指标具有可操控性,熟悉这一套游戏规则的人当然就会
较占优势。
https://vip.udn.com/vip/story/122866/7823167?from=vipudn_subcate_time
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.71.169 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AfterPhD/M.1710654539.A.C96.html