作者gamer ()
看板ask-why
标题Re: [请益] 为何不能用全民脑造影来建立高关怀名单?
时间Thu Jul 14 00:35:54 2016
最近看到有篇研究报告内容跟这个标题有一些关联,转贴与大家分享
http://pansci.asia/archives/101157
fMRI 分析软体发现瑕疵,近15年的脑科学研究可能有问题
近几年不论欧美或台湾都提出了脑科学专案研究计画,期许透过非侵
入性的功能性磁振造影(fMRI),来了解人的心理与背後的神经机制
。此种能将抽象心理化作实体大脑活动影像的技术,让我们对身心关
系有了更进一步的理解。
然而近期一篇发表在《美国国家科学院刊》(PNAS)的研究结果,却
令人震惊!研究者发现处理 fMRI 数据的分析软体上有瑕疵,可能让
过去 15 年、累积近四万笔的脑科学研究结果被打上了问号。这对脑
科学界来说可是件大事,因为 fMRI 是目前相关研究常使用的工具,
若分析软体真有缺陷,就表示过往的许多脑科学研究结论,如谈恋爱
时的脑、上瘾的脑……都必须被重新检视了!
fMRI 对脑科学家来说有多重要?
研究计画主持人、来自瑞典林雪坪大学(Linköping University)
的安德斯.埃克隆德(Anders Eklund)博士表示:「虽然脑科学界
常以 fMRI 来研究脑功能,但它的分析方法鲜少经过真实数据所验证
。」
要了解埃克隆德为什麽这样说,以及 fMRI 技术的问题,我们得先了
解 fMRI 怎麽运作。
fMRI 就如同一块大磁铁般,透过变化磁场以非侵入性的方式,来测
定大脑内不同区位的血流氧气变化。在实验的过程中参与者会躺进机
器内,被指派做一些任务(例如记忆、看表情图片等……),而理论
上这时各脑区的活化程度会有所不同,因此当磁场改变扫过你的身体
时,便能够侦测出那些微的血流变化。
这些细微的血氧变化,对於科学家来说就如同指标,它们诉说着某一
脑区正在运作,好比在执行赌博任务时脑岛(insular)就被观察到
有差异——这一脑区被认为是与高阶的认知功能相关,例如语言处理
、同理心(empathy)、恻隐之心(compassion)。
脑科学研究结果看起来新奇厉害,但科学家看到的花花绿绿脑影像图
,其实都不是脑袋真实的样子,精准一点地说,他们看到的是把完整
脑袋分割成上万个体素(或称立体像素,voxel)的图片,并用这些
图片来做进一步的分析与推论。(voxel 是 3D 脑造影图的解析单元
,有点类似 2D 照片的像素概念。)
在许多报导中看到的精彩研究结果,好比说「科学家发现了与性慾有
关的脑区伏隔核(NAcc)」,其实不尽然是大脑在任务中真实的反应
样貌,多是化成 voxel 且经软体分析後的结果。
分析软体哪里出问题了?
为此埃克隆德及其团队想探讨的,就是这套分析软体的可信度有多高
。他们从脑科学研究计画(1000 Functional Connectomes Project
)所建立的资料库中,取得了 499 位健康志愿者在静息状态(
resting-state)下的脑影像图,将这些资料分成 20 组并随机配对
出近 3 百万笔的比较资料。
他们用这些资料测试了三款在 fMRI 资料分析中最常用的套件软体—
—SPM、FSL 和 AFNI ,令人惊讶的是,不论是哪种软体所呈现的分
析结果,假阳性机率(false-positive rate)都高达 70%,也就是
说很容易出现其实某一区域没有活化,却可能被误判成有所反应的状
况!
理论上,团队预期看到的结果假阳性机率只会有 5%(也就是统计上
常用的单尾 p = .05),但百万笔资料的重复比较下,看到却是高出
许多的 70%,表示所得到「某脑区有活化」的结果很可能不是那麽精
确,中间显然出了某些分析流程上的瑕疵。此次的研究结果,无疑是
在对过往的脑科学资料提出质疑。
但脑科学领域并没有就此打住脚步,分析软体的工程团队早已於去年
五月、该研究开始写报告时,就做了分析软体的瑕疵修正。一连串的
结果与考验,再再显示着 1990 年初才逐渐蓬勃的脑科学领域,还有
着许多操作上的挑战与分析方法需要改进。
fMRI 仍太贵,研究样本数难提高
技术上的考验外,另一项对实验者的大阻碍是昂贵的仪器使用费,在
美国光使用一小时的 fMRI 就需要支付 600 美元,台湾虽然便宜一
点,但也是每小时动辄三、四千元起跳。这也造就了一个限制,为了
降低成本,多数研究倾向将参与样本数维持在 30 人左右,仅有少数
得到足够计画资金的研究团队,才有办法大量收样本,重复测验他们
的实验结果。
不仅如此,fMRI 在硬体层面也面临考验。分析软体的运作效率十分
依赖电脑硬体的好坏,若硬体太旧可能光是验证资料就要跑了三天三
夜,还不一定完成的了!
事到如今,那些受质疑的研究该怎麽办才好?
针对这篇研究的结果,有些科学家依然抱持着质疑的态度,认为有过
分夸大了问题的影响。其中包括作者之一的尼可斯(Thomas Nichols
),事後在自己网志中提出了中立的看法,将原先可能受影响的研究
从四万下修至 3500 篇,还强调这三千多篇也不全然就是错,必须考
虑到各实验的测量效应强弱才行!
So, are we saying 3,500 papers are “wrong”? It depends
…….if the effects are really strong, it likely doesn’t
matter if the P-values are biased, and the scientific
inference will remain unchanged.
看了脑科学领域目前的困难後,还是有值得开心的好消息。此领域的
研究已经进行了十多年,资料也累积了数万笔,有越来越多团队将自
家实验的数据开放在网路上,供其他研究者使用与检验,因此省下一
些经费。
每一次的冲击都是一个挑战,反过来说却也是督促这个研究领域成长
的助力。如同去年在心理学界掀起的一阵惊涛骇浪,有研究者试图重
现一百项经典的心理学实验,却仅有三分之一可以被再现。正因这些
研究证据,让我们重新去正视科学研究中的重制与再现(replicate
)问题。
不过,虽然这篇论文引起许多人去正视这些问题,但现实总是残酷—
—在学术界中去重制前人已做过的实验,其实没有多大的吸引力,去
执行一个自己新发想的实验通常才令人兴奋。但当有越来越多这种检
验性的研究被发表後,或许我们就必须要重新考虑并面对「重制检验
」的必较性了!
原始论文:
Anders Eklund, Thomas E. Nichols, and Hans Knutsson,
Cluster failure: Why fMRI inferences for spatial extent
have inflated false-positive rates, PNAS 2016 :
1602413113v1-201602413.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.230.217.181
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/ask-why/M.1468427757.A.683.html
1F:推 Tuhao5566: 被移除惹... 07/15 23:03
2F:→ hermitwhite: 这篇泛科学文章因为严重的误导而被骂坏了。 07/16 19:19
3F:→ gamer: 真有趣,建议大家点进连结看另一篇延伸阅读的文章。 07/18 00:51