作者Clementtang (剑客唐唐‧光明)
看板Cloud
标题Re: [新闻] 忧医疗云泄个资 民团要求严管
时间Sat Feb 25 22:33:10 2012
其实不大想在某些版面回,不过这边大家比较专业理性所以...
※ 引述《wylee ()》之铭言:
: http://goo.gl/h4dYz(中央社记者陈清芳台北24日电)
: 行政院国科会发展「医疗云端运算系统」,
: 遭质疑侵害隐私权。民间团体今天在卫生署全民健保监理会上要求从严把关
: 及取得民众授权同意,否则不排除对政府提起团体诉讼。
: 健保监理委员会上午举行例会,有劳工团体代表指出,劳工团体保险的费率一致,
: 某公司员工团保的保费却无端被提高,怀疑员工医疗资料被保险公司掌握,
: 担心未来「医疗云」一旦发生个资外泄,广大民众受害。
: 民间监督健保联盟发言人滕西华指出,政府有意将全台2300万人完整医疗资讯的医疗云,
: 发展出30种不同的商业营运模式,政府也许认为只要将资料库与个人姓名身分「去联结」
: ,就是「白云」,可是在民间社团眼中却是「乌云」。
: 滕西华认为,以往有些学者的原住民基因研究虽未指明,但特定族群却呼之欲出,
: 衍生族群歧视等弊端,殷监不远。健保等医疗资料库一旦与学术单位乃至保险公司、
: 国际药厂等单位连上线,就算没有指名道姓,民众个人身分还是摊在阳光下。
: 民间健保监督联盟、消费者文教基金会和劳工团体等健保监理委员会代表,在会中正式提
: 案,要求应对健保医疗资料库设置国家级的伦理审查委员会,规定每一笔健保资料被使用
: 前,都必须取得当事人的书面同意。
: 滕西华和消基会代表主张,卫生署和健保局应比照国外做法,依个人资料保护法等相关法
: 令,明文规范健保资料库的可应用范围,一旦学术研究有成而取得专利、上市後,
: 也该有回馈全民的机制。
NHIRD 网站
http://nhird.nhri.org.tw
首先,申请资料者无论学术或非学术,都须提报研究计画书供审查,
且申请的资料都并非完整资料库。
因为我只接触过学术申请的资料库,所以以下以该资料库说明之,
资料来源是我以前某个 proposal 的原文。
全民健康保险研究资料库
本研究之资料来源为国家卫生研究院提供之全民健康保险研究资料库2000年承保抽样归人
档(LHID2000),为自2000年承保资料档中随机抽选100万人资料档,撷取各年度所有就医
资料後以每五万人为一年度之就医资料为一单位。
其抽样母群体以中央健康保险局所提供的2000年承保资料档保险对象,由全民健保开办至
1999年12月底止共5,806万笔保险对象累积性之历史资料,经去除重复的身分证字号後约
有2,372万笔资料,再由此母群体乱数抽选100万人资料档并利用保险对象之身分证字号以
每五万人为一组共20组,与健保资料库之历年就医资料进行串连,所串接之资料包含:门
诊处方及治疗明细档(CD)、门诊处方医令明细档(OO)、住院医疗费用清单明细档(DD)、住
院医疗费用医令明细档(DO)、特约药局处方及调剂明细档(GD)、特约药局处方调剂医令明
细档(GO)。本研究之资料为此20组所发行的四组之第二与第四组资料档,分别包含1996至
2004年之资料档,其中1996年仅提供CD、DD、GD等档。
上文的部分都还是原始抽样档的产生方式,亦即身分证字号等个资栏位,
在交付申请单位後是「已经加密过的」。
简单来说,就是把截至 1999 年底的两千三百多万笔无重复的「投保人」资料,
乱数抽出一百万人後以每五万人为一组,跟接下来各年度的其他资料档串,
例如门诊处方就是看医生开给他什麽药,住院医疗费用可以看他接受那些治疗等等。
至於资料档长什麽样呢?
买到的光碟打开里面就是一大堆的 dat 档,看你要怎麽转,
总之转好看是丢进资料库或变成 txt 档後,就要开始切栏位。
因为原始资料长得像这样 (随便举例):
23134781217837827429431032240325803851931843050349503
要看译码簿才知道第几到第几栏位是年龄,或医令代码。
切好资料如果以後还打算做後续研究,可能会设计一下资料库,
把这些资料丢进 SQL 里面,再弄个介面出来下查询。
(如果这边有医资领域的就能体会,设计这个关连到查询效率以及逻辑)
以上工作都完成,才是研究的开始。
好,所以滕西华这次提的问题,是该注意但是老实说,
他们关注的点根本不是问题点。
因为如果要找到该笔资料的当事人同意,这动作反而才麻烦,
本来国卫院抽样完大家拿到的资料都不知道是谁就算了,
你现在要国卫院抽这一百万人出来的时候要经过他们同意,
那光是处理这段就没完没了,不管是要给予利益还是询问他是否同意,
必定要耗费大量的人力物力财力,然後最後的结果其实是跟本来一样的。
实务上,研究者大多希望能够按照自己想要的资料内容去抽样,
但先撇开特定主题档不谈,当我们把全部资料库整理好还原回去之後,
往往下一个查询等半天跑完,一看发现某病症才两三千笔资料,
而且最麻烦的在於这两三千笔资料是资料库内说她有该病症,
或者我们依据他们所接受到的处方药物来推断该病患有某病症,
可是有时候看病或申报,医师或医院会合并诊断代码,
这会导致资料实证上的困难,所以可信度其实比实际临床抽样低。
更不用说如果要交叉看两种病症或某病跟某几种药物的条件查询,
跑出来能够用得结果可能寥寥数百人。
再说个玩笑话,某次我们查子宫颈癌,跑完还发现有几十个男性有得,
到底他们是资料登记错误,还是本来是女性後来变性,根本无从得知。
总之,结论就是 NHIRD 在学术界拿来写写论文还可以,
早几年唬烂国际上的学者,他们还会惊为天人我们怎麽有办法,
能够短时间内量产那麽多数据庞大的论文。
但实际上最近 defense 的时候要佐证自己抽样方法,已经常常会被挑毛病。
(听过不知道几个案例,英文或统计不够好的解释不出来被期刊编辑打枪了... )
药厂或某些利益团体要是真能从这些资料获得什麽有价值的资料,
我是抱持着存疑态度,毕竟直接去医院找医师合作拿临床资料,
搞不好还比较方便一些。
未来如果要上云端,前面要处理的问题还有很多,
光是电子病历的部份现在卫生署就一个头两个大,
看看那精美的烂摊子「电子病历联合办公室」就知道...。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.34.131.165
※ 编辑: Clementtang 来自: 114.34.131.165 (02/25 22:38)
1F:→ SmallBeeWayn:有时候我会直接称这些人为"被迫害妄想症" 02/25 22:48
2F:推 minikai:上了一课了 02/26 02:42
3F:推 leoace:推"精美的烂摊子"再补上"休克的医学影像交换中心" 02/27 12:32
4F:→ Clementtang:PACS系统搞得跟联合国一样似乎也是台湾医资界趣谈 02/27 13:36