作者premire (热腾腾的泡面)
看板Biotech
标题[求救] 有关public mRNA data数值表示和FC计算
时间Tue Feb 18 00:06:21 2020
各位好
因最近利用public mRNA microarray 和 sequencing进行 gene expression分析
如fold change
下载 後打开档案发现均为patient sample, 并无normal group
基因表现为: 样本一 gene 0.5 样本二 -0.2 之类 (有300多个样本)
查了一下应该由log2转换
想请问如果要计算gene 在tumor 和 normal的 fold change
是不是无法透过log2 转换後的数值计算出来呢?
还是必须要有normal data才可计算
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.230.120.133 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Biotech/M.1581955583.A.ED8.html
1F:→ xxtomnyxx: 你这个是 microarray 还是 seq 的资料?如果是 micro, 02/18 02:53
2F:→ xxtomnyxx: 那就已经 normalized 过了,如果是 seq,我还真没看过 02/18 02:53
3F:→ xxtomnyxx: 基因表现量会出现负值的 seq data 02/18 02:54
4F:→ xxtomnyxx: seq 的 data 基因表现量会用 RPKM 或 FPKM,这只会是 02/18 02:56
5F:→ xxtomnyxx: 正值,所以我假设你那个是 microarray,基於 micro 的 02/18 02:56
6F:→ xxtomnyxx: 原理,表现量一定是 sample 和另外一个基准样品比较得 02/18 02:57
7F:→ xxtomnyxx: 到的结果,可能要找找 database 资料提供者的论文看他 02/18 02:58
8F:→ xxtomnyxx: 当时是拿什麽样本当基准 02/18 02:58
9F:推 egoweaver: log(patient) - log(normal) = log(patient/normal) 02/18 03:01
10F:→ egoweaver: 不过要注意 normalize 的方式跟 transform 的方式必须 02/18 03:01
11F:→ egoweaver: 一致。直接 log tranform expression value 的状况要 02/18 03:02
12F:→ egoweaver: 确认底数是否相同。 02/18 03:02
13F:→ egoweaver: 可以拿同一个 batch/study 的 data 就尽量拿同一个,因 02/18 03:02
14F:→ egoweaver: 为 batch effect 很难校正。 02/18 03:03
15F:→ egoweaver: 如果是 seq 的话注意是 log FC 还是 logTPM/RPKM/FPKM 02/18 03:04
16F:→ premire: 谢谢两位, 目前我查到作者对於data的描述为:Data were 02/18 20:16
17F:→ premire: acquired using the Agilent G2565BA Microarray Scanner 02/18 20:16
18F:→ premire: Probe intensities were normalized using GeneSpring GX 02/18 20:17
19F:→ premire: 应该是将tumor sample的mRNA测量值以probe测定, 再和 02/18 20:18
20F:→ premire: reference gene相除得到ratio再取log2值, 负值代表下调, 02/18 20:19
21F:→ premire: 正值代表上调。以上是我的理解不知观念正不正确。 02/18 20:19
22F:→ premire: 但因为data并无normal brain组(无control),故即使知道 02/18 20:20
23F:→ premire: A gene上调, 但没有control可以计算fold change,这样讲对 02/18 20:21
24F:→ premire: 吗? 02/18 20:21
25F:推 lelojack: 可以提供GSE的连结吗? 我以前有那过这样的资料分析。 02/21 08:59
26F:→ lelojack: 当时会有区分adjencent and tumor样本。不过极少,大部 02/21 08:59
27F:→ lelojack: 分可行的是在来源网站中提供生存分析或Grade样本 02/21 08:59
28F:→ lelojack: 你可以这样理解,临床样本原则上不会有正常人组织,因 02/21 09:00
29F:→ lelojack: 为没有取样理由 02/21 09:00