作者premire (熱騰騰的泡麵)
看板Biotech
標題[求救] 有關public mRNA data數值表示和FC計算
時間Tue Feb 18 00:06:21 2020
各位好
因最近利用public mRNA microarray 和 sequencing進行 gene expression分析
如fold change
下載 後打開檔案發現均為patient sample, 並無normal group
基因表現為: 樣本一 gene 0.5 樣本二 -0.2 之類 (有300多個樣本)
查了一下應該由log2轉換
想請問如果要計算gene 在tumor 和 normal的 fold change
是不是無法透過log2 轉換後的數值計算出來呢?
還是必須要有normal data才可計算
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.120.133 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Biotech/M.1581955583.A.ED8.html
1F:→ xxtomnyxx: 你這個是 microarray 還是 seq 的資料?如果是 micro, 02/18 02:53
2F:→ xxtomnyxx: 那就已經 normalized 過了,如果是 seq,我還真沒看過 02/18 02:53
3F:→ xxtomnyxx: 基因表現量會出現負值的 seq data 02/18 02:54
4F:→ xxtomnyxx: seq 的 data 基因表現量會用 RPKM 或 FPKM,這只會是 02/18 02:56
5F:→ xxtomnyxx: 正值,所以我假設你那個是 microarray,基於 micro 的 02/18 02:56
6F:→ xxtomnyxx: 原理,表現量一定是 sample 和另外一個基準樣品比較得 02/18 02:57
7F:→ xxtomnyxx: 到的結果,可能要找找 database 資料提供者的論文看他 02/18 02:58
8F:→ xxtomnyxx: 當時是拿什麼樣本當基準 02/18 02:58
9F:推 egoweaver: log(patient) - log(normal) = log(patient/normal) 02/18 03:01
10F:→ egoweaver: 不過要注意 normalize 的方式跟 transform 的方式必須 02/18 03:01
11F:→ egoweaver: 一致。直接 log tranform expression value 的狀況要 02/18 03:02
12F:→ egoweaver: 確認底數是否相同。 02/18 03:02
13F:→ egoweaver: 可以拿同一個 batch/study 的 data 就盡量拿同一個,因 02/18 03:02
14F:→ egoweaver: 為 batch effect 很難校正。 02/18 03:03
15F:→ egoweaver: 如果是 seq 的話注意是 log FC 還是 logTPM/RPKM/FPKM 02/18 03:04
16F:→ premire: 謝謝兩位, 目前我查到作者對於data的描述為:Data were 02/18 20:16
17F:→ premire: acquired using the Agilent G2565BA Microarray Scanner 02/18 20:16
18F:→ premire: Probe intensities were normalized using GeneSpring GX 02/18 20:17
19F:→ premire: 應該是將tumor sample的mRNA測量值以probe測定, 再和 02/18 20:18
20F:→ premire: reference gene相除得到ratio再取log2值, 負值代表下調, 02/18 20:19
21F:→ premire: 正值代表上調。以上是我的理解不知觀念正不正確。 02/18 20:19
22F:→ premire: 但因為data並無normal brain組(無control),故即使知道 02/18 20:20
23F:→ premire: A gene上調, 但沒有control可以計算fold change,這樣講對 02/18 20:21
24F:→ premire: 嗎? 02/18 20:21
25F:推 lelojack: 可以提供GSE的連結嗎? 我以前有那過這樣的資料分析。 02/21 08:59
26F:→ lelojack: 當時會有區分adjencent and tumor樣本。不過極少,大部 02/21 08:59
27F:→ lelojack: 分可行的是在來源網站中提供生存分析或Grade樣本 02/21 08:59
28F:→ lelojack: 你可以這樣理解,臨床樣本原則上不會有正常人組織,因 02/21 09:00
29F:→ lelojack: 為沒有取樣理由 02/21 09:00