作者gsuper (Logit(odds))
看板R_Language
標題Fw: [問題] distance matrix 能否作回歸?
時間Fri Dec 6 21:11:11 2013
假設有一 distance matrix , 內有 3 samples 如下
A B C
----------------------
A 0 0.75 0.36
B NA 0 0.66
C NA NA 0
----------------------
再假設 ABC 三個分別代表生物棲息地
已知採樣時 , A = 36度C , B = 32度C , C = 18度C
可否轉成以下格式跑回歸?
distance 溫度差
--------------------------
AB 0.75 abs(36-32)=4
AC 0.36 abs(36-18)=18
BC 0.66 abs(32-18)=14
--------------------------
純粹是突發奇想...
我還沒想到要怎麼解釋這樣的計算
有種從 "速度" 進入 "加速度" 的感覺
先請問看看有沒有顯而易見的不合理之處
--
我用名為真心的卡牌說服你
這是我最後一張牌
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.32.215.136
※ 編輯: gsuper 來自: 114.32.215.136 (12/06 20:41)
※ 編輯: gsuper 來自: 114.32.215.136 (12/06 20:41)
※ 編輯: gsuper 來自: 114.32.215.136 (12/06 20:42)
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: gsuper (114.32.215.136), 時間: 12/06/2013 21:11:11
※ 編輯: gsuper 來自: 114.32.215.136 (12/06 21:11)
1F:→ clickhere:可能要有個不獨立的cov matrix. 12/06 22:30
2F:→ andrew43:你可以查查 dbRDA 之類的多變量方法 12/07 07:31
3F:→ andrew43:可以視為基於特定distance的多變量應變數與自變數的迴歸 12/07 07:33
4F:→ andrew43:在R中我是靠package vegan全部做完. 參考看看. 12/07 07:36
5F:→ andrew43:方便的話說明一下matrix是怎麼來的, 可能可以更清楚. 12/07 07:37
我也是在用 vegan ~~
你說的是 MDS 那些 function 吧
-----------------------------------------------------------------
每片樣本 , 是一個棲地微生物的菌相組成 , 內部含有約 200~1000 種細菌
proportional data 總和為 1 (可想像每片樣本是一圓餅圖)
distance matrix 方面 ,
因為歐氏距離等方法不太合理 , 採用演化距離 (UniFrac distance)
首先先以各個細菌的 16s rRNA 序列資料庫作為依據 (約 10000 種序列)
node 為細菌 , edge 為 16s rRNA sequence pairwise alignment 的 score
依照上述資料建了一棵演化樹
依賴這棵演化樹 , 一次 input 兩片樣本
計算 weighted UniFrac distance (tree-based & abundance-based)
概念上是
sum of occuped edge length and adjusted by abundance of bacteria
-----------------------------------------------------------------
我自己的感覺
是好像想出了一種新的分析
但還沒辦法掌握它
※ 編輯: gsuper 來自: 114.32.215.136 (12/07 17:20)
6F:推 Wush978:最近CS有個很紅的東西叫做metric learning 12/07 17:54
7F:→ Wush978:不知道和你的問題有沒有關係 12/07 17:54