作者gsuper (Logit(odds))
看板R_Language
标题Fw: [问题] distance matrix 能否作回归?
时间Fri Dec 6 21:11:11 2013
假设有一 distance matrix , 内有 3 samples 如下
A B C
----------------------
A 0 0.75 0.36
B NA 0 0.66
C NA NA 0
----------------------
再假设 ABC 三个分别代表生物栖息地
已知采样时 , A = 36度C , B = 32度C , C = 18度C
可否转成以下格式跑回归?
distance 温度差
--------------------------
AB 0.75 abs(36-32)=4
AC 0.36 abs(36-18)=18
BC 0.66 abs(32-18)=14
--------------------------
纯粹是突发奇想...
我还没想到要怎麽解释这样的计算
有种从 "速度" 进入 "加速度" 的感觉
先请问看看有没有显而易见的不合理之处
--
我用名为真心的卡牌说服你
这是我最後一张牌
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.32.215.136
※ 编辑: gsuper 来自: 114.32.215.136 (12/06 20:41)
※ 编辑: gsuper 来自: 114.32.215.136 (12/06 20:41)
※ 编辑: gsuper 来自: 114.32.215.136 (12/06 20:42)
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: gsuper (114.32.215.136), 时间: 12/06/2013 21:11:11
※ 编辑: gsuper 来自: 114.32.215.136 (12/06 21:11)
1F:→ clickhere:可能要有个不独立的cov matrix. 12/06 22:30
2F:→ andrew43:你可以查查 dbRDA 之类的多变量方法 12/07 07:31
3F:→ andrew43:可以视为基於特定distance的多变量应变数与自变数的回归 12/07 07:33
4F:→ andrew43:在R中我是靠package vegan全部做完. 参考看看. 12/07 07:36
5F:→ andrew43:方便的话说明一下matrix是怎麽来的, 可能可以更清楚. 12/07 07:37
我也是在用 vegan ~~
你说的是 MDS 那些 function 吧
-----------------------------------------------------------------
每片样本 , 是一个栖地微生物的菌相组成 , 内部含有约 200~1000 种细菌
proportional data 总和为 1 (可想像每片样本是一圆饼图)
distance matrix 方面 ,
因为欧氏距离等方法不太合理 , 采用演化距离 (UniFrac distance)
首先先以各个细菌的 16s rRNA 序列资料库作为依据 (约 10000 种序列)
node 为细菌 , edge 为 16s rRNA sequence pairwise alignment 的 score
依照上述资料建了一棵演化树
依赖这棵演化树 , 一次 input 两片样本
计算 weighted UniFrac distance (tree-based & abundance-based)
概念上是
sum of occuped edge length and adjusted by abundance of bacteria
-----------------------------------------------------------------
我自己的感觉
是好像想出了一种新的分析
但还没办法掌握它
※ 编辑: gsuper 来自: 114.32.215.136 (12/07 17:20)
6F:推 Wush978:最近CS有个很红的东西叫做metric learning 12/07 17:54
7F:→ Wush978:不知道和你的问题有没有关系 12/07 17:54