作者ecoutez ( )
看板BioMedInfo
标题Re: [问题] 基因marker筛选软体-Haploview criteri …
时间Wed Jul 7 09:21:46 2010
尝试回答一下
如有错误还请各位先进指正
※ 引述《holybeetle (圣甲虫)》之铭言:
: ※ [本文转录自 Biology 看板 #1CCgPZ1Y ]
: 作者: holybeetle (圣甲虫) 看板: Biology
: 标题: [问题] 基因marker筛选软体-Haploview criteria 设定
: 时间: Tue Jul 6 11:43:21 2010
: 【问题】:
: 实验室所使用的初步gene marke筛选软体-Haploview
: 1.check marker中
: 将minimum minor allele freq.改成0.1(排除< 0.1的基因点)
: 这个设定为0.1, 0.5 或0.8..的差别在於?
差别在於若设为0.1,则所选出的SNP的MAF都会高於0.1.
由於SNP(通常)只有两个allele,
MAF的范围为0到0.5,major allele frequency 则为1-MAF.
若是一个SNP的MAF是0.01,
则表示平均来说,100个人中只会有1个人带有minor allele.
若是一个SNP的MAF是0.5,
则表示平均来说,100个人中会有50个人带有minor allele.
在样本数不大的情况之下,选择MAF太小的SNP可能会导致全部的样本都带有major allele.
没有variation的话,这个SNP就算是白做了.
因此一般会设定一个限制,让MAF不要太小.
MAF>0.05的SNP,一般称为common variation.
: 2.Tagger的视窗下
: 设定aggressive tagging
: (pairwise tagging only, use 2-marker haplotypes, use 2- and 3-marker
: haplotypes)
: 各有什麽意义?
tagging是用一个SNP的allele去tag另一个SNP的allele.
举例来说,
SNP1 的A allele 和SNP2 的T allele必定同时出现的话,
那我们只需要genotype SNP1就可以获得SNP1 和SNP2的所有资讯.
在这个例子中, SNP1 和SNP2 就是pairwise tagging.
再举一个例子,
若SNP3-T allele 和 SNP4-A allele 所形成的haplotype,
必定和SNP5的G allele同时出现,
则我们可以用SNP3加SNP4来tag SNP5,
这可以称为2-marker haplotype tagging.
multiple marker tagging (相较pairwise tagging)的问题是:
1. 要多genotype 一些marker
2. 带有特定haplotype的样本可能不多,tagging的效果可能不好
: 3.r square threshold
: 设定在0.8有什麽统计上的意义?
表示所选到的tagging SNP和被tag的SNP之间的r square最小是0.8.
简单的来说,
如果tagging SNP和tagged SNP之间的r square越小,
就需要愈大的样本数来达到相同的统计检定力.
举例来说,
在直接genotype tagged SNP的情况下,如果需要100个样本才能达到想要的统计检定力.
如果tagging SNP 和tagged SNP之间的 r square 是0.8,
在genotype tagging SNP的情况下,我们需要125个样本才能达到相同的统计检定力.
当然r square 愈高,可以选择的tagging SNP 愈少,但是tagging的效果愈好.
0.8是一个常用的threshold.
: 4.LOD threshold for multi-marker test
: 软体本身设定为3.0是依据什麽原理?
因为LOD score > 3.0 会对应到统计上常用的significance level...
: 【问题起因】:
: 指导教授希望我去了解这些设定有何依据, 原理为何?
: 【个人看法】:
: 自己有先看过Help的部分, 但是软体说明大多是有看没有懂
: 网路上有一些关於r square的部分, 但是不知道有什麽意义
: 如下:
: The lowest r2 set at 0.1.
: The square colors in the LD triangle vary between blue (cold for LD, r2 =
: 0.1) to red (hot for LD, r2 = 1.0) with white squares indicating no LD (r2
: <0.1).
: However, r2 of 0.1 is not very useful, and many of the sites in this gene
: are not in LD (more white and blue squares than red or other colors).
: 因为自己是半路出家的, 没有任何基因或统计上的背景...
: 也很不巧的...没有学长姐可以请教
: 因此希望好心人是可以提供解答或方向
: 非常感谢!!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 24.62.24.169
1F:推 holybeetle:谢谢您提供的解答~~非常清楚~~!!感谢! 07/08 13:51