QTL定位中常见的12个问题 联系客服

发布时间 : 星期日 文章QTL定位中常见的12个问题更新完毕开始阅读6c801294a300a6c30d229f75

LOD > LOD0, i.e., accept HALOD < LOD0, i.e., accept H0False positives, Type I errorsTrue positives, no errorsFalse negatives, Type II errorsTrue negatives, no errorsPower = 1-P{Type II error}H0: there is no QTL at HA: there is one a genomic position on QTL at the the trait in interestgenomic position

图1 QTL定位中假设检验的两类错误。阴影部分表示检验统计量LOD值的分布,LOD0表示临界值 Fig. 1 Two types of error in hypothesis test in QTL mapping. The shadow area represents the distribution of the

test statistic LOD score, and LOD0 is the threshold value

表1 3种自由度下不同LOD值对应的犯第一类错误概率(?)和不同?下对应的LOD临界值 Table 1 The corresponding probabilities of type I error to LOD and the corresponding LOD threshold to the

significance probabilities under three degrees of freedom

LOD

LRT

df = 1

1.00 2.00 3.00 4.00 5.00

4.61 9.21 13.82 18.42 23.03

0.031786 0.002407 0.000201 0.000018 0.000002

?

df = 2 0.099759 0.010002 0.000998 0.000100 0.000010

df = 3 0.202686 0.026625 0.003161 0.000360 0.000040

?

LOD df = 1

df = 2 1.00 1.30 2.00 3.00 4.00

df = 3 1.36 1.70 2.46 3.53 4.58

0.1 0.05 0.01 0.001 0.0001

0.59 0.83 1.44 2.35 3.29

1.3 如何评价不同的QTL作图方法?

图2给出一个模拟的加倍单倍体(DH)群体中ICIM、CIM和IM三种方法的LOD值和估计遗传效应的曲线图。遗传模型中包含7个QTL,第1染色体上1个,第2和4染色体上分别有2个相引相连锁QTL,第3染色体上有2个互斥相连锁QTL,所有QTL遗传效应的绝对值为1,效应的方向如图2箭头所示。从图中我们可以很直观地看到不同QTL作图方法找到的QTL不尽相同,IM无法准确定位连锁QTL,CIM无法准确定位互斥连锁的QTL。统计检验的功效定义为1??,即发现真QTL的概率,常用来比较不同统计方法的有效性。QTL作图包含着复杂的统计假设检验,难以从理论上推导出不同QTL作图方法的统计功效。一般采用模拟方法比较不同方法QTL检测功效和假阳性的大小,功效高同时又具有较低假阳性在统计上就是较好的方法。

5

我们用独立遗传模型说明功效的计算(表2),假定基因组包含10条染色体,每条长度160 cM且均匀分布17个标记,8个QTL(IQ1~IQ8)分别位于前8条染色体,另外2条为空白染色体。为简单起见,我们用IQ2、IQ5、IQ6和IQ7说明功效的计算,4个QTL分别解释2%、5%、10%和20%的表型变异(即PVE)。假定表型方差为1.0,这样加性遗传效应等于PVE的平方根(表2)。模拟4个DH群体,群体大小均为200,每个群体中ICIM和IM检测到的所有超过LOD临界值2.5的QTL列于表3,用于统计每个QTL检测功效以及假阳性。以第一个模拟群体为例,ICIM检测到5个QTL,其中3个分别位于第5、6和7条染色体的51.10、60.00和70.00 cM处,分别落在了IQ5、IQ6和IQ7的10 cM置信区间内(表3),因此当置信区间为10 cM时把IQ5、IQ6和IQ7的统计功效加1;第2条染色体上检测到一个QTL,与IQ2的距离为6.90 cM,不在IQ2的10 cM置信区间内,第7条染色体上40 cM处检测到一个QTL,既不在IQ7的10 cM置信区间内也不在其20 cM置信区间内,因此判定为假阳性。同理,IM发现4个QTL,其中两个分别位于第6和7染色体的60.00 cM和70.00 cM处,分别落在IQ6和IQ7的10 cM置信区间内,这2个QTL对应的功效加1,另外2个不在这4个QTL的10 cM置信区间内,因此判定为假阳性。

按照上述算法,对于4次模拟来说,在LOD临界值2.5下当置信区间为10 cM时(表3),ICIM检测IQ2、IQ5、IQ6和IQ7的功效分别为2、1、3和2,即IQ2在4次模拟中被检测到2次,IQ5被检测到1次,IQ6被检测到3次,IQ7被检测到2次;IM检测4个独立QTL的功效分别为1、0、3和2。ICIM检测到的16个QTL中有8个假阳性,IM检测到的13个QTL中有7个假阳性。当置信区间为20 cM时(表3),ICIM检测IQ2、IQ5、IQ6和IQ7的功效分别为3、2、4和4,IM的检测功效分别为1、1、3和4;ICIM检测到的16个QTL中有3个假阳性,IM检测到的13个QTL中有4个假阳性。因此通过100甚至1000次的模拟,就能得到准确的检测功效和假阳性率,从而判断不同QTL作图方法的有效性。

6

20LOD score15105020Estimated effect完备区间作图ICIM210-1-2210-1-2完备区间作图ICIMLOD score151050Estimated effect复合区间作图CIM复合区间作图CIMLOD score151050Estimated effect20区间作图IM210-1-2区间作图IM1111111222222333333444444555555666666Testing every 1 cM on six chromosomes1111111222222333333444444555555666666Testing every 1 cM on six chromosomes

图2 200个加倍单倍体家系群体中区间作图、复合区间作图和完备区间作图的比较

Fig. 2 Comparison of interval mapping, composite interval mapping and inclusive composite interval mapping

in a simulated population with 200 doubled haploid lines.

假定一个基因组包含6条染色体,每条长度为120 cM,等距离分布13个标记,第1条染色体上35cM处存在1个QTL,第2、3、4条染色体上都在35和68cM处存在2个QTL,图中箭头表示QTL的近似位置,朝上箭头表

示QTL的加性效应为正,朝下箭头表示QTL的加性效应为负,效应的绝对值均为1。

A genome with 6 chromosomes was assumed, each of 120 cM and evenly distributed with 13 markers. One QTL was located at 35 cM on chromosome 1, and two QTL were located at 35 and 68 cM on chromosomes 2, 3, and 4. Arrows pointed to the approximate QTL positions. Upward arrows indicated the QTL have positive effects, while

downward arrows indicated the QTL have negative effects. The absolute genetic effect is 1 for all QTL.

表2 8个独立遗传QTL在基因组中的位置、加性遗传效应、解释表型变异的百分数以及10 cM和20 cM置信

区间

Table 2 Eight independent QTL and their chromosomal positions, additive effects and explained phenotypic

variation (%), along with the 10 cM and 20 cM confidence intervals (CI)

QTL

染色体 Chromosome

IQ1 IQ2 IQ3

1 2 3

位置 Position (cM) 25 32 39

加性效应 Additive 0.1000 0.1414 0.1732

贡献率 PVE (%) 1 2 3

置信区间 Confidence interval (CI) CI=10 cM (20 cM, 30 cM) (27 cM, 37 cM) (34 cM, 44 cM)

CI=20 cM (15 cM, 35 cM) (22 cM, 42 cM) (29 cM, 49 cM)

7

IQ4 IQ5 IQ6 IQ7 IQ8

4 5 6 7 8

46 53 60 67 74

0.2000 0.2236 0.3162 0.4472 0.5477

4 5 10 20 30

(41 cM, 51 cM) (48 cM, 58 cM) (55 cM, 65 cM) (62 cM, 72 cM) (69 cM, 79 cM)

(36 cM, 56 cM) (43 cM, 63 cM) (50 cM, 70 cM) (57 cM, 77 cM) (64 cM, 84 cM)

8