数量性状位点定位 (QTL mapping)
- 起源:
- 孟德尔的遗传学实验
- 摩尔根发现基因连锁 (linkage) 现象
- 随后绘制遗传图谱 (genetic map)
- 基因连锁分析 (linkage analysis):检验两个遗传标记间的重组率 (recombination fraction) 是否显著低于50%,估测疾病基因在基因组上的区间位置
- 实验动物容易做实验:通过诱变/杂交来获取样本
- 人类遗传标记 (genetic marker) 匮乏
- 蛋白质电泳
- 限制性片段长度多态性 (restriction fragment length polymorphism, RFLP)
- 微卫星标记 (microsatellite marker)
- 高通量微卫星基因分型平台
- 全基因组孟德尔遗传疾病连锁分析
- 高密度单核苷酸多态性基因分型
- 很少被用来寻找导致人类性状差异的遗传变异:?
- 全基因组关联分析 (genome-wide association study)
- 严格的统计显著性阈值:找到第一类和第二类统计错误之间的平衡点
- 新技术:
- 针对基因表达和基因甲基化的微阵列芯片
- 高密度单核苷酸多态性阵列:检测拷贝数变异 (copy number variation, CNV)
DNA结构
- 位点:单态性、多态性
- 基因型:纯合子、杂合子
- 多态性标记位点:DNA上的一个核苷酸或小片段的核苷酸片段
- 连锁分析和关联分析常用的遗传变异:
- 微卫星标记:该序列含单个、双个、三个或四个核苷酸串联重复
- 单核苷酸多态 (SNP):只涉及单个核苷酸,只有2-4个等位基因
- 点突变:转换、颠换,后者更少见,一个位点同时发生的概率很低,因此大部分SNP只有2个等位基因
DNA重组
- 减数分裂交叉,随机交换片段重组
- 交叉数为偶数:4条非重组染色单体
- 交叉数为奇数:2条非重组染色单体,2条重组染色单体(既含有母本也含有父本等位基因)
- 重组事件发生可能性:由一条染色体上两个位点之间的距离决定
- 重组率
$\theta$ :两位点间发生奇数次交叉的可能性- 偶数次交叉
$(1-\theta)$ - 两次或多次交叉
$a$ - 零次交叉
$b$
- 两次或多次交叉
- 两位点距离:
- 较远:$\theta=1-\theta=a=0.5, b=0$
- 较近:$\theta<0.5,\theta和a都很低,b很高$
- 重组率的叠加:$\theta_{AC}=\theta_{AB}+\theta_{BC}-2\theta_{AB}\theta_{BC}$
- 假设成立基础:重组事件相互独立
- 重组间干扰:人类基因组中存在,是发生在较小区域的低概率事件,不会影响相距较远区域间的重组率
- 用于计算相邻基因座的遗传图距离 (genetic distance) m:表示在一条染色体上重组事件发生的预期次数
- 是一个可累加的量:构建遗传图
- 不能直接测量:要用基于$\theta$观察值的作图函数来预测
- Haldane函数:$m=-1/2[ln(1-2\theta)]$
- 单位:摩尔根 (M) 或厘摩尔根 (cM)
- m即霍尔丹遗传距离
- Kosambi函数:用于非随机性和非独立性交叉
- Haldane函数:$m=-1/2[ln(1-2\theta)]$
- 物理距离 (physical distance):两个位点之间的碱基对数目
- 与遗传距离的关系不同,变量有:性别、染色体、同一染色体不同区域
- 与遗传距离转换率:
- 男性:1.05Mb/cM
- 女性:0.7Mb/cM
- 两性平均转换率约为:0.88Mb/cM
- 偶数次交叉
基因分型
- 微卫星基因型分析:ABI3700系列,测定长片段DNA重复序列
- 利用Sanger测序技术:双脱氧核糖核苷酸 (d/dNTP)
- SNP检测:最常见的双等位SNP检测
- Sanger测序方法检测:基于化学的d/dNTP标签
- ABI TaqMan:基于化学报告原理,低通量
- Sequenom:低-中通量,一次检查多样本40个SNP的基因型,质谱测定不同d/dNTP的分子量
- Illumina:微珠阵列,一次可检测1536个SNP,荧光报告
- AffymetrixDNA:高通量,光刻硅芯片,报告基因,荧光分子,一张芯片可检测百万以上SNPs,DNA用量少
- 分析数据准备:
- 等位基因长度
孟德尔遗传定律