题目: 高阶马尔科夫模型在生物发育树重建中的应用
报告人: 阳卫锋
统计学博士,湖南工程学院理学院副教授
地点: 主校区 1-G-207
时间: 2017年6月8日(星期四) 下午 16:30—17: 30
欢迎广大师生前来参加指导!
理学院
2017年6月4日
摘 要:利用生物序列构建系统发育树的一般方法是在分子钟假设之下对某种保守基因进行比对。由于基于比对方法的各种局限性,无比对方法成为研究的热点。广泛应用的组合矢量(CV)法是利用k-串的频率刻画基因组或蛋白组,其用到的背景概率是利用高阶马尔科夫模型获得的。受此启发,我们直接利用高阶马尔科夫模型表示全蛋白质组或者全基因组,将相应的转移概率矩阵作为刻画序列的特征向量。其中阶的识别是利用新提出的马尔科夫熵最大化(MME)定阶方法。多个全蛋白质组和全基因组数据集的结果证实了这种非比对的发育树重建方法的可靠性和高效性。