解析二倍体和多倍体基因组中的单倍型

作者:Xingtan Zhang, Ruoxi Wu, Yibin Wang, Jiaxin Yu, Haibao Tang

原文来源:Zhang X, Wu R, Wang Y, Yu J, Tang H. Unzipping haplotypes in diploid and polyploid genomes. Comput Struct Biotechnol J. 2019; 18: 66 - 72.

关键字

基因组组装、单倍型定相、倍性、参考基因组、杂合性

摘要

二倍体基因组由两个同源的染色体拷贝组成,两个亲本各有一个,而多倍体基因组包含两个以上的同源染色体组。大多数参考基因组组装折叠了代表 “mosaic” 序列的单倍型,忽略了可能涉及重要细胞和生物学功能的等位基因变异。在最近的基因组研究中,将单倍型解析成不同的序列集已成为一种增长趋势,因为它是解决重要临床和生物问题(如复合杂合子、杂种优势和进化)的重要工具。这里,我们回顾了用于杂合二倍体和多倍体基因组的基于比对和组装的单倍型定相的现有方法,以及改进基因组定相的实验方法的最新进展。我们预计,在不久的将来,完整的单倍型定相可能成为基因研究中的常规程序。

阅读全文 »

Introduction

单倍型解析的基因组组装对于了解变体组合如何影响表型非常重要。Falcon phase 使用超远程 Hi-C 染色质相互作用数据将部分定相二倍体组装的 phase blocks 扩展到染色体/scaffolds 水平;使用 Hi-C reads 中固有的定相信息,跳过变体调用,并降低定相的计算复杂度。

阅读全文 »

Introduction

大多数基因组组装工具只是简单的将单倍型共同组装成一个 mosaic consensus,从而导致组装不能准确地代表任何一个原始单倍型。将单倍型折叠成一个单一的 consensus 会引入不存在于任何一单倍型中的错误变体,从而导致注释或分析错误。在理想情况下,基因组应该表示为一组完整的单倍型,而不是 artificial mixture。解决这种问题的常见方法就是对近交个体进行测序来减少单倍型变异的问题,然而,这对许多物种来说时不切实际的;即使在可能的情况下,也可能导致基因组不能代表自然种群中发现的变异。另一种方法是使用单倍体、基于克隆的基因组库,就像人类基因组计划所做的那样。

阅读全文 »

Background

现今,大多数现有的比较组装的方法仅适用于已完成基因组的新组装,尚未充分考虑评估以前未测序的物种组合的问题。当前的测序技术和软件面临着许多阻碍完整染色体重建的复杂性,包括读取错误和基因组中的大量重复。不同的组装程序使用不同的启发式算法来应对这些挑战,从而导致它们输出的 contigs 存在许多差异。这也导致了如何评估组装质量以及如何比较不同组装的问题。

阅读全文 »