下一代测序 (NGS)
一位维基教科书用户认为此页面应该分成多个子主题更小的页面。 您可以通过将此大页面拆分为更小的页面来提供帮助。请确保遵循 命名策略。将书籍分成更小的部分可以提供更多关注,并允许每个部分都能做好一件事,这有利于所有人。 |
对低成本测序的高需求推动了高通量测序的发展,高通量测序也称为下一代测序 (NGS)。在单个下一代测序过程中同时产生数千或数百万个序列。下一代测序已成为一种商品。随着各种经济实惠的台式测序仪的商业化,NGS 已成为传统湿实验室生物学家的触手可及之物。正如近年来所见,全基因组范围的计算分析正越来越多地用作促进生物医学研究中新发现的支柱。然而,随着测序数据量的指数级增长,分析瓶颈尚未解决。
NGS 信息学的当前来源非常分散。新手可以阅读各种期刊的综述文章,关注诸如 Biostar [1] 或 SEQanswers [2] 等论坛上的讨论主题,或注册各种机构组织的课程。找到集中的综合信息要困难得多。书籍是有的,但该领域的进展如此之快,以至于书籍章节在印刷出来时就有可能过时。此外,让少数作者不断更新他们的文本的成本可能要占用他们很多时间。
借鉴讨论论坛中显而易见的善意和社区精神,并利用维基媒体基金会提供的协作工具,我们建议启动 NGS 协作维基教科书的编辑工作。我们的计划是收集足够的文本,以便人们有动力为其做出贡献,基本上提供与论坛相同的信息,但以更整洁的形式。最终,我们的目标是创建一个集体实验室手册,解释关键概念并描述 NGS 的最佳实践。
这套动态材料专为实验室生物学家(没有或只有基础生物信息学经验的博士后期学生和早期职业博士后研究人员,并表现出对 NGS 数据分析的兴趣)设计。随着社区的贡献以及该领域的不断发展和需求,可能会添加高级材料。在线材料的灵活性应允许读者在第一次阅读时忽略细节,但可以立即访问他们需要的细节。然而,整体结构和风格应优先为非生物信息学读者设计。
有些章节包含实践练习,以便读者可以熟悉这些步骤。
请从在线社区(包括 Biostar 和 SEQanswers)寻求帮助,请确保您遵循 Dall’Olio 等人 [3] 制定的指南。
- 前四章是对生物信息学和NGS的广泛概念的总体介绍。它们是“必备先决条件”,并在本书的其余部分中被引用。
- 在简介中,我们对该领域进行了几乎完整的概述,从测序技术、它们的属性、优缺点开始,涵盖它们可以检测的各种生物学过程,并以关于常见测序术语的章节结束。最后,我们以典型测序流程的概述结束。
- 在大数据中,我们处理处理NGS数据的典型体积时出现的一些(也许出乎意料的)困难。从在世界各地运送硬盘驱动器,到您在计算机中组装数据时所需的内存量,这些问题通常让新手感到惊讶。我们将深入了解文件格式、存档和算法,这些算法已被开发出来来处理这些问题。
- 在从外部看生物信息学中,我们将讨论生物信息学家使用的界面。我们将介绍具有文本界面和闪烁光标的命令行,但也会介绍专门为生物信息学管道开发的更友好的图形用户界面 (GUI)。
- 在预处理中,我们将讨论控制NGS数据集质量的最佳实践,以及清除低质量数据。
- 接下来的五章描述了可以使用参考基因组序列进行的分析,假设参考基因组序列可用。
- 在比对中,我们将讨论如何将一组reads映射到参考数据集。
- 在DNA变异中,我们将描述如何使用映射的reads来调用变异(无论是SNV、CNV还是断点)。
- 在RNA中,我们将解释如何从映射的RNA-seq reads中确定外显子、亚型和基因表达水平。
- 在表观遗传学中,我们将描述用于确定表观遗传性状(如组蛋白或CpG甲基化)的拉下拉测定。
- 在染色质结构中,我们将讨论用于确定染色质结构的技术,例如组蛋白的放置或当DNA位于细胞核中时不同染色体区域的物理接近度。
- 最后,最后两章将描述在没有参考基因组的情况下进行的分析。
- 从头组装将描述如何从NGS reads组装一个基因组。
- 从头RNA组装将解释如何仅从NGS reads组装转录组。
- 在预处理中,fastq、QC、修剪、错误校正等。
- 在比对中,格式、算法、评估。
- 在DNA变异中,协议、格式、数据库、可视化。
- 在RNA中,转录组工作流程、工具、基因预测、格式、数据库。
- 在表观遗传学中... 硫代亚硫酸盐测序。
- 在染色质结构中... chipseq eh?
- 在从头组装中,算法、工作流程、工具、数据库。
- 在RNA组装中,相对于DNA组装的相似性、差异和挑战。
- ↑ Parnell, Laurence D. (27 October 2011). "BioStar: An Online Question & Answer Resource for the Bioinformatics Community". PLoS Computational Biology. 7 (10): e1002216. doi:10.1371/journal.pcbi.1002216.
{{cite journal}}
: Unknown parameter|coauthors=
ignored (|author=
suggested) (help) - ↑ Li, J.-W. (13 March 2012). "SEQanswers: an open access community for collaboratively decoding genomes". Bioinformatics. 28 (9): 1272–1273. doi:10.1093/bioinformatics/bts128.
{{cite journal}}
: Unknown parameter|coauthors=
ignored (|author=
suggested) (help) - ↑ Dall'Olio, Giovanni M. (28 September 2011). "Ten Simple Rules for Getting Help from Online Scientific Communities". PLoS Computational Biology. 7 (9): e1002202. doi:10.1371/journal.pcbi.1002202.
{{cite journal}}
: Unknown parameter|coauthors=
ignored (|author=
suggested) (help)