软件说明
Sequencher DNA序列分析软件是科学家们必备的工具。持续发展和改进超过25年,Sequencher提供了无与伦比的功能特征,成千上万的出版物都有相关的应用介绍。新手用户可以以较少的时间投资产生结果,而有经验的用户会惊叹于功能的深度和控制。Sequencher自带各种专有算法,可以为Sanger, Next-Gen Sequencing (NGS)和RNA-Seq序列数据生成结果。 Sequencher 5.4.6新功能 为DNA序列分析提供了全新的和增强的功能。 Sanger Sequencher Connections中运行的 Primer-BLAST发送引物序列到您的Sequencher项目中。 在项目窗口中轻松使用一致性序列,作为NGS测序比对混合的参考序列。 新批量处理恢复结束命令。 在项目窗口中调整字体大小的功能。 NGS GSNAP和BWA-MEM工作流更快。 构建GSNAP数据库和BWA索引,这些索引可以被重新用于与整个基因组的对齐。 查看并保存用FastQC报告的NGS原始数据文件的质量分数和元数据。 使用SAMtools在您的NGS校准中标记变量来生成不同的调用文件(VCF)。 RNA-Seq 随着Cuffquant和Cuffnorm的添加,扩展了Cufflinks套件的功能。 Cuffdiff和 Cuffnorm独一无二的Conditions and Replicates编辑器。 使用自定义排序和筛选选项来增强RNA-Seq可视化功能。 使用增强的外部数据浏览器轻松管理所有的DNA-Seq和RNA-Seq项目。 Sanger序列 Sequencher使传统的序列装配变得容易,同时又能让您保持对序列的控制。精简数据质量差的序列。您甚至可以创建一个整洁的标准库,让一切变得更简单。通过直观的控制,您可以为数据选择更佳算法,包括汇编到参考中。如果您正在处理来自不同来源的多个示例,可以通过名称来对它们进行自动装配。使用工具编辑数据从来没有如此简单过,帮助您定位和处理模棱两可的问题,还可以检查杂合子并移动您的数据。使用信任值帮助修整数据、质量检查和SNP检测,以提高数据结果的质量。 序列编辑 Sequencher提供一个DNA序列编辑工具,您需要确保这个序列是绝对正确的。您可以在一个序列中查看一次您的色谱数据或在正向和反向方向查看多个对齐的色谱图。 它可以快速、方便地滚动对齐的数据,或者可以使用Sequencher的选择工具来突出区域的差异或低质量。 序列整理 自动DNA测序仪偶尔会产生质量差的读数,特别是在测序引物位点附近和接近较长的序列运行的终点。来自DNA库的克隆序列通常包含向量序列、polyA尾或其他不相关的序列。内含子和引物序列经常位于外显子序列的两侧。除非通过裁剪删除,否则这些操作将会扭曲您的序列组件和下游序列分析。 Sequencher提供了一些简单但功能强大的工具,这些工具可以帮助您修整低质量或不明确的数据。 Trim Ends从序列片段的末端删除错误的数据。 Trim Vector删除序列特定的数据,这些数据损害了您的序列的末端。 Trim to Reference消除超出组件的参考序列的序列末端。 在执行修剪之前,序列分析器显示所建议修剪的图形表示,这允许您进一步细化您的标准 如果您想还原修剪序列的两端或一端的基数,由于您的修剪过于严格,或您想提高覆盖率,Batch Revert Trim Ends可以让您做到这一点。只要点击几下,您就可以将储存的数据还原为几个或几千个序列,并且对您的序列进行更好的控制。 序列组装 Sequencher直观的控制允许您设置您的序列参数,并在几秒内调整这些参数,还支持用户快速准确地组装自定义的DNA。Sequencher会自动比较正向和反向补正的方向,以组装更佳可能的重叠群,所以您可以根据方向排列DNA序列。 Sequencher通用装配工具应用如下 基因变异与参考序列的比较 确认向量构造 组装病毒和细菌基因组 从cDNA库中集群数万个序列 将cDNA组合成基因组序列 创建引物图 组装参考 参考序列功能强大,它是测序和序列分析等的核心功能。无论您是从事法医学、系统研究、医学遗传学或人口研究,您都可能使用到参考序列功能。在GenBank格式中导入一个序列,将其特性表应用到序列中,并将其标记为一个引用序列。组装到参考序列意味着您可以将您的阅读和原型参考序列进行比较。如果您使用来自不同来源的多个示例,您甚至还可以按名称装配来自动化您的工作。 您甚至可以使用参考序列来指导去除您感兴趣区域之外的序列或者填补序列覆盖的空白。 多序列比对 Clustal 从4.9版本开始,Clustal已经成为Sequencher一系列插件的一部分。它是一种被广泛使用的多序列比对程序,它通过确定一组序列中的所有成对排列来进行工作,构造一个树状图以近似相似的方式对序列进行分组,然后使用dendogram作为向导来执行该序列。您可以使用Clustal来直接从Sequencher项目窗口中排列您的序列。从一系列参数中选择控制对齐过程。 一旦完成对齐,您可以看到Sequencher中一个或多个重叠的结果,您还可以进行多种分析。 通过将Clustal与Sequencher的功能结合起来,将不同来源的多个序列排列在一起,加速您的集群的排列。最后以不同的格式导出文件,如MSF、Phylip、NEXUS和FastA,在其他程序中使用或者简单地创建一致性并导出。 MUSCLE MUSCLE是一个多序列比对(MSA)程序,从5.1版本开始加入Sequencher插件。它加入了Clustal,使它成为了Sequencher DNS-Seq工具的第二大的MSA项目。它的速度和精确度都很好,与其他的多序列排列程序相比,它是非常有优势的。MUSCLE在排序过程中主要有四个主要的步骤。第一步是使用k-mer集群来构建一个距离矩阵,然后将其转换为树。第二步使用这棵树来指导一个渐进的对齐。在最后的两个步骤中,MUSCLE算法尝试了许多不同的方法,以确定是否有可能改善树,从而实现多重对齐。 一旦整个过程完成,MUSCLE就会完成对齐,您会在Sequencher中看到以连续函数显示的结果。使用Sequencher的工具来注释您的对齐或导出您的对齐,并将其放入一个特殊的系统遗传程序中。 MUSCLE是一个命令行程序,这意味着通常您会通过终端应用程序来使用这个程序。Sequencher开放了用户访问MUSCLE权限,而不需要学习使用UNIX命令行来操作。 限制性图 Sequencher提供了一套丰富的工具,用于生成DNA序列的线性限制图。通过频率、悬垂的性质或识别序列的长度来筛选酶的选择。 您还可以指定特定的向量和多连接序列来帮助您创建克隆策略。 支持信任值 Sequencher在项目窗口、序列编辑器和序列获取信息窗口中显示可信度和汇总置信度信息(如果在DNA序列文件中可用)。因此,您可以轻松地监视数据的质量。 您甚至可以为您的置信值指定截止范围,并通过颜色代码查看这些范围。 SNP检测 Sequencher有几个强大的工具来帮助你检测DNA序列中的突变和单核苷酸多态性。您可以使用Sequencher来对一组序列之间的比较序列比对或将1个或多个序列与参考序列进行比较。Sequencher的Call Secondary Peaks…功能分析您所有的潜在杂合子序列。控制杂合子的严格性是很容易的。 在DNA组装概述中绘制所有杂合子的位置。 您可以从一个杂合子导航到下一个,只需单击Basic视图中的空格键即可。查看蛋白质转换对于共识和参考序列低于共识。参考序列确保SNP的编号从一个DNA组件到下一个DNA组件是一致的。 自动化分析 Sequencher批量处理您的DNA序列数据的方式是透明的、用户可定义的以及可恢复的, Sequencher不会为了自动化而影的科学结论的有效性。Sequencher总是给您序列编辑的最终选择。 Sequencher始终保持两个数据副本,编辑的和原始导入的数据。当将恢复到实验数据命令应用到项目中的序列选择或序列中的基础选择时,可以撤消所有或部分编辑内容。按名称组装工具允许您选择片段名称的一部分作为作为共享标识符或“汇编句柄”。Sequencher自动选择和命名重叠群。Sequencher甚至支持正则表达式匹配来设置的ID! 例如,通过点击一个按钮,您可以将90个文件、45对正向和反向序列转换成45个根据患者ID命名的重叠群。序列组装参数的更改会重新组合片段,因此,您可以根据克隆ID、日期、引物或您在序列名称中记录的任何其他特征来组装重叠群。 如果您做了大量的测序或您有大量的样品是用一套标准的测序引物完成的,那么按名称组装是特别有用的。按名称汇编的其他一些应用程序包括: MHC和线粒体基因的序列鉴定及群体研究 候选基因的PCR产物分析 测序保守基因跨物种的系统学 跟踪抗病毒药物或疫苗的耐药性监测病毒基因组序列 新一代测序技术 Gene Codes公司致力于为您带来各种各样的序列和汇编算法,既会在专业期刊上发布,也可以让非工程师访问它们。例如,GSNAP(Tom Wu, Genentech, Inc.) 被认为是正确识别拼接结的更佳算法之一。生物信息学专家可能会像这样调用这个程序: 对大多数用户来说,如果我们有一些工具来帮助我们了解所有可用的标记和参数是什么以及它们如何影响程序,工作效率会有效提高。Sequencher界面可以帮助您选择选项、设置值,并通过描述和工具提示了解可用的功能。在Sequencher的命令行中,同样的选项是这样的:
仅需几步就可以执行SNP分析、甲基化分析或RNA A-G耐受性比对。 在Tablet上查看您的结果。 BWA, Velvet, Maq, GSNAP和Tablet只是Sequencher功能的基础。如果您正在对混合种群进行测序,那么就把参考向导队列与从头组装结合起来。将读数对齐到引用中并捕获未对齐的读数,以进一步参考基准排列或从头装配。 通过添加Cufflinks套件,您可以使用与我们开发的所有NGS算法相同的界面来执行rna-seq微分表达式。 我们还添加了您希望看到的图表,比如火山图,这样您就可以在不使用命令行的情况下查看结果。因为我们知道用户有自己喜欢的aligner,因此我们不会坚持让您用我们的aligner。只要您的aligner创建SAM或BAM作为输出,您就可以使用广泛使用的rna-seq工具之一来探索您的数据。 FastQC质量控制报告 在开始调整数据之前,先停下来考虑一下,我们的数据到底如何?现在我们可以用FastQC Quality Reports。我们在Sequencher中添加了FastQC程序。从Sequence > Analyses > FastQ Quality Report…启动此功能,您可以得到多达12种不同的度量结果。从‘Per base sequence quality’ 到‘Kmer Content’,从Sequence Duplication Levels’ 到 ‘Overrepresented sequences’,结果给出一个易于理解的交通灯系统图以及更详细的图表。 在组装前,使用报表监控个人数据集的质量,或随时监控质量。 RNA-Seq RNA-Seq实验正在为蛋白质编码转录物的研究带来新的理解和知识,是否从不同时间点或在正常状态和疾病状态之间的正常组织。Sequencher家族更新的程序是Cufflinks suite,专门研究RNA-Seq NGS数据的一系列程序。使用您喜欢的aligner对齐RNA-Seq NGS数据到参考序列中,然后使用SAM或BAM结果文件和参考GTF文件来启动Cufflinks。重点使用Cufflinks, Cuffmerge, Cuffdiff以及最终数据以表格和图形展示这四个步骤过程的差异表达。Cufflinks suite命令行程序可以使用我们易于使用的图形界面。对于最终控件,您也可以访问所有高级命令行函数,通过简单的点,然后单击Advanced(Edit)对话框。 在Sequencher中,您可以运行分析并以图形的形式查看结果。通常,差异表达式要求您从命令行安装和使用R统计编程语言。 我们给你一个菜单命令,允许你用火山图、散点图和条形图显示结果。每个点或条链接到它的隐藏数据,您可以点击一个您感兴趣的点或条,查看详细的结果。Sequencher中的Cufflinks suite包含Cuffquant和Cuffnorm。如果您没有做差异表达基因的工作,但仍然需要归一化的结果,那么在Cufflinks步骤后使用Cuffquant和Cuffnorm。如果需要减少计算机上的计算负载,您可以在Cufflinks和Cuffmerge步骤后使用Cuffquant来量化数据集中的读数。之后,用Cuffdiff来完成差异化分析。您会发现这一步要快得多,因为这部分工作已经完成了。 用基因名称或geneID搜索数据表,快速定位感兴趣的数据。排序并筛选数据,仅绘制您感兴趣的内容,然后以PNG格式导出图表,以便放到演示文稿或报告中。 De Novo Assembly Velvet Velvet是Sequencher v5.1时添加的插件,Velvet是一个知名的从头汇编程序,它不需要参考序列。Velvet包含两个程序。Velveth准备数据集时,Velvetg调用de Bruijn图形方法执行组装步骤。Velvetg构建重叠群,甚至尝试拼接重叠群。Velvet可以使用Multiplex ID数据来执行从头组装。Sequencher自动将数据按条形码分成单独的文件(bins),然后将它们对齐,并将结果放入单独的结果文件夹中。然后可以在Tablet浏览器中查看结果。每个重叠群的一致序列将出现在Project Window中。 Velvet在命令行上运行。Sequencher通过简单地单击几次来启动程序集运行,从而保护您不受命令行的影响。资深用户和新手都可以访问命令行参数来添加或更改参数,我们已经设置了一个新的GUI,让您访问和使用这些参数。 参考向导对齐 Aligners花费一定的时间索引参考序列来加速整体对齐。您可以创建和保留那些索引(BWA)或数据库(GSNAP),当您想用不同的参数来改进对齐或拼接时,可以提升它的速度。索引和数据库文件是跨平台的,因此您可以与不同类型计算机上的合作者共享它们。当您创建一个新的索引或数据库时,它将自动出现在该对齐程序的可用参考序列列表中,随时可供使用。 预处理引用的文件可以很大。当您不想使用哪个文件时,使用External Data Browser点击一下就可以删掉。如果需要再次索引相同的引用序列,则可以节省磁盘空间,而序列分析器可以轻松地重新创建它。 BMA BWA是Sequencher v5.2时添加到插件家族中的。Sequencher使用BWA-MEM, BWA软件包包含了较快更新的算法。BWA-MEM被设计为对齐70bp到1Mbp的序列读数到参考序列中。BWA在命令行中运行。Sequencher为您提供了一个易于使用的接口,它可以使您与命令行隔离,并且不必学习或使用命令行参数。资深用户想要访问这些命令行函数,Advanced (Edit)对话框也允许您使用这些命令行。 GSNAP GSNAP是Sequencher v5.0被添加到插件家族中。GSNAP使用压缩参考序列的基准参考对准的高效方法。当执行Next-Gen序列时,让GSNAP可以更快更简单。 GSNAP被设计用来执行Illumina-Solexa的基于参考对准和Sanger标准数据,这个标准数据是成对结尾或未成对结尾的。在GSNAP中,序列的长度不是问题,因为它可以在非常短的时间内与任意长的数据长度对齐。GSNAP可以处理Multiplex ID(MID)数据,从而进一步提高工作效率。Sequencher友好的界面允许您使用MID数据来发挥GSNAP的功能。Sequencher自动将数据按条形码分割成单独的文件,使用GSNAP将它们与引用对齐,并将结果放入单独的结果文件夹中。 用GSNAP进行任何对齐的结果可以在流行的Tablet浏览器中查看。 资深用户想要更好的掌握GSNAP命令行功能,点击Advanced(Edit)来打开Advanced GSNAP选项对话框,在这里您可以配置特定的命令行参数。 Maq Maq是Sequencher v5.0时被添加到插件家族中的。流行的Maq算法将Next-Generation数据的单端和成对端对准参考序列。最初设计为对齐Illumina-Solexa数据,可以对齐任何短的读取数据(63 bases或更少)。参考序列可能是FastA或GenBank的文件形式。Maq使用二进制格式压缩引用和读取文件。较重要的是,Maq需要很少的内存来运行,这使得执行下一代测序更容易。它也适用于大约二百万个阅读的小项目,尽管有可能把较大的项目拆掉,然后合并结果。您的对齐结果可以在Maqview或Tablet中查看。 最初Maq是在命令行上运行的。Sequencher提供了一个简单、易于使用的接口,它可以保护您不受命令行的影响,也不必学习如何使用命令行参数。 SAMtools的变异调用 已经排序和对齐,接下来检查使用新的变体调用特征对变体进行对齐。您是否已经把您的读数与我们的参考引导对齐或者您已经将您的SAM/BAM文件导出到别处,您仍然可以使用SAMtools的变量调用检查变量。 此分析可用于SNP耐受性对齐、甲基化耐受性对齐或GSNAP中的新RNA A-I编辑耐受模式。然后将生成的VCF文件和SAM文件加载到您喜欢的浏览器中,如果您没有自己喜欢的浏览器,可以用Tablet—我们DNA-Seq工具分布的一部分。提供带有注释的GTF文件的Tablet,您还可以在特性中看到变体。 Multiplex ID Sequencher 5.2或之后的用户使用基于BWA, GSNAP 或Velvet从头或基于参考组件的复用方法。复用方法快速而容易。每个DNA样本都有与其相关的特定条形码。Sequencher可以阅读这些条形码并将数据分成不同的文件或‘bins’。Sequencher获取每个‘bin’中的序列,并为您执行汇编或对齐。Sequencher的Multiplex ID可与单端或成对端数据一起使用。对于成对的端数据,每个读数在5’端必须有相同的条形码,可以被识别为一对。您可以使用Tablet阅读器查看多路复用组件或对齐的结果。 SNP分析 筛选下一代测序所产生的数以百万计的读物在寻找候选SNPs时面临重大挑战。Maq和GSNAP算法都包括SNP筛选功能。Maq具有两级筛选过程,最初搜索读取和参考序列之间的差异。接着,筛选初始结果的过滤步骤,寻找每列读取的相同类别的最小数量,以及嵌入在高质量区域内的变体。综合报告中给出了结果,您还可以在Maqview或Tablet中查看结果。 使用GSNAP,SNP分析采取不同的方法,查看之前报告的SNPs以及新的候选SNPs。用户必须提供已知的SNPs列表以及读取和参考序列。GSNAP对所有主要和次要等位基因进行SNP耐受性排列。该算法使微小等位基因与错配区分开来。综合报告中给出了结果,您还可以在Tablet中查看结果。 甲基化研究 几十年来,DNA甲基化被认为在基因表达中起着重要的作用。当用亚硫酸氢盐处理DNA时,除非胞嘧啶甲基化,任何胞嘧啶都被转换成尿嘧啶。GSNAP将从亚硫酸氢盐处理的DNA测序获得的下一代测序读数校准为参考序列,以不掩盖真正错配的方式排列它们,但当用亚硫酸氢盐处理未甲基化DNA时仍然暴露发生的C到T失配。
仅需几步就可以执行SNP分析、甲基化分析或RNA A-G耐受性比对。 在Tablet上查看您的结果。 BWA, Velvet, Maq, GSNAP和Tablet只是Sequencher功能的基础。如果您正在对混合种群进行测序,那么就把参考向导队列与从头组装结合起来。将读数对齐到引用中并捕获未对齐的读数,以进一步参考基准排列或从头装配。 通过添加Cufflinks套件,您可以使用与我们开发的所有NGS算法相同的界面来执行rna-seq微分表达式。 我们还添加了您希望看到的图表,比如火山图,这样您就可以在不使用命令行的情况下查看结果。因为我们知道用户有自己喜欢的aligner,因此我们不会坚持让您用我们的aligner。只要您的aligner创建SAM或BAM作为输出,您就可以使用广泛使用的rna-seq工具之一来探索您的数据。 FastQC质量控制报告 在开始调整数据之前,先停下来考虑一下,我们的数据到底如何?现在我们可以用FastQC Quality Reports。我们在Sequencher中添加了FastQC程序。从Sequence > Analyses > FastQ Quality Report…启动此功能,您可以得到多达12种不同的度量结果。从‘Per base sequence quality’ 到‘Kmer Content’,从Sequence Duplication Levels’ 到 ‘Overrepresented sequences’,结果给出一个易于理解的交通灯系统图以及更详细的图表。 在组装前,使用报表监控个人数据集的质量,或随时监控质量。 RNA-Seq RNA-Seq实验正在为蛋白质编码转录物的研究带来新的理解和知识,是否从不同时间点或在正常状态和疾病状态之间的正常组织。Sequencher家族更新的程序是Cufflinks suite,专门研究RNA-Seq NGS数据的一系列程序。使用您喜欢的aligner对齐RNA-Seq NGS数据到参考序列中,然后使用SAM或BAM结果文件和参考GTF文件来启动Cufflinks。重点使用Cufflinks, Cuffmerge, Cuffdiff以及最终数据以表格和图形展示这四个步骤过程的差异表达。Cufflinks suite命令行程序可以使用我们易于使用的图形界面。对于最终控件,您也可以访问所有高级命令行函数,通过简单的点,然后单击Advanced(Edit)对话框。 在Sequencher中,您可以运行分析并以图形的形式查看结果。通常,差异表达式要求您从命令行安装和使用R统计编程语言。 我们给你一个菜单命令,允许你用火山图、散点图和条形图显示结果。每个点或条链接到它的隐藏数据,您可以点击一个您感兴趣的点或条,查看详细的结果。Sequencher中的Cufflinks suite包含Cuffquant和Cuffnorm。如果您没有做差异表达基因的工作,但仍然需要归一化的结果,那么在Cufflinks步骤后使用Cuffquant和Cuffnorm。如果需要减少计算机上的计算负载,您可以在Cufflinks和Cuffmerge步骤后使用Cuffquant来量化数据集中的读数。之后,用Cuffdiff来完成差异化分析。您会发现这一步要快得多,因为这部分工作已经完成了。 用基因名称或geneID搜索数据表,快速定位感兴趣的数据。排序并筛选数据,仅绘制您感兴趣的内容,然后以PNG格式导出图表,以便放到演示文稿或报告中。 De Novo Assembly Velvet Velvet是Sequencher v5.1时添加的插件,Velvet是一个知名的从头汇编程序,它不需要参考序列。Velvet包含两个程序。Velveth准备数据集时,Velvetg调用de Bruijn图形方法执行组装步骤。Velvetg构建重叠群,甚至尝试拼接重叠群。Velvet可以使用Multiplex ID数据来执行从头组装。Sequencher自动将数据按条形码分成单独的文件(bins),然后将它们对齐,并将结果放入单独的结果文件夹中。然后可以在Tablet浏览器中查看结果。每个重叠群的一致序列将出现在Project Window中。 Velvet在命令行上运行。Sequencher通过简单地单击几次来启动程序集运行,从而保护您不受命令行的影响。资深用户和新手都可以访问命令行参数来添加或更改参数,我们已经设置了一个新的GUI,让您访问和使用这些参数。 参考向导对齐 Aligners花费一定的时间索引参考序列来加速整体对齐。您可以创建和保留那些索引(BWA)或数据库(GSNAP),当您想用不同的参数来改进对齐或拼接时,可以提升它的速度。索引和数据库文件是跨平台的,因此您可以与不同类型计算机上的合作者共享它们。当您创建一个新的索引或数据库时,它将自动出现在该对齐程序的可用参考序列列表中,随时可供使用。 预处理引用的文件可以很大。当您不想使用哪个文件时,使用External Data Browser点击一下就可以删掉。如果需要再次索引相同的引用序列,则可以节省磁盘空间,而序列分析器可以轻松地重新创建它。 BMA BWA是Sequencher v5.2时添加到插件家族中的。Sequencher使用BWA-MEM, BWA软件包包含了较快更新的算法。BWA-MEM被设计为对齐70bp到1Mbp的序列读数到参考序列中。BWA在命令行中运行。Sequencher为您提供了一个易于使用的接口,它可以使您与命令行隔离,并且不必学习或使用命令行参数。资深用户想要访问这些命令行函数,Advanced (Edit)对话框也允许您使用这些命令行。 GSNAP GSNAP是Sequencher v5.0被添加到插件家族中。GSNAP使用压缩参考序列的基准参考对准的高效方法。当执行Next-Gen序列时,让GSNAP可以更快更简单。 GSNAP被设计用来执行Illumina-Solexa的基于参考对准和Sanger标准数据,这个标准数据是成对结尾或未成对结尾的。在GSNAP中,序列的长度不是问题,因为它可以在非常短的时间内与任意长的数据长度对齐。GSNAP可以处理Multiplex ID(MID)数据,从而进一步提高工作效率。Sequencher友好的界面允许您使用MID数据来发挥GSNAP的功能。Sequencher自动将数据按条形码分割成单独的文件,使用GSNAP将它们与引用对齐,并将结果放入单独的结果文件夹中。 用GSNAP进行任何对齐的结果可以在流行的Tablet浏览器中查看。 资深用户想要更好的掌握GSNAP命令行功能,点击Advanced(Edit)来打开Advanced GSNAP选项对话框,在这里您可以配置特定的命令行参数。 Maq Maq是Sequencher v5.0时被添加到插件家族中的。流行的Maq算法将Next-Generation数据的单端和成对端对准参考序列。最初设计为对齐Illumina-Solexa数据,可以对齐任何短的读取数据(63 bases或更少)。参考序列可能是FastA或GenBank的文件形式。Maq使用二进制格式压缩引用和读取文件。较重要的是,Maq需要很少的内存来运行,这使得执行下一代测序更容易。它也适用于大约二百万个阅读的小项目,尽管有可能把较大的项目拆掉,然后合并结果。您的对齐结果可以在Maqview或Tablet中查看。 最初Maq是在命令行上运行的。Sequencher提供了一个简单、易于使用的接口,它可以保护您不受命令行的影响,也不必学习如何使用命令行参数。 SAMtools的变异调用 已经排序和对齐,接下来检查使用新的变体调用特征对变体进行对齐。您是否已经把您的读数与我们的参考引导对齐或者您已经将您的SAM/BAM文件导出到别处,您仍然可以使用SAMtools的变量调用检查变量。 此分析可用于SNP耐受性对齐、甲基化耐受性对齐或GSNAP中的新RNA A-I编辑耐受模式。然后将生成的VCF文件和SAM文件加载到您喜欢的浏览器中,如果您没有自己喜欢的浏览器,可以用Tablet—我们DNA-Seq工具分布的一部分。提供带有注释的GTF文件的Tablet,您还可以在特性中看到变体。 Multiplex ID Sequencher 5.2或之后的用户使用基于BWA, GSNAP 或Velvet从头或基于参考组件的复用方法。复用方法快速而容易。每个DNA样本都有与其相关的特定条形码。Sequencher可以阅读这些条形码并将数据分成不同的文件或‘bins’。Sequencher获取每个‘bin’中的序列,并为您执行汇编或对齐。Sequencher的Multiplex ID可与单端或成对端数据一起使用。对于成对的端数据,每个读数在5’端必须有相同的条形码,可以被识别为一对。您可以使用Tablet阅读器查看多路复用组件或对齐的结果。 SNP分析 筛选下一代测序所产生的数以百万计的读物在寻找候选SNPs时面临重大挑战。Maq和GSNAP算法都包括SNP筛选功能。Maq具有两级筛选过程,最初搜索读取和参考序列之间的差异。接着,筛选初始结果的过滤步骤,寻找每列读取的相同类别的最小数量,以及嵌入在高质量区域内的变体。综合报告中给出了结果,您还可以在Maqview或Tablet中查看结果。 使用GSNAP,SNP分析采取不同的方法,查看之前报告的SNPs以及新的候选SNPs。用户必须提供已知的SNPs列表以及读取和参考序列。GSNAP对所有主要和次要等位基因进行SNP耐受性排列。该算法使微小等位基因与错配区分开来。综合报告中给出了结果,您还可以在Tablet中查看结果。 甲基化研究 几十年来,DNA甲基化被认为在基因表达中起着重要的作用。当用亚硫酸氢盐处理DNA时,除非胞嘧啶甲基化,任何胞嘧啶都被转换成尿嘧啶。GSNAP将从亚硫酸氢盐处理的DNA测序获得的下一代测序读数校准为参考序列,以不掩盖真正错配的方式排列它们,但当用亚硫酸氢盐处理未甲基化DNA时仍然暴露发生的C到T失配。