DNA序列分析软件Sequencher的Next-Generation Sequencing功能

Gene Codes致力于为您带来在同行评审期刊上开发和发布的各种比对和组装算法,但让非工程师也可以使用它们。例如,GSNAP(Tom Wu,Genentech,Inc.)被认为是正确识别剪接点的算法之一。生物信息学专家可能会像这样调用该程序:

 

 

如果我们有一些工具来帮助我们了解所有可用的标志和参数是什么以及它们如何影响程序,那么我们大多数人的工作效率都会更高。Sequencher界面可帮助您选择选项、设置值并通过说明和工具提示了解可用功能。上面指令行中的相同选项在Sequencher中设置如下:

 

 

只需几个步骤即可执行SNP分析、甲基化分析或RNA A-to-G耐受比对。

 

在平板电脑中查看您的结果 。

 

BWA、Velvet、Maq、GSNAP和Tablet只是Sequencher的开始。如果您要对混合群体进行测序,请将参考引导比对与从头组装的力量结合起来。将读数与参考比对并捕获未比对的读数,以进行进一步的基于参考的比对或从头组装。

 

 

通过添加Cufflinks套件,您可以使用我们为所有NGS算法开发的相同风格的界面来执行RNA-Seq差异表达。

 

 

我们还添加了您期望看到的图表,例如火山图,因此您无需借助指令行即可查看结果。因为我们知道您有自己喜欢的矫正器,所以我们不会坚持您使用我们的。只要您的对齐器创建SAM或BAM作为其输出,您就可以使用广泛认可的RNA-Seq工具之一来探索您的数据。

 

 

FastQC质量控制报告

 

在开始调整数据之前,请停下来考虑一下。您不想知道您的数据有多好吗?好吧,现在您可以使用FastQ质量报告。我们已将流行的FastQC程序集成到Sequencher中。从“序列”>“分析”>“FastQ质量报告...”启动,您可以获得多达12个不同指标的结果。从“每碱基序列质量”到“Kmer内容”,从“序列重复水平”到“过度代表性序列”,结果以易于理解的交通灯系统以及更详细的图形形式呈现。

 

 

 

每个报告都显示在自己的窗口中,以便您可以并排查看它们。使用报告在组装之前监控数据集的单独质量或随着时间的推移监控质量。

 

RNA测序

 

RNA-Seq实验为蛋白质编码转录本的研究带来了新的理解和知识,无论是来自不同时间点的正常组织还是正常与生病状态之间的转录本。Sequencher插件家族的新成员是Cufflinks套件 ,一系列专为研究RNA-Seq NGS数据而设计的程序。入门再简单不过了。

 

使用您喜欢的比对器将您的RNA-Seq NGS数据与参考序列比对,然后获取生成的SAM或BAM文件以及参考GTF文件以开始使用 Cufflinks。

 

关键是利用Cufflinks、Cuffmerge、Cuffdiff的四步过程进行差异表达,然后将数据显示为表格和绘图。Cufflinks套件指令行程序都可以使用我们易于使用的图形界面进行访问。为了实现控制,您还可以通过简单的点击“高等(编辑)”对话框来访问所有高等指令行功能。

 

 

您可以在Sequencher中运行分析并以绘图形式查看结果。通常,差异表达需要您从指令行安装并使用R统计编程语言。

 

 

我们为您提供一个菜单指令,允许您使用火山图、散点图和条形图显示结果。每个点或条都链接到其基础数据,因此您可以单击您感兴趣的点或条并详细探索结果。

 

Sequencher中的Cufflinks套件现在包括Cuffquant和Cuffnorm。如果您不处理差异表达基因但仍需要标准化结果,请在 Cufflinks步骤后使用Cuffquant和Cuffnorm。如果您需要减少计算机上的计算负载,可以在Cufflinks和Cuffmerge步骤之后使用 Cuffquant来量化数据集中的读数。然后,当您准备好时,使用Cuffdiff完成差异分析。您会发现这一步要快得多,因为那部分工作已经完成。 

 

 

 

 

通过基因名称或基因ID搜索数据表,快速找到您感兴趣的数据。

 

对数据进行排序和筛选,仅绘制您感兴趣的数据,然后以PNG格式导出图表以包含在演示文稿或报告中。

 

De Novo组装

 

Velvet在5.1版中加入了不断壮大的Sequencher插件家族。Velvet是一个从头汇编器,它不需要参考序列。虽然我们谈论Velvet,但它实际上由两个程序组成。Velveth准备您的数据集,而Velvetg使用一种称为de Bruijn图的方法执行组装步骤。Velvetg构建重叠群,甚至会尝试搭建那些无法自行组合在一起的重叠群。

 

Velvet可以使用Multiplex ID数据进行从头组装。Sequencher自动按条形码将数据划分为单独的文件(箱),然后对齐它们并将结果放入单独的结果文件夹中。然后可以在平板电脑浏览器中查看结果。每个重叠群的共有序列将出现在您的项目窗口中。

 

 

Velvet被编写为在指令行上运行。Sequencher使您只需单击几下即可轻松启动程序集运行,从而保护您免受指令行的影响。高等用户和新手仍然可以访问指令行参数来添加或更改参数,我们引入了一个新的GUI,让您也可以访问和利用这些参数。

 

参考引导对齐

 

比对人员花费一部分时间对参考序列进行索引,以加快整体比对速度。现在,您可以创建并保留这些索引 (BWA) 或数据库 (GSNAP),当您想要尝试不同的参数以改进对齐或拼接位置时,速度会更快。

 

索引和数据库文件是跨平台的,因此您可以与不同类型计算机上的协作者共享它们。当您创建新索引或数据库时,它将自动出现在该比对器的可用参考序列列表中,可供随时使用。Sequencher会记住它的位置,因此您无需记住它。

 

来自预处理参考的文件可能会变得很大。当您不再使用某个数据时,只需使用外部数据浏览器一键删除即可。您将节省磁盘空间,并且如果您需要再次索引相同的参考序列,Sequencher可以轻松地重新创建它。

 

BWA

BWA在5.2版本中加入了Sequencher插件系列。Sequencher使用BWA-MEM,这是BWA软件包中新、快的算法。BWA-MEM旨在将70bp到1Mbp的序列读数与参考比对。

 

BWA被编写为在指令行上运行。Sequencher为您提供了一个易于使用的界面,使您无需使用指令行,也无需学习或使用指令行参数。对于想要访问这些指令行功能的高等用户来说,“高等(编辑)”对话框也可以让您利用这些功能。

 

 

GSNAP

GSNAP在5.0版中加入了Sequencher插件系列。GSNAP通过压缩参考序列,使用基于参考的对齐方法。这使得GSNAP在执行下一代测序时变得更快、更容易。

 

GSNAP旨在对双端和不双端的Illumina-Solexa或Sanger标准数据执行基于参考的比对。序列的长度对于GSNAP来说不是问题,因为它能够轻松对齐很短到任意长的数据长度。

 

GSNAP现在可以处理Multiplex ID (MID) 数据,从而进一步很大限度地提高效率。现在您拥有了Sequencher的用户友好界面,它允许您通过MID数据利用 GSNAP 的功能。Sequencher自动将数据按条形码划分为单独的文件,使用GSNAP将这些文件与参考对齐,并将结果放入单独的结果文件夹中。

 

任意与GSNAP对齐的结果都可以在流行的平板电脑浏览器中查看。

 

 

对于想要更好地控制GSNAP指令行功能的高等用户,请按“高等(编辑)”打开“高等GSNAP 选项”对话框,您可以在其中配置特定的指令行参数。

 

Maq

 

Maq在5.0版本中加入了Sequencher插件系列。流行的Maq算法将单端和双端下一代数据与参考序列对齐。开始设计用于对齐 Illumina-Solexa 数据,它将对齐任意很短的读取数据(63个碱基或更少)。参考序列可以是FastA或GenBank文件的形式。Maq使用二进制格式来压缩引用并读取文件。关键的是,Maq运行所需的RAM很少,这使得执行下一代测序变得更加容易。它也适用于大约200万次读取的小型项目,尽管可以将较大的项目分解然后稍后合并结果。

 

比对结果可以在Maqview或Tablet中查看。

 

 

Maq开始是为了在指令行上运行而编写的。Sequencher 提供了一个简单、易于使用的界面,可以保护您免受指令行的影响,也不必学习如何使用指令行参数。

 

使用SAMtools进行变体调用

 

您已经对它进行了测序,现在您已经对其进行了对齐。接下来使用新的变体调用功能检查变体的比对。无论您是使用我们的参考引导比对器之一比对读数,还是在其他地方获取比对的SAM/BAM文件,您仍然可以使用SAMtools的变体调用来检查变体。

 

该分析可以在SNP耐受比对、甲基化耐受比对或GSNAP中新的RNA A-to-I编辑耐受模式之后使用。然后将生成的VCF文件和 SAM文件加载到您喜欢的浏览器中(如果您没有试用平板电脑)——它是我们DNA-Seq工具发行版的一部分。向平板电脑提供GTF文件进行注释,您还可以看到功能中的变体。

 

 

Multiplex ID

 

Sequencher 5.2及更高版本使用BWA、GSNAP或Velvet的从头或基于参考的组装的复用方法。多路复用既快速又简单。每个 DNA样本都有一个与其相关的特定条形码。Sequencher可以读取这些条形码并将数据划分到各种文件或“容器”中。然后,Sequencher获取每个“bin”中的序列并为您执行组装或比对。Sequencher的Multiplex ID可与单端或双端数据一起使用。对于成对末端数据,成对中的每个读取都必须在 5' 端具有相同的条形码才能被识别为成对。您可以使用平板电脑查看器查看多重组装或比对的结果。

 

 

SNP分析

在寻找候选SNP时,筛选下一代测序产生的数百万条读数是一项重大挑战。Maq和GSNAP算法都包含SNP筛选功能。

 

Maq有一个两级筛选过程,首先搜索读数和参考序列之间的差异。接下来,进行过滤步骤,筛选初始结果,寻找每列读数的同一类别的小数量的变体,以及嵌入高质量区域的变体。结果以综合报告形式呈现。您还可以在Maqview或平板电脑中查看结果。

 

通过GSNAP,SNP分析采用不同的方法来查看先前报告的SNP以及新的候选者。用户必须提供已知SNP的列表以及读数和参考序列。GSNAP对所有主要和次要等位基因执行SNP耐受比对。该算法能够区分次要等位基因和不匹配。结果以综合报告形式呈现。您还可以在平板电脑中查看结果。

 

 

Methylation Studies

几十年来,DNA甲基化一直被认为在基因表达中发挥着重要作用。当DNA用亚硫酸氢盐处理时,任意胞嘧啶都会转化为尿嘧啶,除非胞嘧啶已被甲基化。GSNAP将从亚硫酸氢盐处理的DNA测序中获取的下一代测序读数与参考序列进行比对,其比对方式不会掩盖真正的错配,但仍会暴露用亚硫酸氢盐处理未甲基化DNA时发生的C到T错配。

 

 

RNA耐受比对

GSNAP已更新,现在包含A到G的容忍对齐模式。如果您的mRNA可能已被ADAR基因编辑,导致腺苷转化为肌苷,请使用此模式。测序时I被视为G。

 

该版本还引入了链链和非链模式,用于新的RNA耐受模式和甲基化分析。当您的实验室方案允许 5' 到 3' 基因组读取及其每条链上的反向互补时,请使用非链模式。

 

 

Viewers

Tablet是用于下一代序列比对的高性能查看器。在多种不同模式下查看和检查您的Maq、GSNAP、BWA-MEM或Velvet结果,以不同颜色突出显示碱基并读取方向。获取有关单个读数和读数对的信息,并安排读数的堆叠以揭示配对。平板电脑具有用于启用翻译、放大和缩小以及突出显示变体碱基的控件,使您可以轻松探索阅读内容。

 

 

 

 

查看Sequencher软件详情

热门产品

2023-08-30 13:44
首页    技术文档    DNA序列分析软件Sequencher的Next-Generation Sequencing功能