USEARCH:快速的序列数据库搜索工具

 

USEARCH算法专门用于在数据库中搜寻全球较优或前列较佳匹配。它与传统的搜索算法(例如BLAST)有显著区别,BLAST采用局部比对方式,并报告在特定E值阈值下的所有匹配。

 

USEARCH算法的优点包括其极高的速度,远超BLAST,同时由于大多数应用仅关注较佳匹配或前几位佳匹配,因此大幅减少了数据输出量。另外,在某些应用场景下,比如在分类分配中,全局比对相较于可能产生误导性高相似度短匹配的局部比对,能提供更准确的生物学预测。

 

USEARCH算法通过usearch_global指令来实施。同样提供了局部比对版本(usearch_local),但在实践中较少应用。对于特别大的数据库,如序列数超过100万或FASTA文件大小超过1Gb,USEARCH可能不太适用。在处理庞大数据库时,即便需要全球较优匹配,也建议使用UBLAST。

 

对于USEARCH和UBLAST指令,它们接受的参数提供了丰富的选择,以便筛选匹配结果。

 

 

查看USEARCH软件详情

热门产品

2023-12-01 17:30
首页    技术文档    USEARCH:快速的序列数据库搜索工具