Phylometrics

A diagram explaining the applicationphylometics提供了一种新的数据挖掘方法来筛选提供的DNA序列,并使用强大的分析工具识别具有重要系统发育意义的序列。被识别为与许多已提供的序列相似的序列可以提供对它们的功能或进化关系的关键见解。用户需要与浏览大多数互联网应用程序相同的基本计算机技能。

总结

我们开发了一个web应用程序,Phylometrics,它依赖于集体BLASTN结果网络(而不是单个BLASTN命中),以自动化,高通量的方式促进构建系统发育树的过程,同时提供新颖的工具,以最小的人类参与来寻找具有重要系统发育兴趣的序列。该应用程序可以在实验室本地安装,也可以远程托管,它使用简单的向导式格式来指导用户通过管道,而不需要编程背景。此外,Phylometrics实现了一个独立的作业排队系统,使用户能够在作业运行时继续使用系统,而性能几乎没有下降。

背景

16S rRNA基因的比较序列分析常用来表征环境样品的微生物多样性。然而,由于许多因素,包括不相等的变化率和收敛率,序列相似性并不总是意味着功能或进化上的相关性。因此,依靠顶级BLASTN命中进行系统发育研究可能会歪曲这些成分的多样性。此外,试图通过在一个树中包含每个序列的大量BLASTN命中来探索它们的相关性来规避这个问题会带来其他问题。例如,如果不依赖于手动对齐,那么多序列对齐将是很差的,并且计算成本很高,并且可能很难从结果树中获得有意义的关系。然而,在集体BLASTN结果中分析序列关系网络,揭示了尽管低秩但密切相关的序列。

出版

http://www.biomedcentral.com/1471-2105/11/S6/S18