Compareads: comparing huge metagenomic experimentsReport as inadecuate




Compareads: comparing huge metagenomic experiments - Download this document for free, or read online. Document in PDF available to download.

* Corresponding author 1 GenScale - Scalable, Optimized and Parallel Algorithms for Genomics Inria Rennes – Bretagne Atlantique , IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE

Abstract : Nowadays, metagenomic sample analyses are mainly achieved by comparing them with a priori knowledge stored in data banks. Even if powerful, such approaches do not allow to exploit unknown and-or -unculturable- species, for instance estimated at 99% for Bacteria. This work introduces Compareads, a de novo comparative metagenomic approach that returns the reads that are similar between two possibly metagenomic datasets generated by High Throughput Sequencers. One originality of this work consists in its ability to deal with huge datasets. The time and memory features make Compareads usable on read sets each composed of more than 100 million Illumina reads in a few hours and consuming 4Gb of memory, and thus usable on today-s personal computers. Compareads is released under the CeCILL license and can be freely downloaded from http:-alcovna.genouest.org-compareads-.

Résumé : De nos jours, les analyses de séquences métagénomiques sont principalement menées par comparaison avec les connaissances des bases de données biologiques. Bien que puissantes, ces approches ne permettent pas d-étudier les espèces inconnues et-ou non-cultivables, estimées à 99% chez les bactéries. Ce poster présente Compareads, une approche de métagénomique comparative de novo qui permet de trouver les lectures similaires entre deux jeux de données métagénomique générés par les NGS. Une des originalités de cette approche est la possibilité d-analyser de très grands jeux de données. L-efficacité en temps et en mémoire de Compareads permet de traiter des jeux de données composés de plusieurs centaines de millions de lecture Illumina en quelques heures, en utilisant 4Go de mémoire. Ces performances rendent l-outil utilisable sur les ordinateurs portables actuels. Compareads est disponible sous licence CeCILL et peut être gratuitement téléchargé à l-adresse suivante : http:-alcovna.genouest.org-compareads-

keyword : NGS Bloom Filter metagenomics





Author: Nicolas Maillet - Claire Lemaitre - Rayan Chikhi - Dominique Lavenier - Pierre Peterlongo -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents