Nouveaux composants à la périphérie des ...
Document type :
Thèse
Title :
Nouveaux composants à la périphérie des outils d'assemblages des génomes long read.
English title :
Novel components at the periphery of long read genome assembly tools
Author(s) :
Thesis director(s) :
Jean-Stéphane Varré
Defence date :
2019-12-02
Jury president :
Rayan Chikhi [Co-encadrant]
Tobias Marschall [Rapporteur]
Marie-France Sagot [Rapportrice]
Blerina Sinaimeri [Examinateur]
Clarisse Dhaenens [Examinatrice]
Pierre Peterlongo [Examinateur]
Tobias Marschall [Rapporteur]
Marie-France Sagot [Rapportrice]
Blerina Sinaimeri [Examinateur]
Clarisse Dhaenens [Examinatrice]
Pierre Peterlongo [Examinateur]
Jury member(s) :
Rayan Chikhi [Co-encadrant]
Tobias Marschall [Rapporteur]
Marie-France Sagot [Rapportrice]
Blerina Sinaimeri [Examinateur]
Clarisse Dhaenens [Examinatrice]
Pierre Peterlongo [Examinateur]
Tobias Marschall [Rapporteur]
Marie-France Sagot [Rapportrice]
Blerina Sinaimeri [Examinateur]
Clarisse Dhaenens [Examinatrice]
Pierre Peterlongo [Examinateur]
Accredited body :
University of Lille
Keyword(s) :
Assemblage de génomes
Troisième generation de séquençage
Graphes d'assemblage
Troisième generation de séquençage
Graphes d'assemblage
English keyword(s) :
Third generation sequencing
Assembly graphs
Genome assembly
Assembly graphs
Genome assembly
HAL domain(s) :
Informatique [cs]
Informatique [cs]/Bio-informatique [q-bio.QM]
Informatique [cs]/Bio-informatique [q-bio.QM]
French abstract :
Le séquençage de l'information génétique a permis de mieux comprendre un grande nombre de phénomènes biologiques, maladies génétiques, évènements de spéciations, mécanismes fondamentaux du fonctionnement de nos cellules. ...
Show more >Le séquençage de l'information génétique a permis de mieux comprendre un grande nombre de phénomènes biologiques, maladies génétiques, évènements de spéciations, mécanismes fondamentaux du fonctionnement de nos cellules. Les techniques de séquençage ont beaucoup évolué depuis la méthode de Sanger (1977). De nos jours, les technologies de séquençage de troisième génération permettent le séquençage d'un génome complet à moindre coût, produisent des lectures (fragments de genomes) plus longs, mais nécessitent la création d'outils d'assemblage spécifiques pour tenir compte d'un taux d'erreur élevé dans les lectures produites.L'étude des méthodes utilisées par les outils d'assemblage de lectures de troisième génération a permis d'observer que des améliorations des assemblages étaient possibles sans toutefois modifier les outils eux-mêmes. Certaines améliorations sont proposées dans ce travail de thèse, et sont mises en œuvre à travers des outils proposés à la communauté. yacrd et fpa interviennent en amont de l'assemblage en lui-même pour améliorer l'ensemble des lectures données en entrée à un assembleur. knot analyse et combine le résultat d'un assemblage avec les données brutes, pour donner des pistes permettant d'améliorer l'assemblage final.Show less >
Show more >Le séquençage de l'information génétique a permis de mieux comprendre un grande nombre de phénomènes biologiques, maladies génétiques, évènements de spéciations, mécanismes fondamentaux du fonctionnement de nos cellules. Les techniques de séquençage ont beaucoup évolué depuis la méthode de Sanger (1977). De nos jours, les technologies de séquençage de troisième génération permettent le séquençage d'un génome complet à moindre coût, produisent des lectures (fragments de genomes) plus longs, mais nécessitent la création d'outils d'assemblage spécifiques pour tenir compte d'un taux d'erreur élevé dans les lectures produites.L'étude des méthodes utilisées par les outils d'assemblage de lectures de troisième génération a permis d'observer que des améliorations des assemblages étaient possibles sans toutefois modifier les outils eux-mêmes. Certaines améliorations sont proposées dans ce travail de thèse, et sont mises en œuvre à travers des outils proposés à la communauté. yacrd et fpa interviennent en amont de l'assemblage en lui-même pour améliorer l'ensemble des lectures données en entrée à un assembleur. knot analyse et combine le résultat d'un assemblage avec les données brutes, pour donner des pistes permettant d'améliorer l'assemblage final.Show less >
English abstract : [en]
The sequencing of genetic information provides better understanding for a large number of biological phenomena: e.g. genetic diseases, speciation events, fundamental mechanisms of cell function. Sequencing techniques have ...
Show more >The sequencing of genetic information provides better understanding for a large number of biological phenomena: e.g. genetic diseases, speciation events, fundamental mechanisms of cell function. Sequencing techniques have considerably evolved since the Sanger method (1977). Nowadays third-generation sequencing technologies greatly reduce the costs of sequencing complete genomes. They produce longer reads (sequence fragments), but require the design of specific assembly tools that take into account the high error rates in the produced fragments.The study of methods used by third-generation read assembly pipelines has revealed that improvements in assembly were possible without modifying assembly tools themselves. Some improvements are thus proposed in this thesis work, and were implemented through publicly available tools. yacrd and fpa pre-process the set of reads prior to assembly, in order to improve efficiency and quality of the assembly process. knot combines information from both the input reads and an assembly, in order to provide insights on how to improve the contiguity of an assembly.Show less >
Show more >The sequencing of genetic information provides better understanding for a large number of biological phenomena: e.g. genetic diseases, speciation events, fundamental mechanisms of cell function. Sequencing techniques have considerably evolved since the Sanger method (1977). Nowadays third-generation sequencing technologies greatly reduce the costs of sequencing complete genomes. They produce longer reads (sequence fragments), but require the design of specific assembly tools that take into account the high error rates in the produced fragments.The study of methods used by third-generation read assembly pipelines has revealed that improvements in assembly were possible without modifying assembly tools themselves. Some improvements are thus proposed in this thesis work, and were implemented through publicly available tools. yacrd and fpa pre-process the set of reads prior to assembly, in order to improve efficiency and quality of the assembly process. knot combines information from both the input reads and an assembly, in order to provide insights on how to improve the contiguity of an assembly.Show less >
Language :
Anglais
Collections :
Source :
Files
- https://tel.archives-ouvertes.fr/tel-02441360/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-02441360/document
- Open access
- Access the document
- https://tel.archives-ouvertes.fr/tel-02441360/document
- Open access
- Access the document
- document
- Open access
- Access the document
- Th_se.pdf
- Open access
- Access the document