Djerroud, Samia (2021). Extension des fonctionnalités de la base de données ribogap pour la découverte de nouvelles structures d’ARN noncodants Mémoire. Québec, Université du Québec, Institut national de la recherche scientifique, Maîtrise en Microbiologie Appliquée, 211 p.
Prévisualisation |
PDF
- Version publiée
Télécharger (14MB) | Prévisualisation |
Résumé
Les riboswitchs sont des éléments régulateurs localisés en 5′ UTR de l’ARNm des gènes qu’ils contrôlent. Pour découvrir de nouveaux riboswitchs et autres ARN noncodants (ARNnc), nous avons opté pour une approche bio-informatique car des méthodes expérimentales, bien qu’essentielles pour confirmer les découvertes, seraient très couteuses et longues si elles devaient être appliquées à l’analyse de toutes les régions intergéniques. D’où la nécessité d’utiliser la bio-informatique en s’appuyant sur la génomique comparative comme étape primaire pour trier les différents candidats.
La méthode bio-informatique consiste en première étape à extraire toutes les régions intergéniques en lien avec un ligand choisi. Pour ce faire j’ai conçu deux bases de données : RiboGap v2 pour les génomes complets (génomes séquencés entièrement) et RiboGap v2.1 pour les génomes incomplets (séquencés partiellement). Ces deux bases de données regroupent les séquences codantes, régions intergéniques, ARNnc, terminateurs Rho dépendants, terminateurs Rho indépendants et prédictions de potentiels promoteurs à partir des génomes complets et incomplets. La deuxième étape de la méthode bio-informatique consiste à exécuter la suite GraphClust sur les régions extraites qui permet la détection des similitudes entre les structures secondaires d’ARN en se basant sur l’alignement des structures des séquences d’ARN. Nous avons choisi le second messager ppGpp comme cible prometteuse de riboswitchs hypothétiques. Les séquences en amont de gènes associés à cette molécule signal ont donc été extraites pour notre étude de génomique comparative.
Riboswitches are regulatory elements located in the 5′ UTR of the mRNA of the genes they control. To discover new riboswitches and other non-coding RNAs (ncRNAs), we opted for a bioinformatics approach because an experimental method, although essential to confirm the discoveries, would be prohibitively expensive and long if used to analyze all the intergenic regions. Hence the need to use comparative genomics in bioinformatics as a primary step to sort out the different candidates.
The bioinformatics method consists in a first step to extract all the intergenic regions linked to a chosen ligand. For this purpose, I designed two databases: RiboGap v2 for complete genomes (fully sequenced genomes) and RiboGap v2.1 for incomplete genomes (partially sequenced). These two databases group coding sequences, intergenic regions, ncRNAs, Rho-dependent terminators, Rho-independent terminators and putative promoter predictions from complete and incomplete genomes. The second step of the bioinformatics method is to run the GraphClust suite on the extracted regions which allows the detection of similarities between RNA secondary structures based on the alignment of RNA sequence structures. We chose the second messenger ppGpp as a promising target of hypothetical riboswitches. Upstream sequences of genes associated with this signal molecule were therefore extracted for our comparative genomics study.
Type de document: | Thèse Mémoire |
---|---|
Directeur de mémoire/thèse: | Perreault, Jonathan |
Mots-clés libres: | séquences codantes; régions intergéniques; terminateurs; promoteurs; opérons; ARN noncodants; riboswitchs; GraphClust; génomique comparative; coding sequences; intergenic regions; terminators; promoters; operons; noncoding RNAs; comparative genomics |
Centre: | Centre INRS-Institut Armand Frappier |
Date de dépôt: | 02 juill. 2024 13:49 |
Dernière modification: | 02 juill. 2024 13:49 |
URI: | https://espace.inrs.ca/id/eprint/15700 |
Gestion Actions (Identification requise)
Modifier la notice |