Pour voir les autres types de publications sur ce sujet consultez le lien suivant : Séquençage à haut débit.

Thèses sur le sujet « Séquençage à haut débit »

Créez une référence correcte selon les styles APA, MLA, Chicago, Harvard et plusieurs autres

Choisissez une source :

Consultez les 50 meilleures thèses pour votre recherche sur le sujet « Séquençage à haut débit ».

À côté de chaque source dans la liste de références il y a un bouton « Ajouter à la bibliographie ». Cliquez sur ce bouton, et nous générerons automatiquement la référence bibliographique pour la source choisie selon votre style de citation préféré : APA, MLA, Harvard, Vancouver, Chicago, etc.

Vous pouvez aussi télécharger le texte intégral de la publication scolaire au format pdf et consulter son résumé en ligne lorsque ces informations sont inclues dans les métadonnées.

Parcourez les thèses sur diverses disciplines et organisez correctement votre bibliographie.

1

Ric, Audrey Marie Amélie. « Caractérisation d'aptamères par électrophorèse capillaire couplée au séquençage haut-débit Illumina ». Thesis, Toulouse 3, 2017. http://www.theses.fr/2017TOU30388/document.

Texte intégral
Résumé :
Les aptamères sont des oligomères d'ADN ou d'ARN simple brin qui, en se repliant sous forme de structures tridimensionnelles peuvent avoir des interactions fortes et spécifiques envers un certain nombre de cibles. L'objectif de cette thèse a été de compléter les études existantes sur l'utilisation de l'électrophorèse capillaire (CE) et les aptamères afin de mettre au point une méthode de sélection d'aptamères par CE couplée à la fluorescence induite par laser et le séquençage haut-débit Illumina. Dans un premier temps, nous avons mis au point une méthode de détection et de séparation par électrophorèse capillaire couplée à la double détection UV-LEDIF d'une banque d'ADN en interaction avec une cible : la thrombine. C'est un modèle déjà étudié pour lequel deux aptamères ont fait l'objet de publications. Nous avons utilisé l'aptamère T29 dans le cadre de notre étude car c'est celui qui présente la meilleure affinité. L'électrophorèse capillaire est un puissant outil analytique qui facilite l'efficacité de sélection des aptamères et précise la détermination des paramètres d'interactions. Nous avons ainsi pu déterminer la constante d'affinité KD par CE-UV-LEDIF sur le modèle de base : la thrombine. Par ailleurs, nous montrons également comment l'utilisation du tampon Tris peut dégrader un ADN simple brin en électrophorèse capillaire et nous proposons comme alternative l'utilisation d'un tampon sodium phosphate dibasique qui évite ce phénomène de dégradation. Enfin, nous expliquons la difficulté d'amplification par qPCR et PCR d'un aptamère comme le T29 ayant une structure en G-quadruplex. Nous avons montré que le séquençage haut-débit Illumina nous a permis de trouver une corrélation entre le nombre de molécules séquencées et le nombre de séquences obtenues. L'analyse des séquences obtenues montre une quantité importante (20%) de séquences de T29 qui ne correspondent pas à la séquence de cet aptamère. Cela prouve que les étapes de PCR et de séquençage haut débit pour la détection de G-quadruplex peuvent induire un biais dans l'identification de ces molécules
Aptamers are oligomers of small single-stranded DNA or RNA which can have strong and specific interactions with some targets when they fold into three-dimensional structures. The objective of this thesis was to complete existing studies on the use of capillary electrophoresis in order to develop a method for the selection of aptamers by CE coupled to laser induced fluorescence and Illumina high-throughput sequencing. In a first step, we developed a method of detection and separation by capillary electrophoresis coupled with the double detection UV-LEDIF of a DNA library interacting with a target: thrombin. It is a model already studied and for which two aptamers have been published. We used aptamer T29 as part of our study because it has the best affinity. Capillary Electrophoresis is a powerful analytical tool that facilitates the selection efficiency of aptamers and specifies the determination of the interaction parameters. We thus were able to determine the affinity constant KD by CE-UV-LEDIF on the basic model: thrombin. Moreover, we also show how the use of Tris buffer can degrade single-stranded DNA during capillary electrophoresis and we propose as an alternative the use of a dibasic sodium phosphate buffer which avoids the phenomenon of degradation. Finally, we explain the difficulty of amplification by qPCR and PCR of an aptamer such as T29 with a G-quadruplex structure. We showed that the Illumina high-throughput sequencing allowed us to find a correlation between the number of sequenced molecules and the number of sequences obtained. Analysis of the sequences obtained shows a significant amount (20%) of T29 sequences which do not correspond to the sequence of this aptamer. This shows that the PCR and high-throughput sequencing steps for the detection of G-quadruplex can induce bias in the identification of these molecules
Styles APA, Harvard, Vancouver, ISO, etc.
2

Kopylova, Evguenia. « Algorithmes bio-informatiques pour l'analyse de données de séquençage à haut débit ». Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2013. http://tel.archives-ouvertes.fr/tel-00919185.

Texte intégral
Résumé :
Nucleotide sequence alignment is a method used to identify regions of similarity between organisms at the genomic level. In this thesis we focus on the alignment of millions of short sequences produced by Next-Generation Sequencing (NGS) technologies against a reference database. Particularly, we direct our attention toward the analysis of metagenomic and metatranscriptomic data, that is the DNA and RNA directly extracted for an environment. Two major challenges were confronted in our developed algorithms. First, all NGS technologies today are susceptible to sequencing errors in the form of nucleotide substitutions, insertions and deletions and error rates vary between 1-15%. Second, metagenomic samples can contain thousands of unknown organisms and the only means of identifying them is to align against known closely related species. To overcome these challenges we designed a new approximate matching technique based on the universal Levenshtein automaton which quickly locates short regions of similarity (seeds) between two sequences allowing 1 error of any type. Using seeds to detect possible high scoring alignments is a widely used heuristic for rapid sequence alignment, although most existing software are optimized for performing high similarity searches and apply exact seeds. Furthermore, we describe a new indexing data structure based on the Burst trie which optimizes the search for approximate seeds. We demonstrate the efficacy of our method in two implemented software, SortMeRNA and SortMeDNA. The former can quickly filter ribosomal RNA fragments from metatranscriptomic data and the latter performs full alignment for genomic and metagenomic data.
Styles APA, Harvard, Vancouver, ISO, etc.
3

Kopylova, Evguenia. « Algorithmes bio-informatiques pour l’analyse de données de séquençage à haut débit ». Thesis, Lille 1, 2013. http://www.theses.fr/2013LIL10181/document.

Texte intégral
Résumé :
Les algorithmes d'alignement sont au coeur de l'analyse de séquences en bio-informatique. Dans cette thèse, nous nous focalisons sur le problème de l'alignement de lectures, des millions de courtes séquences produites par les séquenceurs de nouvelle génération (NGS) en particulier pour l'analyse de données de métatranscriptome et de métagénome en biodiversité. Pour cela, il y a deux types de difficulté. Le premier est que toutes les technologies NGS entrainent des erreurs de séquençage, telles que substitutions, insertions et suppressions de nucléotides. Le second est que les échantillons métagénomique peuvent contenir des centaines d'organismes inconnus et que leur analyse demande de procéder à des alignements avec des d'espèces possiblement distantes. Pour résoudre ces problèmes, nous avons développé un nouvel algorithme d'alignement reposant sur des graines avec erreurs. Cela amène un gain en sensibilité par rapport aux logiciels existants optimisés pour le problème du reséquençage, avec des similarités élevées et qui se fondent sur des graines exactes. Nous proposons également une nouvelle méthode d'indexation basée sur le Burst trie qui permet d'optimiser la recherche avec les graines avec erreurs. Nous montrons l'efficacité de nos méthodes dans deux nouveaux outils, SortMeRNA pour l'identification d'ARN ribosomiques dans des données de métatranscriptome, et SortMeDNA pour l'alignement de lectures en génomique et métagénomique
Sequence alignment algorithms are at the heart of bioinformatic sequence analysis. In this thesis we focus on the alignment of millions of short sequences produced by Next-Generation Sequencing (NGS) technologies in particular for the analysis of metagenomic and metatranscriptomic data, that is the DNA and RNA directly extracted for an environment. Two major challenges were confronted in our developed algorithms. First, all NGS technologies today are susceptible to sequencing errors in the form of nucleotide substitutions, insertions and deletions. Second, metagenomic samples can contain hundreds of unknown organisms and the standard approach to identifying them is to align against known closely related species. To overcome these challenges we designed a new approximate matching technique based on the universal Levenshtein automaton which quickly locates short regions of similarity (seeds) between two sequences allowing 1 error of any type. Using seeds to detect possible high scoring alignments is a widely used heuristic for rapid sequence alignment, although most existing software are optimized for performing high similarity searches and apply exact seeds. Furthermore, we describe a new indexing data structure based on the Burst trie which optimizes the search for approximate seeds. We demonstrate the efficacy of our method in two implemented software, SortMeRNA and SortMeDNA. The former can quickly filter ribosomal RNA fragments from metatranscriptomic data and the latter performs full alignment for genomic and metagenomic data
Styles APA, Harvard, Vancouver, ISO, etc.
4

Latypova, Martin Xénia. « Etude fonctionnelle de variants identifiés par séquençage haut-débit : apports et perspectives ». Thesis, Nantes, 2018. http://www.theses.fr/2018NANT1024.

Texte intégral
Résumé :
Les avancées technologiques offrent des opportunités sans précédents à la détection de variations génétiques. L’interprétation de l’information génétique grâce à l’utilisation d’organismes modèles fournit des données essentiellesà l’interprétation de ces variants en génétique médicale. Les pathologies neurodéveloppementales, incluant la déficience intellectuelle et les troubles du spectre autistique, représentent un défi pour l’analyse de variants de séquence du fait de la forte hétérogénéité de locus, la contribution étiologique majeure des variations de novo et les difficultés d’accès aux types cellulaires d’intérêt pour les analyses fonctionnelles. Utilisant des phénotypes anatomiques de substitution, nous avons mis en place et validé deux modèles poisson zèbre de pathologies neurodéveloppementales pour les gènes RORA et SIN3B. La détermination de la direction d’effet de variants non synonymes grâce au modèle poisson zèbre mise en parallèle de données radiologiques et cliniques a permis de définir deux sous-types nosologiques pour le gène RORA, selon la présence ou l’absence de lésions cérébelleuses. De plus, nous avons apporté des informations en faveur de la causalité étiologique de variants de SIN3B chez des patients atteints de déficience intellectuelle associée à un autisme syndromique en montrant des anomalies de mise en place de la structure cranio-faciale suite à l’inactivation du gène orthologue chez le poisson zèbre. Confirmant la haute valeur ajoutée du poisson zèbre pour modéliser les variations génétiques chez des patients atteints de pathologies neurodéveloppementales, ce travail souligne la particulière informativité de cette stratégie en médecine génomique
Technological advances have opened unparalleled opportunities to detect genetic variation. Interpretation of these datausing in vivo disease modeling approaches provides helpful input to inform Medical Genetics clinical practice. Neurodevelopmental disorders, including intellectual disability and autism spectrum disorder, pose a major challengefor genomic data interpretation and disease modeling, given the extensive locus heterogeneity, high contribution of de novo variation to etiologic burden and low accessibility of cell types of interest. Using anatomical surrogate phenotypes in zebrafish, we established relevance to disease and tested pathogenicity of point mutations in novel neurodevelopmental disease causing genes RORA and SIN3B. First, we categorized the RORA-associated disorder in two clinical subtypes depending on the presence of cerebellar features present in addition to intellectual disability and autism spectrum disorder. Nonsynonymous variant testing in zebrafish indicated that there was a diverse direction of variant effect, which was consistent with the clinical subtypes observed. Additionally, we supported SIN3B involvement in a syndromic intellectual disability syndrome by demonstrating that disruption of craniofacial architecture, a comorbid feature, was caused by sin3b targeting in zebrafish. This work highlights the utility of the zebrafish model organism as an informative experimental tool for variant interpretation in genomic medicine, especially in neurodevelopmental disorders
Styles APA, Harvard, Vancouver, ISO, etc.
5

Vervier, Kevin. « Méthodes d’apprentissage structuré pour la microbiologie : spectrométrie de masse et séquençage haut-débit ». Thesis, Paris, ENMP, 2015. http://www.theses.fr/2015ENMP0081/document.

Texte intégral
Résumé :
L'utilisation des technologies haut débit est en train de changer aussi bien les pratiques que le paysage scientifique en microbiologie. D'une part la spectrométrie de masse a d'ores et déjà fait son entrée avec succès dans les laboratoires de microbiologie clinique. D'autre part, l'avancée spectaculaire des technologies de séquençage au cours des dix dernières années permet désormais à moindre coût et dans un temps raisonnable de caractériser la diversité microbienne au sein d'échantillons cliniques complexes. Aussi ces deux technologies sont pressenties comme les piliers de futures solutions de diagnostic. L'objectif de cette thèse est de développer des méthodes d'apprentissage statistique innovantes et versatiles pour exploiter les données fournies par ces technologies haut-débit dans le domaine du diagnostic in vitro en microbiologie. Le domaine de l'apprentissage statistique fait partie intégrante des problématiques mentionnées ci-dessus, au travers notamment des questions de classification d'un spectre de masse ou d'un “read” de séquençage haut-débit dans une taxonomie bactérienne.Sur le plan méthodologique, ces données nécessitent des développements spécifiques afin de tirer au mieux avantage de leur structuration inhérente: une structuration en “entrée” lorsque l'on réalise une prédiction à partir d'un “read” de séquençage caractérisé par sa composition en nucléotides, et un structuration en “sortie” lorsque l'on veut associer un spectre de masse ou d'un “read” de séquençage à une structure hiérarchique de taxonomie bactérienne
Using high-throughput technologies is changing scientific practices and landscape in microbiology. On one hand, mass spectrometry is already used in clinical microbiology laboratories. On the other hand, the last ten years dramatic progress in sequencing technologies allows cheap and fast characterization of microbial diversity in complex clinical samples. Consequently, the two technologies are approached in future diagnostics solutions. This thesis aims to play a part in new in vitro diagnostics (IVD) systems based on high-throughput technologies, like mass spectrometry or next generation sequencing, and their applications in microbiology.Because of the volume of data generated by these new technologies and the complexity of measured parameters, we develop innovative and versatile statistical learning methods for applications in IVD and microbiology. Statistical learning field is well-suited for tasks relying on high-dimensional raw data that can hardly be used by medical experts, like mass-spectrum classification or affecting a sequencing read to the right organism. Here, we propose to use additional known structures in order to improve quality of the answer. For instance, we convert a sequencing read (raw data) into a vector in a nucleotide composition space and use it as a structuredinput for machine learning approaches. We also add prior information related to the hierarchical structure that organizes the reachable micro-organisms (structured output)
Styles APA, Harvard, Vancouver, ISO, etc.
6

Haidar, Zahraa. « Identification de gènes responsables de maladies neurologiques héréditaires par séquençage à haut débit ». Thesis, Aix-Marseille, 2019. http://www.theses.fr/2019AIXM0662.

Texte intégral
Résumé :
Mes travaux de thèse, réalisés en cotutelle entre l’Université Saint-Joseph au Liban et l’Université d’Aix Marseille en France, ont consisté à identifier des gènes impliqués dans des maladies génétiques rares à transmission autosomique récessive, en particulier des maladies neurologiques, dans des familles consanguines libanaises. Les maladies neurologiques constituent un groupe de maladies caractérisées par un défaut de structure et de fonction des différentes régions du système nerveux central et périphérique. Ainsi, j’ai cherché à identifier le défaut moléculaire à l’origine des pathologies étudiées, par l’utilisation du séquençage à haut débit (NGS) (exome, génome). Dans un premier temps, j’ai effectué l’analyse bioinformatique des données issues de NGS, ainsi que la confirmation, par séquençage Sanger, et la ségrégation familiale des variants candidats identifiés. Dans certaines maladies, pour lesquelles une nouvelle mutation ou un nouveau gène ont pu être identifiés, j’ai réalisé des analyses fonctionnelles plus poussées afin de démontrer les mécanismes physiopathologiques enjeu
My work is a joint PhD between Saint Joseph University in Beirut (Lebanon) and Aix Marseille University in Marseille (France). My PhD project aims at identifying genes responsible for rare neurological diseases by next-generation sequencing (NGS) in consanguineous Lebanese families. Neurological diseases are characterized by extensive phenotypic and genetic heterogeneity, and affect the structure and function of different regions of the central and peripheral nervous system.During my PhD work, I have studied several of these families, trying to identify the molecular basis of the studied disease, using NGS technologies. First, I performed the bioinformatics analysis of the exome and genome data, as well as the segregation by Sanger sequencing, and the family segregation of the candidate variants identified by NGS. In some diseases, for which a new mutation or gene has been identified; I have carried out more functional studies, in order to understand the physiopathological mechanisms bases
Styles APA, Harvard, Vancouver, ISO, etc.
7

Becmeur-Lefebvre, Mathilde. « Identification de nouveaux genes responsables d'anomalies du développement par séquençage haut débit d'exome ». Thesis, Bourgogne Franche-Comté, 2019. http://www.theses.fr/2019UBFCK080.

Texte intégral
Résumé :
Dans les syndromes polymalformatifs, les causes génétiques sont fréquentes, avec un risque éventuel de récidive, à l’origine d’une très forte demande de conseil génétique. La stratégie diagnostique actuelle (examen foetopathologique, cytogénétique et examens ciblés de biologie moléculaire) ne permet un diagnostic étiologique que dans environ un tiers des familles concernées. Depuis la mise en place du séquençage haut débit d’exome (ES), les bases moléculaires de nombreux nouveaux syndromes ont pu être identifiées.Notre objectif a été d’étudier l’apport du ES en solo dans l’identification de nouveaux gènes impliqués dans le développement embryonnaire chez des fœtus atteints de syndromes polymalformatifs non étiquetés après la stratégie diagnostique classique grâce à une stratégie d’analyse de l’ES multiétapes originale.Nous avons réalisé un ES solo chez 95 fœtus polymalformés provenant de 10 centres de diagnostic prénatal en France. L’analyse reposait dans un premier temps sur l’étude des gènes OMIM morbides grâce à des scores bioinformatiques et la présence des variations dans des bases de données, indépendamment du phénotype foetal, puis sur une étape de corrélations génotype-phénotype. Enfin, une analyse recherche basée sur les scores bioinformatiques étendue à l’ensemble de l’ES. La confirmation des variations et leur ségrégation parentale ont été réalisées par séquençage Sanger.L’ES a permis d’identifier une/des variation(s) causale(s) chez 23 fœtus (24%), des variations de signification inconnue (VUS) chez 6 fœtus (6%) et des variations dans des gènes candidats chez 6 fœtus (6%). Parmi les variations causales, la majorité était de transmission autosomique récessive (50%), 42% étaient de survenue sporadique et 4% de transmission autosomique dominante.En conclusion, l’efficacité du ES en solo (stratégie classique et additionnelle) pour identifier de nouveaux gènes du développement est faible, mais il permet d’étendre les spectres phénotypiques de pathologie pédiatrique connues. Une analyse des cas négatif en trio voire en génome est maintenant une piste à explorer
Multiple congenital anomalies (MCA) are often genetic conditions, with a risk of recurrence. The etiologic diagnosis of these conditions in fetuses is mandatory to allow genetic counseling for the future pregnancies. Regarding current diagnostic tests (fetal autopsy, cytogenetic test and targeted molecular tets), the diagnostic rate in MCA fetuses is about 30%, allowing genetic counselling in only one third of families. Exome sequencing (ES) has allowed to identify the molecular basis of many new syndromes.We aimed to assess the contribution of ES solo-based strategy to identify new developmental genes in fetuses presenting with MCA without etiological diagnosis after standard investigations with an original multistep strategy.We performed solo ES in 95 MCA fetuses from 10 prenatal diagnostic centers in France. First, we focused on OMIM related disease genes, with a first step using bioinformatic scores and public databases independently of phenotype, a second step using genotype-phenotype correlation and a third step of research analysis extended to the whole exome. Variant confirmation and parental segregation were done by Sanger sequencing. ES allowed the identification of a causative variants in 23 fetuses (24%), variants of unknown significance (VUS) in 7 fetuses (7%) and variants in new candidate genes in 6 fetuses (6%). Among causative variants, most were from autosomal recessive inheritance (50%), 42% were sporadic and 4% were from autosomal dominant inheritance. The additionnal strategy identified 17/23 causative variants, including 2 new causative variants not identified by the classical approach because of atypical or extreme fetal phenotype, and 2 new VUS. No new candidate gene was identified by this strategy.To conclude, solo ES with classical and additionnal strategy presents a low efficiency to identify new genes implicated in embryonary development but allows the extension of the clinical spectrum of well-known pediatric pathologies to the prenatal period. Trio ES or genome sequencing would be now insteresting strategies to be explored
Styles APA, Harvard, Vancouver, ISO, etc.
8

Mersch, Marjorie. « Analyse de la méthylation de l'ADN par séquençage haut-débit chez la Poule ». Thesis, Toulouse, INPT, 2018. http://www.theses.fr/2018INPT0107/document.

Texte intégral
Résumé :
Anticiper l’impact de fluctuations environnementales de nature climatique ou alimentaire est un enjeu crucial dans les systèmes de productions animales, et plus particulièrement sur la volaille. Cette influence de l’environnement sur les phénotypes passe en partie par des phénomènes épigénétiques, notamment la méthylation de l’ADN, et qui peuvent intervenir dans la régulation de l'expression des gènes. Ce sont des mécanismes qui n'affectent pas la séquence d'ADN mais qui peuvent être transmis par la mitose ou la méiose. Ces interactions entre épigénomes et expression des gènes sont de plus en plus étudiées dans les modèles animaux et chez les plantes. Cependant, les mécanismes de régulation de l'expression du génome par la méthylation de l’ADN sont assez peu connus chez les oiseaux. Ce travail de thèse repose sur deux dispositifs expérimentaux réalisés chez la poule, le but étant de caractériser le méthylome par séquençage haut-débit. Les profils de méthylation le long du génome, et le lien avec l’expression, sont établis d’abord par un séquençage tout-génome (WGBS) au sein d’embryons entiers, puis par un séquençage d'une sous-représentation du génome (RRBS) au sein d’hypothalamus d’individus adultes. À ce jour, aucune étude d'analyses de méthylome par RRBS chez la poule n'a été publiée. Ces deux analyses sont réalisées grâce au développement d'un pipeline bioinformatique, optimisé, disponible à la communauté scientifique. Globalement, le profil de méthylation chez la poule est similaire à ce qui est connu chez les mammifères : les îlots CpG - régions riches en dinucléotides CG, souvent peu méthylées, qui ponctuent le génome principalement dans les régions promotrices des gènes - sont globalement peu méthylés dans les promoteurs sur les données WGBS et RRBS. Les analyses du méthylome des embryons ont confirmé l'absence d'un phénomène de compensation de dose sur les chromosomes sexuels, ou la présence sur le chromosome Z d'une région hyperméthylée. Les analyses des données RRBS révèlent une hyperméthylation globale des CG sur le génome, suggérant une réponse de la méthylation à un stress environnemental. Sur les données WGBS, le niveau de méthylation dans le promoteur est négativement corrélé à l'expression du gène associé. Une méthylation allèle spécifique est également détectée entre les lignées, phénomène mis en évidence pour la première fois chez la poule et dont la fréquence est comparable à ce qui a été observé chez l'Homme. Sur les données RRBS, des résultats préliminaires de la réponse du méthylome aux stress environnementaux montrent le caractère complexe de cette relation. L’utilisation d’aliments moins énergétiques entraînerait une plus grande mobilisation des réserves lipidiques, tandis que les individus soumis à un stress à la chaleur ont un poids corporel plus léger. Une intégration de ces données à des mesures phénotypiques permettrait de faire le lien entre méthylation et environnement. Au-delà de l'aspect fondamental de cette thèse, l'application plus concrète de ces connaissances peut s'appliquer aux systèmes d'élevage pour obtenir des animaux mieux adaptés à l’environnement, en améliorant les caractères de production
Anticipating the impact of environmental changes (on climate and feed) is a crucial issue for livestock production systems, including poultry. The influence of the environment on phenotypes is partly mediated by epigenetic phenomena, including DNA methylation, which may be involved in the regulation of gene expression. These mechanisms do not affect the DNA sequence but can be inherited by mitosis or meiosis. The interactions between epigenomes and gene expression are increasingly being studied in animal models and in plants. However, the mechanisms of regulation of genome expression through DNA methylation are relatively unknown in birds. This thesis work is based on two experimental devices realized in chicken aiming to characterize the methylome by high-throughput sequencing. The methylation patterns across the genome, and their link with expression, were first established by whole-genome bisulfite sequencing (WGBS) in whole embryos, following a reduced representation bisulfite sequencing (RRBS) from hypothalamus of adults. To date, no specific chicken RRBS study has been published. These two analyses were carried out by developing an optimized bioinformatics pipeline, available for scientific community. Overall, the pattern of methylation in chicken is like those in mammals: CpG islands - dinucleotides CG-rich regions which are often poorly methylated, and which are found mainly in the promoter regions of the genome - are generally poorly methylated in promoters on WGBS and RRBS data. Embryo methylome analyses confirmed the absence of a dose-compensation phenomenon on sex chromosomes, or the presence of a hypermethylated region on the Z chromosome. The analyses of RRBS data revealed an overall hypermethylation of CGs across the genome, suggesting a methylation response to environmental stress. From the analysis of WGBS data, we found that the level of methylation in promoters was negatively correlated with the expression of the associated gene. For the first time, a specific allele methylation was also detected between chicken lines whose frequency is comparable to that observed in humans. On the RRBS data, preliminary results of the methylome response to environmental stresses showed the complex nature of this relationship. The use of a low-energy diet would led to greater mobilization of body fat, while individuals with heat stress had a lighter body weight. Integrating these data with phenotypic measurements would allow to link methylation and environment. Beyond the fundamental aspect of this thesis, the method developed in this work could be applied to livestock systems to breed animals better adapted to a changing environment, by improving production traits
Styles APA, Harvard, Vancouver, ISO, etc.
9

Fermey, Pierre. « Identification de nouvelles bases moléculaires des cancers précoces par séquençage à haut débit ». Thesis, Normandie, 2017. http://www.theses.fr/2017NORMR110/document.

Texte intégral
Résumé :
Une des plus grandes avancées en cancérologie et en génétique au cours des vingt dernières années fût l'identification des formes héréditaires de cancer et des gènes deprédisposition impliqués. Chez une majorité de patients soupçonnés de présenter une formehéréditaire de cancer, les analyses centrées sur les gènes connus pour être impliqués dansles prédispositions mendéliennes au cancer restent bien souvent négatives. Aujourd'hui,grâce à l'émergence du séquençage à haut-débit (NGS), il est possible de séquencerl'ensemble des exons (exome) d'un individu ou plusieurs centaines de gènes dans un lapsde temps court et à des coûts raisonnables. Dans ce contexte, nous avons appliqué plusieurs stratégies basées sur ces nouveaux outils, avec l'objectif d'identifier de nouvellesbases moléculaires des cancers héréditaires à survenue précoce. Tout d’abord, nous avons employé une stratégie d'analyse exomique intrafamiliale dans une famille atypique présentant des chondrosarcomes de localisation thoracique pour lesquels aucune base moléculaire n'avait pu être mise en évidence. Grâce à cette stratégie, nous avons pu identifier une altération tronquante du gène EXT2 (NM_000401.3; c.237G>A; p.Trp79*). Les altérations perte de fonction documentées pour ce gène sont impliquées dans la maladie des ostéochondromes multiples (OM), des tumeurs bénignes. Or, dans cette famille, aucun signe clinique d'OM n'était présent. Ces travaux nous ont donc permis d'étendre le spectre phénotypique des mutations EXT2 et de modifier la prise en charge clinique de cette famille. Nous avons ensuite employé une stratégie d'analyse exomique soustractive de trio enfant malade / parents sains dans le but d’identifier des mutations de novo potentiellement responsables de la prédisposition génétique au cancer observée chez un jeune patient ayant développé un médulloblastome du cervelet à l’âge de 8 ans, suivi d’un méningiome à 22 ans. L’analyse exomique du trio a révélé l’existence chez ce patient d'une mutation de novo faux-sens affectant un acide aminé très conservé de la protéine HID-1. Cette dernière est particulièrement exprimée dans les cellules neuronales et sécrétrices, et semble fonctionner autour de l’appareil de Golgi pour réguler le tri des vésiculesnouvellement formées. Ainsi, notre hypothèse est qu’un défaut de la protéine HID-1, lié à une mutation du gène HID-1, perturberait la voie de sécrétion et participerait à la genèse du médulloblastome. Ces travaux, toujours en cours, démontrent à la fois la force de la stratégie exomique de trio pour identifier rapidement des mutations de novo et illustre toute la difficultéd'interprétation des variants détectés dans des gènes non impliqués dans le cancer. Par ailleurs, nous avons appliqué une stratégie exomique soustractive et interfamiliale à une cohorte de dix patients ayant développé un corticosurrénalome à un âge très précoce et pour lesquels aucune base moléculaire n'a pu être mise en évidence. Malheureusement, nous n'avons pas pu identifier de nouvelles bases moléculaires du corticosurrénalome de l'enfant par ces techniques. Enfin, sous l'hypothèse que des mutations rares ou privées dans un nombre limité de gènes impliqués dans le cancer contribueraient à des formes héréditaires de cancer, nous avons entrepris un projet visant à séquencer à haut débit 201 gènes fortement impliqués dans le cancer chez des patients ayant développé des tumeurs à un âge pédiatrique. Les premiers résultats de ce projet toujours en cours ont permis de confirmer la robustesse de cette technique et suggèrent une extension phénotypique du spectre des mutations DICER1 ainsi qu'une contribution oligogénique des gènes de réparation de l'ADN dans les tumeurs pédiatriques. L'ensemble de ces résultats seront bientôt compilés au sein d'une base de données et bénéficieront d'une analyse statistique fine avec l'objectif d'identifier des enrichissements en variants rares dans des gènes ou voies biologiques
One of the greatest advances in oncology and genetics over the past 20 years has been the identification of hereditary forms of cancer and of the cancer genes. Nevertheless, in a majority of patients suspected to present an inherited form of cancer, analyses of the genes known to be involved in the Mendelian predispositions to cancer often remain negative. Today, thanks to the emergence of high-throughput sequencing (NGS), it is now possible to sequence all exons of an individual (exome) or several hundred genes in a short period of time and for a reasonable cost. In this context, we have applied several strategiesbased on these new tools in order to identify new molecular basis of early-onset cancers. First, we applied an intra-familial exome analysis strategy to an atypical family with chondrosarcomas of the chest, for which no molecular basis could be identified. Using this strategy, we were able to identify a truncating alteration of the EXT2 gene NM_000401.3; c.237G> A; p.Trp79 *). The documented loss of function alterations of this gene are implicated in a disease called multiple osteochondromas (OM), associated with benign lesions. Interestingly, these patients showed no clinical signs of OM indicating a potential phenotypic extension of EXT2 mutations. Plus, this work allowed us to change the clinical management of this family. We then used a strategy of subtractive exomic analysis of trio sick child/healthy parents in order to identify de novo mutations in a young patient who developed a medulloblastoma of the cerebellum at 8 years-old followed by a meningioma at 22 years-old. The analysis of the trio revealed the existence of a de novo mutation affecting a highly conserved amino acid of the HID-1 protein. HID-1 is specifically expressed in neuronal and secretory cells, and seems to function around the Golgi apparatus to regulate the sorting of newly formed vesicles. Our hypothesis is that a defect of the HID-1 protein linked to a mutation of the HID-1 gene, could alter the secretory pathway therefore contributing to the development of the tumor. This work, which is still ongoing, demonstrates both the strength of the trio strategy for the rapid identification of de novo mutations and illustrates all the difficulty of interpreting variants detected in genes not yet involved in cancer. Then, thanks to the recruitment of the Laboratory of Molecular Genetics of the CHU of Rouen, we have collected a cohort of 10 patients who developed an adrenocortical carcinoma (ACC) at a very early age and for which no molecular basis could be identified. Despite subtractive and inter-familial exomic analyses, we were unable to highlight new molecular bases for these cases of pediatric ACC. Finally, under the assumption that rare or private mutations in a limited number of genes involved in cancer could contribute to inherited forms of cancer, we undertook a project to sequence 201 genes involved in cancer in patients who developed tumors at a pediatric age. The first results of this project confirmed the robustness of this technique and suggested a phenotypic extension of the DICER1 mutation spectrum as well as an oligogenic contribution of DNA repair genes in pediatric tumors. Soon, these results will be compiled in a database and will benefit from a statistical analysis with the objective to identify enrichment of rare variants in specific genes or biological pathways in these patients compared to control individuals
Styles APA, Harvard, Vancouver, ISO, etc.
10

Nguyen, Quang Nam. « Utilisation du séquençage à haut débit pour la sélection et l'ingénierie des aptamères ». Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLS238.

Texte intégral
Résumé :
Le SELEX est une technique d’évolution moléculaire dirigée qui permet, après plusieurs tours de sélection, d’enrichir une banque d’acides nucléiques en séquences capable de se lier de manière spécifique à une cible. Le séquençage est utilisé pour identifier ces séquences que l’on nomme « aptamères ». Depuis l’arrivée récente du séquençage à haut débit (HD), il est possible d’analyser des millions de séquences. L’objectif de la thèse était de développer des méthodes pour traiter et analyser les données de séquençage HD afin de faciliter l’identification des meilleurs aptamères d’un SELEX. Au cours de cette thèse, un test robotisé de liaison sur cellules adhérentes vivantes a été mis au point pour mesurer l’affinité d’aptamères issus de SELEX ciblant des cellules (cell-SELEX). Puis, l’évolution de l’abondance des séquences d’un cell-SELEX a été analysée par séquençage HD. Ceci nous a permis de concevoir une nouvelle approche phylogénétique baptisée FREDROGRAM. Cette approche évolutive a permis d’identifier des mutants avec une meilleure affinité au sein d’une famille d’aptamères issu de ce cell-SELEX. Enfin, le séquençage HD de deux SELEX dirigés contre des protéines a contribué à mieux comprendre l’impact des paramètres de sélection sur la population de séquences et à identifier de nouveaux aptamères, notamment en réduisant le nombre de tours de SELEX. En conclusion, ces travaux montrent l’utilité du séquençage HD pour l’identification des meilleurs aptamères et suggèrent de nouvelles pratiques pour la conduite des SELEX futurs
SELEX is a directed molecular evolution technic which allows, after several rounds of selection, enriching a library from random nucleic acids to sequences able to bind specifically a target. Sequencing technics are then used to identify these sequences called « aptamers ». Since the arrival of High-Throughput Sequencing (HTS), it is now possible to analyse millions of sequences. The aim of the thesis was to develop methods for the treatment and the analysis of HTS data, in order to facilitate the identification of the best aptamers inside a SELEX. During this thesis, a semi-automatic binding test on adherent living cells has been developed to measure the affinity of aptamers identified in SELEX directed against specific cells (cell-SELEX). Then, the evolution of the sequence enrichment during a cell-SELEX has been analysed by HTS. This analysis gave us the possibility to design a new phylogenetic approch named FREDROGRAM. This evolutive approch allowed to identify variants of an aptamer’s family with a better affinity. Finally, HTS of two SELEX directed against proteins has contributed to a better understanding of the impact of selection parameters on the library and to identified new aptamers, notably by reducing the number of SELEX rounds. To conclude, this work shows the importance of HTS in the identification of the best aptamers and suggests new protocols to monitor the next SELEX in a different manner
Styles APA, Harvard, Vancouver, ISO, etc.
11

Mambu, Mambueni Hendrick. « Identification de nouveaux variants rares associés à la spondyloarthrite par séquençage haut-débit ». Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASL064.

Texte intégral
Résumé :
La spondyloarthrite (SpA) est une maladie multifactorielle avec une héritabilité estimée à plus de 90%, principalement en lien avec le HLA-B27. L'ensemble des facteurs de susceptibilité identifiés, incluant HLA-B27, expliquent moins du tiers de l'héritabilité. L'implication de variants rares pourrait expliquer une partie de cette héritabilité manquante. L'objectif de ce travail était d'identifier des variants rares associés à la SpA via une approche combinant analyses familiales et séquençage haut-débit. D'abord, nous avons séquencé une région de 1,4 Mb significativement liée à la SpA en 13q13 chez 71 patients et 21 témoins sains appartenant à des familles avec un score de liaison élevée dans cette région. Nous avons identifié un variant rare dans le gène FREM2 présent chez 9 malades d'une famille fortement liée à la région et non retrouvé dans d'autres familles ou cas isolés de SpA. Nous avons ensuite séquencé l'exome de 48 malades venant de 20 familles multiplex. Malheureusement, nous n'avons pas observé de variants récurrents entre les familles. Puis, nous nous sommes concentrés sur un deuxième pic de liaison génétique, déjà connu, sur le chromosome 9. L'étude de la famille la plus liée à cette région, qui comprend 12 patients, a conduit à l'identification de plusieurs variants rares codants ségrégeant avec la maladie. Cependant les études ultérieures ont montré des fréquences alléliques de ces variants équivalentes entres les cas et les témoins. Enfin, le séquençage du génome entier de 413 patients issus de 76 familles multiplex avec 4 malades ou plus a été réalisé. Nous avons identifié 1203 variants rares, codants et non synonymes et partagés par au moins tous les membres atteints d'une famille. Les analyses de validation génétique et fonctionnelle de ces variants sont en cours, tout comme l'analyse des variants non-codants. En conclusion, ces différentes approches suggèrent une importante hétérogénéité génétique de la SpA et soulignent également la difficulté de confirmer l'implication de variants rares dans les maladies complexes
Spondyloarthritis (SpA) is a multifactorial disease with an estimated heritability of over 90%, mainly related to HLA-B27. All identified susceptibility factors, including HLA-B27, explain less than one third of the heritability. The involvement of rare variants could explain part of this missing heritability. The aim of this work was to identify rare variants associated with SpA via a combined family analysis and high-throughput sequencing approach. First, we sequenced a 1.4 Mb region significantly linked to SpA at 13q13 in 71 patients and 21 healthy controls from families with a high linkage score in this region. We identified a rare variant in the FREM2 gene present in 9 patients from a family with high linkage to the region and not found in other families or isolated cases of SpA. We then sequenced the exome of 48 patients from 20 multiplex families. Unfortunately, we did not observe any recurrent variants between families. We then focused on a second, previously known genetic linkage peak on chromosome 9. The study of the family most linked to this region, which includes 12 patients, led to the identification of several rare coding variants segregating with the disease. However, subsequent studies have shown equivalent allelic frequencies of these variants between cases and controls. Finally, whole genome sequencing of 413 patients from 76 multiplex families with 4 or more patients was performed. We identified 1203 rare, coding, non-synonymous variants shared by at least all affected family members. Genetic and functional validation analyses of these variants are underway, as is the analysis of non-coding variants. In conclusion, these different approaches suggest significant genetic heterogeneity in SpA and also highlight the difficulty of confirming the involvement of rare variants in complex diseases
Styles APA, Harvard, Vancouver, ISO, etc.
12

Liais, Etienne. « Identification et caractérisation de virus aviaires par des approches de séquençage à haut débit ». Thesis, Toulouse, INPT, 2014. http://www.theses.fr/2014INPT0134/document.

Texte intégral
Résumé :
En médecine humaine et vétérinaire, les agents pathogènes représentent la cause de mortalité principale à travers la planète. Les méthodes de diagnostic de ces pathogènes ont considérablement changé et évolué particulièrement depuis l’apparition du séquençage haut débit. Les nouvelles méthodes de séquençage massif ont considérablement diminué le prix d’une séquence permettant de rendre accessible cette technologie révolutionnaire. Dans le cadre de mes travaux de thèse, nous avons mis en place un protocole pour l’utilisation du séquençage Illumina® (avec le séquenceur MiSeq) comme méthode de diagnostic lors de différents cas pathologiques aviaires. L’utilisation de cette méthode nous a permis dans un premier temps d’identifier l’agent étiologique de la maladie foudroyante de la pintade. Cette étude nous a permis de valider l’utilisation de ce genre de méthode pour des cas ciblés, ici lors d’un épisode clinique particulier n’impliquant vraisemblablement qu’un seul candidat pathogène. Ce nouveau coronavirus a fait l’objet d’études complémentaires afin de le caractériser. Nous avons élargis les cibles recherchées en analysant dans un deuxième temps l’ensemble des virus ARN chez le canard lors d’épisodes cliniques respiratoires et/ou de chute de ponte. L’analyse des données a mis en évidence une importante diversité virale et a permis d’identifier des candidats responsables potentiels. L’ensemble des résultats obtenus nous permet de valider l’utilisation du séquençage à haut débit comme un outil puissant de diagnostic
Infectious diseases are considered the most prevalent cause of mortality in humans as well as other animals worldwide. Since the advent of high throughput sequencing technologies, diagnostic methods for these conditions have quickly changed and evolved, as the continuously decreasing cost of mass sequencing is making this tool available to larger numbers of people. As part of my thesis project, an Illumina®-based sequencing method (on a MiSeq machine) was designed for diagnostic purposes in clinical cases in poultry. We first used this method to identify the causative agent of the fulminating disease of guinea fowl. This validated the use of our protocol to identify the pathogenic infectious agent behind a specific condition. This newly identified Coronavirus was further analysed and characterised. In a second study we used an unbiased mass sequencing approach to describe the RNA virus populations present in the duck respiratory tract during clinical episodes (respiratory illness or egg drops). Data showed an important viral diversity and we identified some candidate pathogens. Taken together, these results validate the use of high throughput sequencing as a powerful diagnostic tool
Styles APA, Harvard, Vancouver, ISO, etc.
13

Mirauta, Bogdan. « Etude du transcriptome à partir de données de comptages issues de séquençage haut débit ». Thesis, Paris 6, 2014. http://www.theses.fr/2014PA066424/document.

Texte intégral
Résumé :
Les technologies de séquençage jouent un rôle croissant dans l'analyse de l'expression des transcrits . La méthode la plus courante de séquençage du transcriptome, RNA-Seq est une méthode d'investigation d'une population de transcrits par cisaillement aléatoire, amplification et séquençage à haut débit. Les données issues du RNA-Seq peuvent être utilisées pour la quantification des niveaux d'expression des transcrits et pour la détection des régions transcrites et demandent des approches bioinformatiques.Nous avons développé des approches statistiques pour l'estimation des niveaux de transcription et l'identification des frontières de transcription sans faire usage de l'annotation existante et pour l'analyse des différences dans l'expression entre deux conditions. La reconstruction du paysage transcriptionel est faite dans un cadre probabiliste (Chaînes de Markov Caché - HMM) ou les variations du niveau de la transcription sont prises en compte en termes de changements brusques et de dérives. Le HMM est complété par une loi d'émission qui capture la variance des comptages dans un transcrit, l'auto-corrélation de courte portée et la fraction des positions avec zéro comptages. L'estimation repose sur un algorithme de Monte Carlo Séquentiel (SMC), le Particle Gibbs, dont le temps d'exécution est plus adapté aux génomes microbiennes. L'analyse des différences dans l'expression (DE) est réalisée sans faire usage de l'annotation existante. L'estimation de DE est premièrement faite à la résolution de position et en suite les régions avec un signal DE continu sont agrégés. Deux programmes nommés Parseq et Pardiff sont disponibles à http://www.lgm.upmc.fr/parseq/
In this thesis we address the problem of reconstructing the transcription profile from RNA-Seq reads in cases where the reference genome is available but without making use of existing annotation. In the first two chapters consist of an introduction to the biological context, high-throughput sequencing and the statistical methods that can be used in the analysis of series of counts. Then we present our contribution for the RNA-Seq read count model, the inference transcription profile by using Particle Gibbs and the reconstruction of DE regions. The analysis of several data-sets proved that using Negative Binomial distributions to model the read count emission is not generally valid. We develop a mechanistic model which accounts for the randomness generated within all RNA-Seq protocol steps. Such a model is particularly important for the assessment of the credibility intervals associated with the transcription level and coverage changes. Next, we describe a State Space Model accounting for the read count profile for observations and transcription profile for the latent variable. For the transition kernel we design a mixture model combining the possibility of making, between two adjacent positions, no move, a drift move or a shift move. We detail our approach for the reconstruction of the transcription profile and the estimation of parameters using the Particle Gibbs algorithm. In the fifth chapter we complete the results by presenting an approach for analysing differences in expression without making use of existing annotation. The proposed method first approximates these differences for each base-pair and then aggregates continuous DE regions
Styles APA, Harvard, Vancouver, ISO, etc.
14

Mirauta, Bogdan. « Etude du transcriptome à partir de données de comptages issues de séquençage haut débit ». Electronic Thesis or Diss., Paris 6, 2014. http://www.theses.fr/2014PA066424.

Texte intégral
Résumé :
Les technologies de séquençage jouent un rôle croissant dans l'analyse de l'expression des transcrits . La méthode la plus courante de séquençage du transcriptome, RNA-Seq est une méthode d'investigation d'une population de transcrits par cisaillement aléatoire, amplification et séquençage à haut débit. Les données issues du RNA-Seq peuvent être utilisées pour la quantification des niveaux d'expression des transcrits et pour la détection des régions transcrites et demandent des approches bioinformatiques.Nous avons développé des approches statistiques pour l'estimation des niveaux de transcription et l'identification des frontières de transcription sans faire usage de l'annotation existante et pour l'analyse des différences dans l'expression entre deux conditions. La reconstruction du paysage transcriptionel est faite dans un cadre probabiliste (Chaînes de Markov Caché - HMM) ou les variations du niveau de la transcription sont prises en compte en termes de changements brusques et de dérives. Le HMM est complété par une loi d'émission qui capture la variance des comptages dans un transcrit, l'auto-corrélation de courte portée et la fraction des positions avec zéro comptages. L'estimation repose sur un algorithme de Monte Carlo Séquentiel (SMC), le Particle Gibbs, dont le temps d'exécution est plus adapté aux génomes microbiennes. L'analyse des différences dans l'expression (DE) est réalisée sans faire usage de l'annotation existante. L'estimation de DE est premièrement faite à la résolution de position et en suite les régions avec un signal DE continu sont agrégés. Deux programmes nommés Parseq et Pardiff sont disponibles à http://www.lgm.upmc.fr/parseq/
In this thesis we address the problem of reconstructing the transcription profile from RNA-Seq reads in cases where the reference genome is available but without making use of existing annotation. In the first two chapters consist of an introduction to the biological context, high-throughput sequencing and the statistical methods that can be used in the analysis of series of counts. Then we present our contribution for the RNA-Seq read count model, the inference transcription profile by using Particle Gibbs and the reconstruction of DE regions. The analysis of several data-sets proved that using Negative Binomial distributions to model the read count emission is not generally valid. We develop a mechanistic model which accounts for the randomness generated within all RNA-Seq protocol steps. Such a model is particularly important for the assessment of the credibility intervals associated with the transcription level and coverage changes. Next, we describe a State Space Model accounting for the read count profile for observations and transcription profile for the latent variable. For the transition kernel we design a mixture model combining the possibility of making, between two adjacent positions, no move, a drift move or a shift move. We detail our approach for the reconstruction of the transcription profile and the estimation of parameters using the Particle Gibbs algorithm. In the fifth chapter we complete the results by presenting an approach for analysing differences in expression without making use of existing annotation. The proposed method first approximates these differences for each base-pair and then aggregates continuous DE regions
Styles APA, Harvard, Vancouver, ISO, etc.
15

Da, Silva Ophélie. « Structure de l'écosystème planctonique : apport des données à haut débit de séquençage et d'imagerie ». Electronic Thesis or Diss., Sorbonne université, 2021. http://www.theses.fr/2021SORUS183.

Texte intégral
Résumé :
Les organismes planctoniques, acteurs clés des écosystèmes, soutiennent les réseaux trophiques et ont un rôle majeur dans les cycles biogéochimiques et la régulation du climat. Tandis que la répartition spatio-temporelle de la diversité planctonique peut être étudiée à plusieurs niveaux, du gène jusqu’à l’écosystème, comprendre les mécanismes qui sous-tendent cette organisation est un défi. En effet, la structure de la diversité résulte de différents processus évolutifs et écologiques qui peuvent agir simultanément sur le vivant. Depuis le début du XXIème siècle, le milieu océanique fait l'objet d’une surveillance croissante. De nombreuses plateformes d’observation ont été déployées permettant l’acquisition de très nombreuses données couvrant de multiples caractéristiques environnementales. En parallèle, les technologies d’étude du vivant se sont développées, conduisant à un échantillonnage sans précédent des organismes planctoniques. En particulier, les données à haut débit de séquençage et d’imagerie permettent de fournir des informations moléculaires, taxonomiques et fonctionnelles à l’échelle des communautés. L’objectif de cette thèse était d’explorer la structure des écosystèmes planctoniques à l’aide des données à haut débit de séquençage et d’imagerie. Le couplage avec les données environnementales pourrait contribuer à une meilleure compréhension de la répartition spatiale de la diversité planctonique, des espèces jusqu’au communautés. Dans une première partie, la diversité génétique de protistes a été étudiée à l’échelle de l’espèce. L’hypothèse était que les données métagénomiques pourraient permettre d’accéder à l’organisation de cette diversité mal caractérisée pour les protistes, ainsi qu’aux mécanismes qui la sous-tendent. Dans une deuxième partie, le lien entre diversité génétique et diversité fonctionnelle a été exploré. La transparence a été ciblée. Ce trait fonctionnel est peu exploré à l’échelle des communautés et les bases moléculaires sont mal identifiées. Une approche permettant de faire émerger ce trait des données d’imagerie a été utilisée, ayant conduit à l’exploration de sa biogéographie et ses bases moléculaires. Dans la dernière partie, le haut potentiel de complémentarité entre jeux de données de séquençage, d’imagerie et environnementaux a été exploré, afin de mettre en lumière la structure multi-échelle de l’écosystème planctonique et d’identifier sa structure globale. Enfin, l’ensemble des résultats a été discuté pour mettre en évidence les apports que peuvent fournir ces données à la compréhension des écosystèmes planctoniques, ainsi que les limites auxquelles elles peuvent faire face
Planktonic organisms are key actors in oceanic ecosystems, which support trophic networks and play a major role in biogeochemical cycles and climate regulation. While the spatio-temporal distribution of planktonic diversity can be investigated at several levels, from the gene to the ecosystem, identifying the underlying mechanisms is challenging. Indeed, the structure of diversity results from different evolutionary and ecological processes that can act simultaneously. Since the beginning of the 21st century, the oceanic environment has been increasingly monitored. Numerous observation platforms have been deployed, leading to the acquisition of a large amount of data for multiple environmental characteristics. At the same time, technologies for studying living organisms have been developed. Thus, an unprecedented sampling of planktonic organisms has taken place. In particular, high-throughput sequencing and imaging data provide molecular, taxonomic and functional information at several biological levels. The objective of this thesis was to explore the structure of planktonic ecosystems using high-throughput sequencing and imaging data. Coupling with environmental data could contribute to a better understanding of the spatial distribution of planktonic diversity, from species to communities. In the first part, the genetic diversity of protists was studied at the species level. The hypothesis was that metagenomics could provide access to the poorly characterized spatial organization of the intraspecific protist genetic diversity, as well as to the mechanisms underlying it. In a second part, the link between genetic diversity and functional diversity was explored. Transparency was targeted. This functional trait is little explored at the community level and its molecular basis is poorly identified. A data-driven approach allowed this trait to emerge from imaging data, leading to the exploration of its biogeography and molecular basis. In the last part, the high potential of complementarity between sequencing, imaging and environmental datasets was explored, in order to highlight the multi-scale structure of the planktonic ecosystem and to identify its global structure. Finally, all the results were discussed to highlight the contributions that these data can provide to the understanding of planktonic ecosystems, as well as the limitations they can face
Styles APA, Harvard, Vancouver, ISO, etc.
16

Gicquel, Evelyne. « Etude par approches globales de la sélectivité d’atteinte dans les dystrophies des ceintures ». Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLE041.

Texte intégral
Résumé :
Les Dystrophies des Ceintures sont des maladies génétiques affectant les différents muscles du corps à des degrés de sévérité variables. Les facteurs à l’origine de ces différences d’atteinte musculaire ne sont pas identifiés.Les travaux de cette thèse visent à identifier des différences moléculaires existant dans des conditions normales entre des muscles présentant une différence d’atteinte dans des conditions de déficience génétique associée à un phénotype de Dystrophie des Ceintures. Nous basant sur l’hypothèse que les différences d’atteinte entre muscles seraient causées par des mécanismes de modification de l’expression de gènes protecteurs du muscle ou le sensibilisant à la dystrophie, nous avons exploré ces mécanismes par une approche globale en comparant la signature de différents muscles. Des analyses par séquençage haut-débit chez le Primate ont permis de mettre en évidence plusieurs gènes et éléments régulateurs dont l’expression est différente entre les muscles sensibles et les muscles résistants à la pathologie. Certaines de ces différences sont conservées dans le modèle murin. Nous avons ensuite exploré par quels mécanismes les éléments régulateurs identifiés pourraient intervenir dans la sélectivité d’atteinte. Les résultats de cette thèse permettent d’approfondir la compréhension des mécanismes physiopathologiques des Dystrophies des Ceintures. Ils pourront également servir de base à la mise en place de nouveaux traitements pour ce groupe de maladies
Limb Girdle Muscular Dystrophies are a group of genetic diseases affecting the muscles of the body with different degrees of severity. The factors behind these differences of impairment have not been identified.The objective of this thesis work is to identify the molecular differences existing in normal condition between muscles known to show a difference of impairment in case of genetic deficiencies asssociated with Limb Girdle Muscular Dystrophy. We based our work on the assumption that the differences of impairment between muscles would be caused by mechanisms leading to modifications of the expression of protective or sensitizer genes in the muscle. Therefore, we explored these mechanisms through a global approach. Analyses by high-throughput sequencing in Primate muscles allowed the identification of several genes and regulatory elements whose expression differs between the sensitive and the resistant muscles. These genes interact in a common network of interactions, which could be targeted for therapeutic purpose. Some of these differences were shown to be conserved in the mouse. We then explored the mechanisms by which the identified regulatory elements may be involved in selectivity of impairment. The results of this thesis provide a deeper understanding of the pathophysiological mechanisms of Limb Girdle Muscular Dystrophies. They will also pave the way for the development of new treatments for this group of diseases
Styles APA, Harvard, Vancouver, ISO, etc.
17

Hurel, Julie. « Détection d'organismes génétiquement modifiés (OGM) inconnus par analyse statistique de données de séquençage haut débit ». Thesis, Rennes 1, 2020. http://www.theses.fr/2020REN1B027.

Texte intégral
Résumé :
L’Union Européenne a adopté une politique très restrictive vis-à-vis de la diffusion et de l’utilisation des organismes génétiquement modifiés (OGM), dont l'utilisation dans l'alimentation est mal acceptée par les consommateurs. Bien qu'un seuil maximal existe pour qu'un aliment soit étiqueté « sans OGM », ne sont aisément détectables que les OGM connus. Un OGM est constitué principalement d’un génome hôte et d’une séquence insérée par un procédé non naturel conférent une propriété particulière à l’organisme comme la résistance à certaines maladies. Depuis quelques années, des OGM dont la séquence insérée n’est pas connue ont été produits, non détectables par des approches utilisées jusqu'à présent (de type PCR). D'où la nécessité de créer un outil de détection d'OGM inconnus, objet de cette thèse, s'appuyant sur les avancées récentes en terme de séquençage haut débit. Statistiquement, chaque organisme a une fréquence d’utilisation des nucléotides dans son génome qui lui est propre. Toute introduction de matériel génétique étranger va modifier localement les fréquences d’utilisation des nucléotides dans cette région, entraînant ainsi des fréquences d’utilisation des nucléotides différentes de celles de l’organisme hôte. En se basant sur cette affirmation, un outil de détection d'OGM inconnu a été mis au point à partir de données de séquençages bactériens dès lors que cet OGM résulte de l'insertion d'un gène étranger, de la troncation ou de la fusion d'un gène pouvant appartenir au génome hôte. L’outil a été testé sur 4 génomes bactériens OGM, 7 génomes bactériens sauvages et sur 42 génomes synthétiques. Les résultats démontrent l’efficacité de la méthode développée ne présentant qu'un gène faux positif et en identifiant plus de 99% des gènes d'inserts OGM
The European Union has adopted a very restrictive policy towards the dissemination and use of genetically modified organisms (GMOs), whose use in food is not well accepted by consumers. Although a maximum threshold exists for a food to be labelled "GM-free", only known GMOs are easily detectable. A GMO consists mainly of a host genome and a sequence inserted by a non-natural process that confers a particular property on the organism, such as resistance to certain diseases. In recent years, GMOs with an inserted sequence that is not known have been produced that are not detectable by approaches used until now (PCR-type). Hence the need to propose a tool for the detection of unknown GMOs, the subject of this thesis, based on recent advances in terms of high-throughput sequencing. Statistically, each organism has a specific frequency of nucleotide use in its genome. Any introduction of foreign genetic material will locally alter the nucleotide use frequencies in that region, resulting in different nucleotide use frequencies compared to those of the host organism. Based on this assertion, an unknown GMO detection tool has been developed from bacterial sequencing data when the GMO results from the insertion of a foreign gene, the truncation or fusion of a gene that may belong to the host genome. The tool has been tested on 4 GMO bacterial genomes, 7 wild bacterial genomes and 42 synthetic bacterial genomes. The results demonstrate the effectiveness of the method developed by presenting only one false positive gene and identifying more than 99% of the genes of GMO inserts
Styles APA, Harvard, Vancouver, ISO, etc.
18

Lacoste, Deixonne Caroline. « Apport du séquençage haut débit dans l'amélioration de la prise en charge des maladies monogéniques ». Thesis, Aix-Marseille, 2016. http://www.theses.fr/2016AIXM5062/document.

Texte intégral
Résumé :
La diffusion du séquençage haut débit (ou NGS pour Next Generation Sequencing) représente un tel changement d’échelle par rapport aux méthodes classiques de séquençage que les indications et l’organisation du diagnostic moléculaire s’en trouvent profondément modifiées. Le NGS permet à la fois de raccourcir le temps d’analyse et de rendu de résultat et d'élargir considérablement le nombre de gènes testés. Il promet donc d’augmenter la proportion de diagnostics posés et de faciliter l'identification de nouveaux variants et de nouveaux gènes impliqués en pathologie. Cependant dans tous les cas, il génère une quantité de données importante, données qui doivent être analysées et interprétées à l’aide d’outils bioinformatiques spécifiques.Dans la première partie de ce travail, les stratégies existantes ainsi que les difficultés et les enjeux du séquençage haut débit pour le diagnostic moléculaire des maladies génétiques sont discutés. Dans la deuxième partie, la mise en place et la validation technique de cette approche diagnostique sont décrites au sein du laboratoire de Génétique Moléculaire de la Timone à Marseille et illustrées par trois exemples concrets de diagnostics moléculaires posés grâce à la technique de séquençage à haut débit. Dans le domaine spécifique des maladies rares, ces nouvelles technologies sont porteuses d’un réel espoir pour les patients atteints de maladie génétique, permettant d'améliorer globalement leur prise en charge et d'accélérer les progrès dans le domaine de la recherche
The diffusion of Next Generation Sequencing (NGS) technologies induces an important change that modifies molecular diagnostics indications and prompts laboratories to re-think their diagnostic strategies, up-to-now based on Sanger sequencing routine. Several high throughput approaches are available from the sequencing of a gene panel, to a whole exome, or even a whole genome. In all cases, a tremendous amount of data are generated, that have to be filtered, interpreted and analyzed by the use of powerful bioinformatics tools.In part 1, existing strategies and the difficulties and challenges of high-throughput sequencing for molecular diagnosis in genetic diseases are discussed. In part 2, the set up and the technical validation of this diagnostic approach in the Molecular Genetics’ Laboratory of the Timone Hospital in Marseille is presented and illustrated by 3 examples of complex diagnostics solved thanks to NGS. NGS promises to shorten significantly the time of analysis and results reporting, and to expand the number of tested genes. It also promises to increase the proportion of positive diagnoses. Finally, the NGS can identify new variants and new genes involved in human pathology, thus will globally improve patient clinical care
Styles APA, Harvard, Vancouver, ISO, etc.
19

Brinda, Karel. « Nouvelles techniques informatiques pour la localisation et la classification de données de séquençage haut débit ». Thesis, Paris Est, 2016. http://www.theses.fr/2016PESC1027/document.

Texte intégral
Résumé :
Depuis leur émergence autour de 2006, les technologies de séquençage haut débit ont révolutionné la recherche biologique et médicale. Obtenir instantanément une grande quantité de courtes ou longues lectures de presque tout échantillon biologique permet de détecter des variantes génomiques, révéler la composition en espèces d’un métagénome, déchiffrer la biologie du cancer, décoder l'évolution d’espèces vivantes ou disparues, ou mieux comprendre les schémas de la migration humaine et l'histoire humaine en général. La vitesse à laquelle augmente le débit des technologies de séquençage dépasse la croissance des capacités de calcul et de stockage, ce qui crée de nouveaux défis informatiques dans le traitement de données de séquençage haut débit. Dans cette thèse, nous présentons de nouvelles techniques informatiques pour la localisation (mapping) de lectures dans un génome de référence et pour la classification taxonomique. Avec plus d'une centaine d’outils de localisation publiés, ce problème peut être considéré comme entièrement résolu. Cependant, une grande majorité de programmes suivent le même paradigme et trop peu d'attention a été accordée à des approches non-standards. Ici, nous introduisons la localisation dynamique dont nous montrons qu’elle améliore significativement les alignements obtenus, par comparaison avec les approches traditionnelles. La localisation dynamique est basée sur l'exploitation de l'information fournie par les alignements calculés précédemment, afin d’améliorer les alignements des lectures suivantes. Nous faisons une première étude systématique de cette approche et démontrons ses qualités à l'aide de Dynamic Mapping Simulator, une pipeline pour comparer les différents scénarios de la localisation dynamique avec la localisation statique et le “référencement itératif”. Une composante importante de la localisation dynamique est un calculateur du consensus online, c’est-à-dire un programme qui collecte des statistiques des alignements pour guider, à la volée, les mises à jour de la référence. Nous présentons OCOCO, calculateur du consensus online qui maintient des statistiques des positions génomiques individuelles à l’aide de compteurs de bits compacts. Au-delà de son application à la localisation dynamique, OCOCO peut être utilisé comme un calculateur de SNP online dans divers pipelines d'analyse, ce qui permet de prédire des SNP à partir d'un flux sans avoir à enregistrer les alignements sur disque. Classification métagénomique de lectures d’ADN est un autre problème majeur étudié dans la thèse. Etant donné des milliers de génomes de référence placés sur un arbre taxonomique, le problème consiste à affecter rapidement aux nœuds de l'arbre une énorme quantité de lectures NGS, et éventuellement estimer l'abondance relative des espèces concernées. Dans cette thèse, nous proposons des techniques améliorées pour cette tâche. Dans une série d'expériences, nous montrons que les graines espacées améliorent la précision de la classification. Nous présentons Seed-Kraken, extension sur les graines espacées du logiciel populaire Kraken. En outre, nous introduisons une nouvelle stratégie d'indexation basée sur le transformé de Burrows-Wheeler (BWT), qui donne lieu à un indice beaucoup plus compact et plus informatif par rapport à Kraken. Nous présentons une version modifiée du logiciel BWA qui améliore l’index BWT pour la localisation rapide de k-mers
Since their emergence around 2006, Next-Generation Sequencing technologies have been revolutionizing biological and medical research. Obtaining instantly an extensive amount of short or long reads from almost any biological sample enables detecting genomic variants, revealing the composition of species in a metagenome, deciphering cancer biology, decoding the evolution of living or extinct species, or understanding human migration patterns and human history in general. The pace at which the throughput of sequencing technologies is increasing surpasses the growth of storage and computer capacities, which still creates new computational challenges in NGS data processing. In this thesis, we present novel computational techniques for the problems of read mapping and taxonomic classification. With more than a hundred of published mappers, read mapping might be considered fully solved. However, the vast majority of mappers follow the same paradigm and only little attention has been paid to non-standard mapping approaches. Here, we propound the so-called dynamic mapping that we show to significantly improve the resulting alignments compared to traditional mapping approaches. Dynamic mapping is based on exploiting the information from previously computed alignments, helping to improve the mapping of subsequent reads. We provide the first comprehensive overview of this method and demonstrate its qualities using Dynamic Mapping Simulator, a pipeline that compares various dynamic mapping scenarios to static mapping and iterative referencing. An important component of a dynamic mapper is an online consensus caller, i.e., a program collecting alignment statistics and guiding updates of the reference in the online fashion. We provide OCOCO, the first online consensus caller that implements a smart statistics for individual genomic positions using compact bit counters. Beyond its application to dynamic mapping, OCOCO can be employed as an online SNP caller in various analysis pipelines, enabling calling SNPs from a stream without saving the alignments on disk. Metagenomic classification of NGS reads is another major problem studied in the thesis. Having a database of thousands reference genomes placed on a taxonomic tree, the task is to rapidly assign to tree nodes a huge amount of NGS reads, and possibly estimate the relative abundance of involved species. In this thesis, we propose improved computational techniques for this task. In a series of experiments, we show that spaced seeds consistently improve the classification accuracy. We provide Seed-Kraken, a spaced seed extension of Kraken, the most popular classifier at present. Furthermore, we suggest a new indexing strategy based on a BWT-index, obtaining a much smaller and more informative index compared to Kraken. We provide a modified version of BWA that improves the BWT-index for a quick k-mer look-up
Styles APA, Harvard, Vancouver, ISO, etc.
20

Bisseux, Maxime. « Dynamique de la circulation des Entérovirus de l'homme à l'environnement : Etude par séquençage haut débit ». Thesis, Université Clermont Auvergne‎ (2017-2020), 2017. http://www.theses.fr/2017CLFAS013.

Texte intégral
Résumé :
Les entérovirus (EV) sont des Picornavirus (virus nus à génome ARN positif), caractérisés par une grande diversité génétique et antigénique (116 types classés en 4 espèces taxonomiques EV-A à D) et une évolution rapide. Les infections humaines sont très fréquentes, hautement contagieuses à partir des selles et épidémiques. La plupart des infections sont asymptomatiques ou bénignes ; elles peuvent être graves voire mortelles, en particulier chez les jeunes enfants. La poliomyélite, modèle d’infection à EV, est en voie d’éradication grâce aux programmes de vaccination et de surveillance sous l’égide de l’OMS. La détection de poliovirus sauvages dans des pays déclarés exempts de polio depuis plusieurs années et l’émergence récente de plusieurs EV non poliomyélitiques (EV-A71, EV-D68) associés à des manifestations cliniques sévères dans plusieurs régions du monde montrent l’importance de surveiller la circulation des EV dans la population humaine. Le but de la thèse était de rechercher et caractériser les EV dans les eaux usées de l’agglomération de Clermont-Ferrand et de comparer les données à celles de la surveillance clinique pour avoir une image plus complète de la circulation virale dans la population générale. Une méthode de concentration virale à partir des eaux usées prélevées en entrée (eaux usées brutes) et sortie (eaux usées traitées) de station d’épuration a été mise au point, permettant la détection moléculaire des EV et de 6 autres virus entériques humains. La présence de génomes viraux a été détectée dans tous les échantillons d’octobre 2014 à octobre 2015, avec une médiane de 6 virus différents en entrée de station et de 4 virus en sortie. L’analyse phylogénétique des séquences d’EV et des virus des hépatites A et E présents dans les eaux usées et les prélèvements cliniques des patients hospitalisés au CHU de Clermont-Ferrand pendant la même période, a validé l’approche mise en place pour surveiller la circulation communautaire d’un virus entérique. La diversité des EV présents dans les eaux usées brutes a été analysée par séquençage d’amplicons avec une technique haut débit Illumina (metabarcoding). Les résultats montrent la présence d’une grande diversité d’EV et la circulation silencieuse de 25 types (notamment 9 EV-C, dont des séquences de poliovirus 1 vaccinal) dans la population générale. L’analyse phylogénétique des variants intra-typiques a mis en évidence plusieurs profils épidémiques parmi les principaux types ayant circulé pendant la période d’étude. Les données obtenues montrent la faisabilité et la sensibilité de la stratégie développée pour détecter et caractériser les EV présents dans les eaux usées. Ils permettent de discuter la place de la surveillance environnementale dans la surveillance des infections à EV non polio (études épidémiologiques, prévention des épidémies, alertes sanitaires). Surveiller conjointement les virus entériques dans l’environnement et chez les patients permet une meilleure compréhension de leur prévalence. Cette approche globale de la circulation virale et de l’écologie de la santé représente un engagement important de la part des laboratoires et nécessitera une intégration dans des réseaux structurés de collaboration nationales et internationales dépassant la seule surveillance des EV
Enterovirus (EV) are Picornaviruses (non-enveloped, positive-sense RNA viruses), characterized by a large genetic and antigenic diversity (116 types classified within 4 taxonomic species EV-A to D) and rapid evolution. Human infections are frequent, highly contagious from stools and occur as outbreaks. The infections are mainly asymptomatic or benign but severe or fatal cases can be reported in young children. Poliomyelitis is the model EV infection. Combined with clinical and virological surveillance, mass vaccination is closer than ever to achieve the WHO program of the Global Polio Eradication Initiative. However, the detection of wild type polioviruses in polio-free countries and the recent worldwide emergence of non-polio enteroviruses (EV-A71, EV-D68) associated with severe clinical manifestations underscore the importance of surveilling EV circulation in the general population. The aim of the PhD thesis was the detection and identification of EV strains in wastewater treated in the sewage treatment plant at Clermont-Ferrand (France). The viral data were compared with those reported through clinical surveillance to obtain a comprehensive picture of the viral circulation in the local population. A method was developed to concentrate viruses from raw and treated wastewater and molecular assays were used to detect EVs and 6 other human enteric viruses. The viral genomes were detected in all samples from October 2014 to October 2015, with a median of 6 and 4 different viruses in raw and treated wastewater respectively. Phylogenetic analysis of viral sequences (EV, hepatitis A and E viruses) determined in wastewater and reported in patients during the sampling period, showed the efficiency of the method for surveilling enteric viruses in the community. The EV diversity in raw wastewater was analyzed by sequencing of amplicons with the Illumina high throughput technology (metabarcoding). The analysis revealed a large viral diversity and the silent circulation of 25 types not detected from hospital data (in particular 9 EV-C, of which sequences of vaccine poliovirus 1). The phylogenetic analyses of intra-typic variants showed different epidemic patterns in the predominant EV types circulating over the study period. The data demonstrate the feasibility and sensitivity of the strategy developed for the detection and characterization of EV in wastewater and provide a future prospect for the implementation of environmental surveillance of non-polio EV infections in epidemiological studies, epidemic prevention, and for health alert. Combining the surveillance of enteric viruses in the environment and in the clinical setting allows a better understanding of their prevalence. This global approach of virus circulation and ecological health represents an important investment for laboratories, which will require integration in national and international collaboration networks beyond the scope of enterovirus surveillance
Styles APA, Harvard, Vancouver, ISO, etc.
21

Caporossi, Alban. « Apport du séquençage haut débit dans l'analyse bioinformatique du génome du virus de l'hépatite C ». Thesis, Université Grenoble Alpes (ComUE), 2019. http://www.theses.fr/2019GREAS021/document.

Texte intégral
Résumé :
Le séquençage haut débit a été utilisé dans ce travail pour reconstruire avec des méthodes adaptées le génomeviral entier du virus de l’hépatite C (VHC) notamment pour le typer avec précision. Une étude a ainsi permisde mettre en évidence la présence d’une forme recombinante du VHC chez un patient. Une autre a permisde typer et détecter les mutations de résistance de plusieurs souches de VHC de génotypes différents. Enfin,une dernière étude basée sur cette approche a permis de découvrir une souche VHC appartenant à un nouveausous-type. Le séquençage haut débit a aussi été utilisé dans ce travail pour détecter des infections multiples etanalyser l’évolution virale en ciblant des gènes du VHC et en mettant en œuvre des méthodes non spécifiquespour 2 patients VHC sous traitement. Cette étude rétrospective a permis de définir la composition de chaqueéchantillon temporel, estimer leur diversité nucléotidique, explorer la structure génétique de la population viraleet son évolution temporelle et dater les infections secondaires. Les résultats obtenus supportent l’hypothèse d’unmécanisme d’apparition de résistance au traitement (selective sweeps)
High-throughput sequencing has been used in this work to reconstruct with adapted methods the whole genomeof the hepatitis C virus (HCV) particularly for accurately typing the virus. Thus, we managed to detect in a studya recombinant form of HCV circulating within a patient. We typed and detected in another study resistancemutations of several HCV strains of different genotypes. Finally, a last study based on this approach enabled touncover a HCV strain belonging to a new subtype. High-throughput sequencing has also been used in this workto detect multiple infections and analyze viral evolution with targeted HCV genes and non-specific methods for2 HCV patients under treatment. This retrospective study enabled to define the composition of each temporalsample, assess their nucleotide diversity, investigate viral population genetic structure and temporal evolutionand date secondary infections. Results of this analysis support the hypothesis of onset mechanism of treatmentresistance (selective sweeps)
Styles APA, Harvard, Vancouver, ISO, etc.
22

Chaara, Wahiba. « Caractérisation de la diversité du répertoire TCR par modélisation de données de séquençage haut-débit ». Thesis, Paris 6, 2016. http://www.theses.fr/2016PA066410/document.

Texte intégral
Résumé :
Les lymphocytes T (LT) sont des acteurs-clés du système immunitaire, un système complexe et dynamique évoluant au cours de la vie de l'organisme. On appelle " répertoire lymphocytaire ", une collection de lymphocytes partageant un même phénotype, une même fonction ou tout autres critères, chacun caractérisé par un récepteur membranaire unique, appelé TCR, lui permettant de reconnaitre de manière spécifique les antigènes. Les TCR sont caractérisés par des régions variables, produites par une série de réarrangements somatiques ayant lieu pendant la différenciation thymique, et qui assurent la diversité de reconnaissance des LT. On parle de répertoire TCR lorsque l'on s'attache à définir les caractéristiques clonales des populations lymphocytaires T sur la base de la diversité des TCR exprimés à l'échelle de la population. Le séquençage à haut débit des chaînes TCR permet désormais de décrire cette diversité avec une précision sans précédent. Cette approche requiert néanmoins des outils adaptés pour permettre une caractérisation pertinente de la structure des répertoires analysés. Un axe de recherche de L'unité I3 est l'analyse du répertoire TR de plusieurs populations lymphocytaires T en situation d'auto-immunité ou d'inflammation. Dans ce contexte, les objectifs de ma thèse ont été de : i) approfondir le concept de diversité du répertoire lymphocytaire, ii) mettre au point une méthodologie adaptée permettant d'exploiter les données de séquençage de manière optimale en prenant en compte les limites de cette technologie, et iii) développer un outil permettant aux immunologistes une caractérisation approfondie et facilement interprétable des répertoires qu'ils étudient
T lymphocytes (LT) are key players in the immune system, a complex and dynamic system evolving over the organism’s life. The concept of "lymphocyte repertoire" designates a collection of lymphocytes sharing the same phenotype, the same function or any other criteria. Each LT is characterized by a unique membrane receptor, called TCR, allowing it to recognize specifically antigens. TCRs are characterized by variable regions produced by a series of somatic rearrangements that occur during the thymic differentiation; these regions engage LT recognition diversity. The “TCR repertoire” approach focuses the clonal characterisation of LT populations on the diversity of the TCR expressed on the scale of the population. The high-throughput sequencing of TCR chains (RepSeq) describes this diversity with unprecedented precision. However, this approach requires adapted tools to enable a relevant deciphering of the analysed TCR repertoire diversity. My thesis aimed to: i) deepen the concept of diversity of the lymphocyte repertoire, ii) develop an appropriate methodology to exploit optimally RepSeq data while taking into account the limits of this technology, and iii) develop a tool providing immunologists a thorough characterisation of their TCR repertoires of interest
Styles APA, Harvard, Vancouver, ISO, etc.
23

Chaara, Wahiba. « Caractérisation de la diversité du répertoire TCR par modélisation de données de séquençage haut-débit ». Electronic Thesis or Diss., Paris 6, 2016. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2016PA066410.pdf.

Texte intégral
Résumé :
Les lymphocytes T (LT) sont des acteurs-clés du système immunitaire, un système complexe et dynamique évoluant au cours de la vie de l'organisme. On appelle " répertoire lymphocytaire ", une collection de lymphocytes partageant un même phénotype, une même fonction ou tout autres critères, chacun caractérisé par un récepteur membranaire unique, appelé TCR, lui permettant de reconnaitre de manière spécifique les antigènes. Les TCR sont caractérisés par des régions variables, produites par une série de réarrangements somatiques ayant lieu pendant la différenciation thymique, et qui assurent la diversité de reconnaissance des LT. On parle de répertoire TCR lorsque l'on s'attache à définir les caractéristiques clonales des populations lymphocytaires T sur la base de la diversité des TCR exprimés à l'échelle de la population. Le séquençage à haut débit des chaînes TCR permet désormais de décrire cette diversité avec une précision sans précédent. Cette approche requiert néanmoins des outils adaptés pour permettre une caractérisation pertinente de la structure des répertoires analysés. Un axe de recherche de L'unité I3 est l'analyse du répertoire TR de plusieurs populations lymphocytaires T en situation d'auto-immunité ou d'inflammation. Dans ce contexte, les objectifs de ma thèse ont été de : i) approfondir le concept de diversité du répertoire lymphocytaire, ii) mettre au point une méthodologie adaptée permettant d'exploiter les données de séquençage de manière optimale en prenant en compte les limites de cette technologie, et iii) développer un outil permettant aux immunologistes une caractérisation approfondie et facilement interprétable des répertoires qu'ils étudient
T lymphocytes (LT) are key players in the immune system, a complex and dynamic system evolving over the organism’s life. The concept of "lymphocyte repertoire" designates a collection of lymphocytes sharing the same phenotype, the same function or any other criteria. Each LT is characterized by a unique membrane receptor, called TCR, allowing it to recognize specifically antigens. TCRs are characterized by variable regions produced by a series of somatic rearrangements that occur during the thymic differentiation; these regions engage LT recognition diversity. The “TCR repertoire” approach focuses the clonal characterisation of LT populations on the diversity of the TCR expressed on the scale of the population. The high-throughput sequencing of TCR chains (RepSeq) describes this diversity with unprecedented precision. However, this approach requires adapted tools to enable a relevant deciphering of the analysed TCR repertoire diversity. My thesis aimed to: i) deepen the concept of diversity of the lymphocyte repertoire, ii) develop an appropriate methodology to exploit optimally RepSeq data while taking into account the limits of this technology, and iii) develop a tool providing immunologists a thorough characterisation of their TCR repertoires of interest
Styles APA, Harvard, Vancouver, ISO, etc.
24

Karaouzene, Thomas. « Bioinformatique et infertilité : analyse des données de séquençage haut-débit et caractérisation moléculaire du gène DPY19L2 ». Thesis, Université Grenoble Alpes (ComUE), 2017. http://www.theses.fr/2017GREAS041/document.

Texte intégral
Résumé :
Ces dix dernières années, l’investigation des maladies génétiques a été bouleversée par l’émergence des techniques de séquençage haut-débit. Celles-ci permettent désormais de ne plus séquencer les gènes un par un, mais d’avoir accès à l’intégralité de la séquence génomique ou transcriptomique d’un individu. La difficulté devient alors d’identifier les variants causaux parmi une multitude d’artefacts techniques et de variants bénins, pour ensuite comprendre la physiopathologie des gènes identifiés.L’application du séquençage haut débit est particulièrement prometteuse dans le champ de la génétique de l’infertilité masculine car il s’agit d’une pathologie dont l’étiologie est souvent génétique, qui est génétiquement très hétérogène et pour laquelle peu de gènes ont été identifiés. Mon travail de thèse est donc centré sur la l’infertilité et comporte deux parties majeures : l’analyse des données issues du séquençage haut débit d’homme infertiles et de modèles animaux et la caractérisation moléculaire d’un phénotype spécifique d’infertilité, laglobozoospermie.Le nombre de variants identifiés dans le cadre d’un séquençage exomique pouvant s’élever à plusieurs dizaines de milliers, l’utilisation d’un outil informatique performant est indispensable. Pour arriver à une liste de variants suffisamment restreinte pour pouvoir être interprétée, plusieurs traitements sont nécessaires. Ainsi, j’ai développé un pipeline d’analyse de données issues de séquençage haut-débit effectuant de manière successive l’intégralité des étapes de l’analyse bio-informatique, c’est-à-dire l’alignement des reads sur un génome de référence, l’appel des génotypes, l’annotation des variants obtenus ainsi que le filtrage de ceux considérés comme non pertinents dans le contexte de l’analyse. L’ensemble de ces étapes étant interdépendantes,les réaliser au sein du même pipeline permet de mieux les calibrer pour ainsi réduire le nombre d’erreurs générées. Ce pipeline a été utilisé dans cinq études au sein du laboratoire, et a permis l’identification de variants impactant des gènes candidats prometteurs pouvant expliquer le phénotype d’infertilité des patients.L’ensemble des variants retenus ont ensuite pu être validés expérimentalement.J’ai également pris part aux investigations génétiques et moléculaires permettant la caractérisation du gène DPY19L2, identifié au laboratoire et dont la délétion homozygote entraine une globozoospermie, caractériséepar la présence dans l’éjaculât de spermatozoïdes à tête ronde dépourvus d’acrosome. Pour cela, j’ai contribué à caractériser les mécanismes responsables de cette délétion récurrente, puis, en utilisant le modèle murin Dpy19l2 knock out (KO) mimant le phénotype humain, j’ai réalisé une étude comparative des transcriptomes testiculaires de souris sauvages et de souris KO Dpy19l2-/-. Cette étude a ainsi permis de mettre en évidence la dérégulation de 76 gènes chez la souris KO. Parmi ceux-ci, 23 sont impliqués dans la liaison d’acides nucléiques et de protéines, pouvant ainsi expliquer les défauts d’ancrage de l’acrosome au noyau chez les spermatozoïdes globozoocéphales.Mon travail a donc permis de mieux comprendre la globozoospermie et de développer un pipeline d’analyse bioinformatique qui a déjà permis l’identification de plus de 15 gènes de la gamétogenèse humaine impliqués dans différents phénotypes d’infertilité
In the last decade, the investigations of genetic diseases have been revolutionized by the rise of high throughput sequencing (HTS). Thanks to these new techniques it is now possible to analyze the totality of the coding sequences of an individual (exome sequencing) or even the sequences of his entire genome or transcriptome.The understanding of a pathology and of the genes associated with it now depends on our ability to identify causal variants within a plethora of technical artifact and benign variants.HTS is expected to be particularly useful in the field infertility as this pathology is expected to be highly genetically heterogeneous and only a few genes have so far been associated with it. My thesis focuses on male infertility and is divided into two main parts: HTS data analysis of infertile men and the molecular characterization of a specific phenotype, globozoospermia.Several thousands of distinct variants can be identified in a single exome, thereby using effective informatics is essential in order to obtain a short and actionable list of variants. It is for this purpose that I developed a HTS data analysis pipeline performing successively all bioinformatics analysis steps: 1) reads mapping along a reference genome, 2) genotype calling, 3) variant annotation and 4) the filtering of the variants considered as non-relevant for the analysis. Performing all these independent steps within a single pipeline is a good way to calibrate them and therefore to reduce the number of erroneous calls. This pipeline has been used in five studies and allowed the identification of variants impacting candidate genes that may explain the patients’ infertility phenotype. All these variants have been experimentally validated using Sanger sequencing.I also took part in the genetic and molecular investigations which permitted to demonstrate that the absence of the DPY192 gene induces male infertility due to globozoospermia, the presence in the ejaculate of only round-headed and acrosomeless spermatozoa. Most patients with globozoospermia have a homozygous deletion of the whole gene. I contributed to the characterization of the mechanisms responsible for this recurrent deletion, then, using Dpy19l2 knockout (KO) mice, I realized the comparative study of testicular transcriptome of wild type and Dpy19l2 -/- KO mice. This study highlighted a dysregulation of 76 genes in KO mice. Among them, 23 are involved in nucleic acid and protein binding, which may explain acrosome anchoring defaults observed in the sperm of globozoospermic patients.My work allowed a better understanding of globozoospermia and the development of a HTS data analysis pipeline. The latter allowed the identification of more than 15 human gametogenesis genes involved in different infertility phenotypes
Styles APA, Harvard, Vancouver, ISO, etc.
25

Glouzon, Jean-Pierre. « Étude de la dynamique des populations du viroïde de la mosaïque latente du pêcher par séquençage à haut débit et segmentation ». Mémoire, Université de Sherbrooke, 2012. http://hdl.handle.net/11143/6582.

Texte intégral
Résumé :
Les viroïdes sont des agents pathogènes responsables de maladies affectant les plantes telles que l'avocatier, le pêcher, la tomate, la pomme dé terre, etc. Parce qu'ils dégradent la qualité des fruits et des légumes qu'ils infectent, les viroïdes sont la cause de la perte d'environ 50 % de la production mondiale des cultures touchées. La compréhension des mécanismes couvrant l'infection aux viroïdes constitue un enjeu économique majeur visant l'amélioration de la productivité, dans l'exploitation de ces plantes. Cette étude aborde l'analyse des processus liés à l'infection aux viroïdes par la découverte de nouveaux aspects caractérisant la variabilité génétique du viroïde de la mosaïque latente du pêcher (PLMVd). Elle décrit la dynamique des populations de PLMVd. La grande variabilité de PLMVd, expliquée par un fort taux de mutations, implique la génération de séquences diverses et variées, prenant la forme de nuages. Notre approche pour comprendre cette variabilité génétique de PLMVd consiste à infecter un pêcher à partir d'une seule séquence de PLMVd, puis à en extraire les séquences et analyser leurs caractéristiques intrinsèques par une nouvelle méthode bio-informatique. À notre connaissance, notre étude, à ce jour, est la première à utiliser les récentes techniques de séquençage à haut débit, à des fins d'analyses des viroïdes. La structure relativement simple des viroïdes, brin d'ARN circulaire d'environ 240 à 400 nucléotides, leur confère l'avantage de pouvoir être séquencé dans leur longueur totale par le séquençage à haut débit. Ce dernier couvre de grands volumes de données biologiques, ce qui convient pour séquencer les nuages de séquences qu'on peut retrouver au sein de la population de PLMVd. En bio-informatique, il existe de nombreux algorithmes permettant de comparer des séquences pour en extraire de l'information. L'un des défis majeurs de ces algorithmes est la prise en charge efficace et rapide de quantité de données en constante croissance. Dans le cadre de notre étude, le volume de séquences généré par PLMVd rend impraticable l'application des algorithmes d'alignement pour comparer les séquences et en estimer leurs similarités. D'autres algorithmes tels que ceux basés sur les N-grammes impliquent une perte partielle de l'information contenue dans les séquences. Nous avons donc utilisé une mesure de similarité basée sur le modèle de probabilité conditionnelle (CPD) qui nous permet d'une part, de conserver l'information sous forme de patrons (sous-séquences) contenus dans les séquences, et d'autre part, d'éviter l'alignement de séquences tout en comparant directement chaque séquence avec un ensemble de séquences. Le modèle CPD est intégré dans un nouvel algorithme de segmentation pour les séquences catégoriques, appelé DHCS. Cette étude révèle de nouveaux aspects dans la variabilité génétique de PLMVd. En effet, elle nous a permis d'une part d'extraire des familles de séquences caractérisées par des mutations spécifiques, puis d'autre part, de représenter la distribution de ces mutations dans une arborescence. Par la suite, elle a favorisé l'observation de mutations localisées dans le noyau d'un motif particulier, nommé le ribozyme en tête de marteau des séquences, servant à l'amélioration de l'adaptation de PLMVd. Celui-ci est effectivement sujet à mutations parce que la séquence inoculée au pêcher après 6 mois d'infections n'a pas été retrouvée et que le nombre de mutations enregistrées varie de 2 à 51. Des deux librairies obtenues, nous avons répertorié 1125 et 1061 séquences pour un total de 2186 nouvelles séquences de PLMVd. Seules 300 séquences étaient connues à ce jour. Nous avons observé que les séquences possèdent, selon la librairie, en moyenne 4.6 et 6.3 mutations par rapport à la séquence inoculée. Certaines d'entre elles ont jusqu'à 20 % de dissimilarité par rapport à la séquence inoculée, ce qui est considérable. Grâce à DHCS, les différentes séquences ont pu être groupées en familles, au nombre de 7 et 8 selon la librairie.
Styles APA, Harvard, Vancouver, ISO, etc.
26

Mbareche, Hamza. « Molecular tools for the study of fungal aerosols ». Doctoral thesis, Université Laval, 2019. http://hdl.handle.net/20.500.11794/35697.

Texte intégral
Résumé :
Depuis le développement rapide des méthodes de séquençage à haut débit (SHD) en écologie moléculaire, les moisissures ont eu moins d’attention que les bactéries et les virus, en particulier dans les études de bioaérosols. Les études d'exposition aux moisissures dans différents environnements sont limitées par les méthodes de culture traditionnelles qui sousestiment le large spectre de moisissures pouvant être présentes dans l'air. Bien que certains problèmes de santé soient déjà associés à une exposition fongique, le risque peut être sousestimé en raison des méthodes utilisées. L’application du séquençage à haut débit dans des échantillons de sol par exemple a permis de mieux comprendre le rôle des moisissures dans les écosystèmes. Cependant, la littérature n'est pas clair quant à la région génomique à utiliser comme cible pour l'enrichissement et le séquençage des moisissures. Cette thèse vise à déterminer laquelle des deux régions universellement utilisées, ITS1 et ITS2, convient le mieux pour étudier les moisissures dans l’air. Durant le développement de la méthode moléculaire, un autre défi, touchant la perte de cellules fongiques lors de la centrifugation d'échantillons d'air liquide à des fins de concentration, s’est rajouté. Ainsi, cette thèse décrit une nouvelle méthode de filtration pour remédier à la perte due à la centrifugation. Ces deux objectifs représentent la première partie de la thèse qui se concentre sur le développement de méthodes: le traitement des échantillons d’air avant extraction de l’ADN et la meilleure région à cibler avec la méthode SHD. La deuxième partie consiste à appliquer la méthodologie développée pour caractériser l'exposition aux moisissures dans trois environnements de travail différents: le compost, la biométhanisation et les fermes laitières. Les résultats montrent que la région d’ITS1 a surpasser ITS2 en couvrant davantage de diversité dans les bioaérosols. En raison de profils taxonomiques complémentaires, l'auteur de la thèse suggère d'utiliser les deux régions pour couvrir la plupart des taxons lorsque la taxonomie constitue le principal intérêt de l'étude. Cependant, ITS1 devrait être le premier choix dans les autres études, principalement en raison de la grande diversité et de la similarité des profils taxonomiques obtenus par l’approche métagénomique et l’approche ciblant ITS1. De plus, la nouvelle approche de filtration proposée constitue une meilleure alternative pour compenser la perte fongique due à la centrifugation. Ensemble, ces méthodes ont permis une meilleure description de l’exposition aux moisissures en milieu professionnel
Since the rapid development of high-throughput sequencing methods in molecular ecology, fungi have been the underdogs of the microbial world, especially in bioaerosol studies. Particularly, studies describing fungal exposure in different occupational environments have been limited by traditional culture methods that underestimate the broad spectrum of fungi present in the air. There are potential risks in the human inhalation of fungal spores in an occupational scenario where the quantity and diversity of fungi is high. Although some health problems are already known to be associated with fungal exposure in certain work environments, the risk may be underestimated due to the methods used. Applying high-throughput sequencing in soil samples has helped the explanation of the fungal role in ecosystems. However, the literature is not decisive in terms of the genomic region to use as target for the enrichment and sequencing of fungi. The present thesis deals with the challenge of determining which region from the two universally used regions, ITS1 and ITS2, is best suited for study of fungal aerosols. In tandem with this challenge came another of addressing the loss of fungal cells during the centrifugation of liquid impaction air samples for purposes of concentration. This thesis describes a new filtration-based method to circumvent such losses during centrifugation. These two challenges represent the first part of the thesis, which focuses on methodology development. In synopsis, the treatment of air samples prior to DNA extraction is considered, along with the identification of the best region to target in amplicon-based high throughput sequencing. In the second part of the thesis, the focus turns to the application of the developed methodology to characterize fungal exposure in three different work environments: compost, biomethanization, and dairy farms. All three are of special interest due to potentially high fungal exposure. Results show that ITS1 outperformed ITS2 in disclosing higher levels of fungal diversity in aerosol samples. Due to complementarity in the taxonomic profiles disclosed by the two regions, the author suggests the use of both regions to cover the greatest possible number of taxa when taxonomy is the main interest of the study. However, ITS1 should be the first choice in other studies, mainly because of the high diversity it reveals and its concordance with results obtained via shotgun metagenomic profiling. In addition, the new filtration-based approach proposed in this work might be the best alternative available for compensating the loss of propagules in centrifugation done prior to DNA extraction. Taken together, these methods allowed a profound characterization of fungal exposure in occupational environments.
Styles APA, Harvard, Vancouver, ISO, etc.
27

Muller, Etienne. « Les défis du séquençage à haut débit dans l'exploration génétique des cancers du sein et de l'ovaire ». Thesis, Normandie, 2017. http://www.theses.fr/2017NORMR100/document.

Texte intégral
Résumé :
Les cancers du sein et de l’ovaire apparaissent dans 5 à 10% dans un contexte de prédisposition génétique, dont seule une faible part est expliquée par la présence d’un variant pathogène sur les gènes BRCA1, BRCA2 et PALB2. Le séquençage à haut-débit permet d’explorer cette hérédité manquante, mais représente un nouveau défi à la fois informatique, statistique et biologique. Trois approches utilisant cette nouvelle technologie ont été employées pour rechercher de nouveaux facteurs de prédisposition. En premier lieu, les risques associés à 34 gènes connus ou suspectés d’être impliqués dans les prédispositions ont été estimés à partir de l’analyse de 5 131 cas index et le développement d’une nouvelle approche statistique. Aussi la participation des néo-mutations en mosaïque dans le syndrome a été explorée à partir de 1 750 cas index issus de l’étude précédente, avec un logiciel de détection des variants faiblement représentés développé spécifiquement: outLyzer. Enfin, l’exploration par séquençage de l’hérédité manquante a été étendue à un panel de 201 gènes impliqués dans le cancer, à partir de 118 patientes sélectionnées pour la précocité d’apparition de leur maladie, élément fortement évocateur d’un facteur de prédisposition. Les résultats de ces travaux ont permis de valider la pertinence de l’étude de PALB2, RAD51C et RAD51D pour la prise en charge des patients, et suggèrent aussi une implication sous-estimée des variants en mosaïque. Cependant il reste encore très probablement d’autres facteurs génétiques fortement pénétrants à découvrir mais dont la modulation du risque répond à un modèle oligogénique
Breast and ovarian cancers appear in 5 to 10% of cases in a context of genetic predisposition, of which only a small proportion is explained by the presence of a pathogenic variant on the BRCA1, BRCA2 and PALB2 genes. High throughput sequencing can explore this missing heredity, but represents a new challenge both in computing, statistics and biology. Three approaches using this new technology have been used to investigate new predisposition factors. First, the risks associated with 34 known or suspected genes involved in predispositions were estimated from the analysis of 5,131 index cases and the development of a new statistical approach. Also, the participation of mosaic neo-mutations in the syndrome was explored from 1,750 index cases from the previous study, with a software developed specifically for detecting poorly represented variants: outLyzer. Finally, the exploration by sequencing of the missing heredity was extended to a panel of 201 genes involved in cancer, from 118 patients selected for the early onset of their disease, a highly suggestive element of a predisposition factor. The results of this work validated the relevance of the PALB2, RAD51C and RAD51D study for patient management, and also suggested an underestimated involvement of mosaic variants. However, there are still very likely other highly penetrating genetic factors to be discovered, but whose risk modulation is based on an oligogenic model
Styles APA, Harvard, Vancouver, ISO, etc.
28

Nguyen, Do Ngoc Linh. « Mise au point de l’analyse par séquençage à haut-débit du microbiote fongique et bactérien respiratoire chez les patients atteints de mucoviscidose ». Thesis, Lille 2, 2016. http://www.theses.fr/2016LIL2S011/document.

Texte intégral
Résumé :
L’infection broncho-pulmonaire représente le problème majeur des malades atteints de la mucoviscidose. Plusieurs bactéries sont connues depuis des dizaines années comme les principaux agents responsables de ces infections (par exemple Pseudomonas aeruginosa, Staphylococcus aureus, Burkholderia cepacia, Achromobacter xylosoxidans…). Récemment, certains genres fongiques notamment les champignons filamenteux (comme Aspergillus, Scedosporium…) ont été identifiés comme des pathogènes émergeants ou ré-émergeants pouvant être responsables d’infection invasive. Ainsi, la détection des microorganismes impliqués dans ces colonisations et/ou infections respiratoires demeure importante sur le plan physiopathologique et clinique.Si la culture microbiologique reste la méthode la plus utilisée à ce jour pour le diagnostic des infections microbiennes, elle ne permet pas d’identifier les microbes non-cultivables ou difficiles à cultiver. Depuis quelques années, grâce au développement de la technique moléculaire de séquençage à haut-débit (next generation sequencing ou NGS), plusieurs études ont montré que l’écologie microbienne du poumon des patients atteints de la mucoviscidose est très complexe et correspond à une flore poly-microbienne, appelée le microbiote pulmonaire, comprenant non seulement des bactéries mais également des micromycètes (levures et/ou champignons filamenteux) et des virus et phages. Une dysbiose (modification en abondance et diversité) de cette flore pourrait influencer la fonction respiratoire et l’état clinique du patient.Alors que le microbiome bactérien et son rôle en pathogenèse sont largement étudiés, peu d’études ont porté sur la composante fongique (mycobiote/mycobiome) du microbiote pulmonaire. Notre travail de thèse s’inscrit dans les différents projets développés au sein de l’axe de recherche « Microbiote pro- et eucaryote pulmonaire » coordonné par le Pr Laurence Delhaes dans l’équipe Biologie et Diversité des Pathogènes Eucaryotes Emergeants (BDPEE) dirigée par le Dr Eric Viscogliosi. Il se focalise sur l’analyse NGS du microbiote pro- et eucaryotique respiratoire chez les patients atteints de la mucoviscidose et notamment la comparaison de différentes approches méthodologiques en vue d’une optimisation et standardisation de la méthode.Dans un premier temps, nous présenterons une synthèse des connaissances actuelles d’une part des phénomènes de colonisations/infections fongiques chez les patients atteints de mucoviscidose et d’autre part dans le domaine du microbiote pulmonaire et surtout du mycobiote pulmonaire autour duquel notre équipe se focalise.2Dans un deuxième temps, nous avons travaillé à mieux adapter l’approche NGS aux études du microbiote pulmonaire dans la mucoviscidose. En effet, le séquençage à haut-débit est une technique puissante mais pour laquelle des biais peuvent être introduits à de nombreuses étapes méthodologiques. Un des biais les plus importants est que l’approche NGS ne permet pas de différencier les microorganismes vivants, des cellules mortes ou endommagées, ni de l’ADN extracellulaire. Dans le contexte de notre travail –celui du microbiote pulmonaire chez des patients atteints de mucoviscidose et souvent exposés aux antibiotiques par voie intraveineuse à forte dose, l’analyse NGS pourrait évaluer incorrectement l’abondance et la diversité de ce microbiote pulmonaire. Un prétraitement des échantillons par propidium monoazide (PMA), qui permet de cibler sélectivement l’ADN des cellules vivantes, pourrait être une solution pour palier à cette limite. Notre étude avait donc comme objectif de déterminer si un prétraitement par PMA des expectorations modifiait le microbiote pro- et eucaryote pulmonaire analysé par NGS. Nous discutons l’intérêt et la relevance clinique de cette approche « PMA - NGS » permettant une quantification isolée des microorganismes vivants dans le contexte de la mucoviscidose
Chronic pulmonary infection results in an irreversible decline in lung function in patients with cystic fibrosis (CF). While several bacteria are known as main causes for these infections (for example: Pseudomonas aeruginosa, Staphylococcus aureus, Burkholderia cepacia, Achromobacter xylosoxidans...), more recently some fungal genera including filamentous fungi (such as Aspergillus, Scedosporium...) have also been identified as emerging or re-emerging pathogens able to cause invasive mycosis. Thus, the identification of the microorganisms involved in the respiratory colonizations and/or infections has become essential.Still now culture methods remain the gold standard for diagnostic of microbial infections. However, it could not identify non-culturable or difficult-to-cultivate microorganisms. Thanks to the development of high-throughput sequencing (next generation sequencing or NGS), recent studies have shown that the lung of patients with CF is a complex poly-microbial flora, also called the CF lung microbiota, which includes not only bacteria but also fungi (yeast and/or filamentous fungi), and viruses and phages. Dysbiosis (loss of abundance and/or diversity) of the lung microbiota has been associated with the patient's decreased lung function and poor clinical status.While lung bacteriota and its role in pathogenesis have widely been studied, few research studies focus on the fungal component (mycobiota/ mycobiome) of the lungs. Our thesis (PhD work) focuses on NGS analysis of pro- and eukaryotic lung microbiota in CF patients, in particular on the comparison of different methodological approaches to optimize and standardize the NGS protocol. This project has been developed under the supervision of Pr. Laurence Delhaes in the “Biology and Diversity of Eukaryotic Emerging Pathogens” team directed by Dr. Eric Viscogliosi.Firstly, we present a state of art on the current knowledge on the fungal colonization/infections risk in CF as well as the development of new concepts of lung microbiota and lung mycobiota on which our team focuses.Secondly, we applied the NGS approach to study the pro- and eukaryotic microbiota in the sputum samples of CF patient lung. Indeed, NGS is a powerful technique that may introduce biases on numerous methodological steps. One of the most important biases is that this technique could not differentiate among the living microorganisms, the dead or damaged cells, and the extracellular DNA. In the context of the CF lung microbiota which is often exposed to high-dose intravenous antibiotics, the analysis by NGS might evaluate4inaccurately the abundance and the diversity of the lung microbiota. Pretreatment of samples by propidium monoazide (PMA), which can target selectively the DNA of viable cells, could be a solution to overcome this limitation. Our study aimed to determine whether a sample pretreatment with PMA modified the lung pro- and eukaryotic microbiota analyzed by NGS. We discuss the clinical relevance of this approach "PMA - NGS" in the context of CF patients to a better quantification of living microorganisms
Styles APA, Harvard, Vancouver, ISO, etc.
29

Limasset, Antoine. « Nouvelles approches pour l'exploitation des données de séquences génomique haut débit ». Thesis, Rennes 1, 2017. http://www.theses.fr/2017REN1S049/document.

Texte intégral
Résumé :
Cette thèse a pour sujet les méthodes informatiques traitant les séquences ADN provenant des séquenceurs haut débit. Nous nous concentrons essentiellement sur la reconstruction de génomes à partir de fragments ADN (assemblage génomique) et sur des problèmes connexes. Ces tâches combinent de très grandes quantités de données et des problèmes combinatoires. Différentes structures de graphe sont utilisées pour répondre à ces problèmes, présentant des compromis entre passage à l'échelle et qualité d'assemblage. Ce document introduit plusieurs contributions pour répondre à ces problèmes. De nouvelles représentations de graphes d'assemblage sont proposées pour autoriser un meilleur passage à l'échelle. Nous présentons également de nouveaux usages de ces graphes, différent de l'assemblage, ainsi que des outils pour utiliser ceux-ci comme références dans les cas où un génome de référence n'est pas disponible. Pour finir nous montrons comment utiliser ces méthodes pour produire un meilleur assemblage en utilisant des ressources raisonnables
Novel approaches for the exploitation of high throughput sequencing data In this thesis we discuss computational methods to deal with DNA sequences provided by high throughput sequencers. We will mostly focus on the reconstruction of genomes from DNA fragments (genome assembly) and closely related problems. These tasks combine huge amounts of data with combinatorial problems. Various graph structures are used to handle this problem, presenting trade-off between scalability and assembly quality. This thesis introduces several contributions in order to cope with these tasks. First, novel representations of assembly graphs are proposed to allow a better scaling. We also present novel uses of those graphs apart from assembly and we propose tools to use such graphs as references when a fully assembled genome is not available. Finally we show how to use those methods to produce less fragmented assembly while remaining tractable
Styles APA, Harvard, Vancouver, ISO, etc.
30

Padioleau, Ismaël. « Étude génomique de l'interférence entre la réplication et la transcription comme source du stress réplicatif ». Thesis, Montpellier, 2017. http://www.theses.fr/2017MONTT053/document.

Texte intégral
Résumé :
L’activation d’oncogènes entraine une prolifération aberrante des cellules, un stress réplicatif et des cassures de l’ADN. Un lien a été établi entre l’instabilité génomique résultant des cassures et l’inhibition de checkpoints entrainant l’accumulation de mutations et finalement le cancer (Halazonetis et al. 2008). Cependant, les mécanismes liant ces différents évènements n’ont pas encore été caractérisés. Notre hypothèse est que la prolifération incontrôlée des cellules augmente les incidents dus aux conflits entre les polymérases responsables de la réplication et celles responsables de la transcription. Lors de la rencontre des deux polymérases, l’accumulation de surenroulements positifs de l’ADN induit un blocage des fourches de réplication. Ceci crée des zones de fragilité, notamment dues à l’exposition d’ADN simple brin, et pourrait être à l’origine des cassures observées chez les cellules tumorales. Pour valider cette hypothèse, les biologistes de l'équipe ont étudié plusieurs lignées de cellules HeLa dans lesquelles les conflits réplication-transcription sont augmentés et j'ai réalisé l'analyse bioinformatique des approches génomiques suivantes :-DRIP-seq pour la détection des R-loops, une structure double brin hybride ADN/ARN qui se forme lors de la transcription, exposant ainsi un brin d’ADN simple brin.- ChIP-seq de γ-H2AX, une marque d’histone indiquant les cassures de l’ADN.-ChIP-seq de phospho-RPA (S33), un substrat de la kinase ATR au niveau des fourches bloquées. Pour chaque expérience, nous avons utilisé une lignée contrôle et deux lignées dans lesquelles TOP1 et ASF/SF2 sont appauvries avec un shRNA inductible (shTOP1 et shASF). La Topoisomérase I (TOP1) est une enzyme qui relaxe les surenroulements de l’ADN. Le complexe ASF/SF2 est un facteur d’épissage responsable entre autres de l’assemblage des mRNP (ribonucleoprotein particles) au moment de la transcription, qui limitent la formation des R-loops. L’analyse bioinformatique de ces données, ainsi que d'autres données de la littérature, m'a permis d'identifier des régions à risque du génome, localisées en aval de gènes fortement transcrits et répliqués précocement en phase S par des fourches progressant en sens opposé à la transcription. J’ai également observé que les gènes impliqués dans le cancer sont surreprésentés dans ces régions à risque
Oncogenes activation promotes aberrant cell proliferation, increasing replication stress and DNA damage. It has been proposed that genomic instability leads to checkpoints inhibition and promotes cancer development (Halazonetis et al. 2008). However, the link between aberrant proliferation, replication stress and DNA breaks is still unclear. We hypothesized that aberrant proliferation leads to more incident due to DNA and RNA polymerases encounter and stalling. When the two polymerases encounter, the accumulation of positive-supercoiled DNA between two polymerases induces fork stalling, resulting in the formation of fragile structures such as single-stranded DNA (ssDNA). These ssDNAs formed at stalled forks could be a source for DNA breaks, promoting the development of cancer cells. To validate this hypothesis, biologists from our team have worked on HeLa cell lines with increased replication-transcription conflicts. I perform the bioinformatics analysis of the following genomic data:- DRIP-seq: R-Loops positioning on genome using immunoprecipitation on DNA/RNA hybrids.-γ-H2AX ChIP-Seq: Gamma-H2AX is an histone mark found at DNA breaks.-pRPA ChIP-Seq : Positioning of stalled forks using the substrate of ATR kinase, phospho-RPA (S33) as a marker.Each data was produced on control cells and two cell lines where TOP1 and ASF/SF2 were depleted by as inducible shRNA (shTOP1 and shASF). Topoisomerase 1 is a topological enzyme that unwinds DNA when supercoiling accumulates. ASF/SF2 is part of the splicing complexes that processes mRNP (messenger ribonucleoprotein particles) to prevent the accumulation of R-loops during transcription. Using these data and others from literature, I determined that regions having higher risk to induce replication stress are located downstream of highly transcribed and early replicated genes, and preferentially with head-on collision between DNA and RNA polymerases. I also revealed that cancer-related genes are enriched in these regions of the genome
Styles APA, Harvard, Vancouver, ISO, etc.
31

Doan, Trung-Tung. « Epidémiologie moléculaire et métagénomique à haut débit sur la grille ». Phd thesis, Université Blaise Pascal - Clermont-Ferrand II, 2012. http://tel.archives-ouvertes.fr/tel-00778073.

Texte intégral
Styles APA, Harvard, Vancouver, ISO, etc.
32

Morisse, Pierre. « Correction de données de séquençage de troisième génération ». Thesis, Normandie, 2019. http://www.theses.fr/2019NORMR043/document.

Texte intégral
Résumé :
Les objectifs de cette thèse s’inscrivent dans la large problématique du traitement des données issues de séquenceurs à très haut débit, et plus particulièrement des reads longs, issus de séquenceurs de troisième génération.Les aspects abordés dans cette problématiques se concentrent principalement sur la correction des erreurs de séquençage, et sur l’impact de la correction sur la qualité des analyses sous-jacentes, plus particulièrement sur l’assemblage. Dans un premier temps, l’un des objectifs de cette thèse est de permettre d’évaluer et de comparer la qualité de la correction fournie par les différentes méthodes de correction hybride (utilisant des reads courts en complément) et d’auto-correction (se basant uniquement sur l’information contenue dans les reads longs) de l’état de l’art. Une telle évaluation permet d’identifier aisément quelle méthode de correction est la mieux adaptée à un cas donné, notamment en fonction de la complexité du génome étudié, de la profondeur de séquençage, ou du taux d’erreurs des reads. De plus, les développeurs peuvent ainsi identifier les limitations des méthodes existantes, afin de guider leurs travaux et de proposer de nouvelles solutions visant à pallier ces limitations. Un nouvel outil d’évaluation, proposant de nombreuses métriques supplémentaires par rapport au seul outil disponible jusqu’alors, a ainsi été développé. Cet outil, combinant une approche par alignement multiple à une stratégie de segmentation, permet également une réduction considérable du temps nécessaire à l’évaluation. À l’aide de cet outil, un benchmark de l’ensemble des méthodes de correction disponibles est présenté, sur une large variété de jeux de données, de profondeur de séquençage, de taux d’erreurs et de complexité variable, de la bactérie A. baylyi à l’humain. Ce benchmark a notamment permis d’identifier deux importantes limitations des outils existants : les reads affichant des taux d’erreurs supérieurs à 30%, et les reads de longueur supérieure à 50 000 paires de bases. Le deuxième objectif de cette thèse est alors la correction des reads extrêmement bruités. Pour cela, un outil de correction hybride, combinant différentes approches de l’état de l’art, a été développé afin de surmonter les limitations des méthodes existantes. En particulier, cet outil combine une stratégie d’alignement des reads courts sur les reads longs à l’utilisation d’un graphe de de Bruijn, ayant la particularité d’être d’ordre variable. Le graphe est ainsi utilisé afin de relier les reads alignés, et donc de corriger les régions non couvertes des reads longs. Cette méthode permet ainsi de corriger des reads affichant des taux d’erreurs atteignant jusqu’à 44%, tout en permettant un meilleur passage à l’échelle sur de larges génomes et une diminution du temps de traitement, par rapport aux méthodes de l’état de l’art les plus efficaces. Enfin, le troisième objectif de cette thèse est la correction des reads extrêmement longs. Pour cela, un outil utilisant cette fois une approche par auto-correction a été développé, en combinant, de nouveau, différentes méthodologies de l’état de l’art. Plus précisément, une stratégie de calcul des chevauchements entre les reads, puis une double étape de correction, par alignement multiple puis par utilisation de graphes de de Bruijn locaux, sont utilisées ici. Afin de permettre à cette méthode de passer efficacement à l’échelle sur les reads extrêmement longs, la stratégie de segmentation mentionnée précédemment a été généralisée. Cette méthode d’auto-correction permet ainsi de corriger des reads atteignant jusqu’à 340 000 paires de bases, tout en permettant un excellent passage à l’échelle sur des génomes plus complexes, tels que celui de l’humain
The aims of this thesis are part of the vast problematic of high-throughput sequencing data analysis. More specifically, this thesis deals with long reads from third-generation sequencing technologies. The aspects tackled in this topic mainly focus on error correction, and on its impact on downstream analyses such a de novo assembly. As a first step, one of the objectives of this thesis is to evaluate and compare the quality of the error correction provided by the state-of-the-art tools, whether they employ a hybrid (using complementary short reads) or a self-correction (relying only on the information contained in the long reads sequences) strategy. Such an evaluation allows to easily identify which method is best tailored for a given case, according to the genome complexity, the sequencing depth, or the error rate of the reads. Moreover, developpers can thus identify the limiting factors of the existing methods, in order to guide their work and propose new solutions allowing to overcome these limitations. A new evaluation tool, providing a wide variety of metrics, compared to the only tool previously available, was thus developped. This tool combines a multiple sequence alignment approach and a segmentation strategy, thus allowing to drastically reduce the evaluation runtime. With the help of this tool, we present a benchmark of all the state-of-the-art error correction methods, on various datasets from several organisms, spanning from the A. baylyi bacteria to the human. This benchmark allowed to spot two major limiting factors of the existing tools: the reads displaying error rates above 30%, and the reads reaching more than 50 000 base pairs. The second objective of this thesis is thus the error correction of highly noisy long reads. To this aim, a hybrid error correction tool, combining different strategies from the state-of-the-art, was developped, in order to overcome the limiting factors of existing methods. More precisely, this tool combines a short reads alignmentstrategy to the use of a variable-order de Bruijn graph. This graph is used in order to link the aligned short reads, and thus correct the uncovered regions of the long reads. This method allows to process reads displaying error rates as high as 44%, and scales better to larger genomes, while allowing to reduce the runtime of the error correction, compared to the most efficient state-of-the-art tools.Finally, the third objectif of this thesis is the error correction of extremely long reads. To this aim, aself-correction tool was developed, by combining, once again, different methologies from the state-of-the-art. More precisely, an overlapping strategy, and a two phases error correction process, using multiple sequence alignement and local de Bruijn graphs, are used. In order to allow this method to scale to extremely long reads, the aforementioned segmentation strategy was generalized. This self-correction methods allows to process reads reaching up to 340 000 base pairs, and manages to scale very well to complex organisms such as the human genome
Styles APA, Harvard, Vancouver, ISO, etc.
33

Langouët, Maéva. « Démembrement génétique des déficiences intellectuelles et compréhension des bases physiopathologiques associées, à l'ère du séquençage à haut débit ». Thesis, Paris 5, 2014. http://www.theses.fr/2014PA05T045/document.

Texte intégral
Résumé :
La déficience intellectuelle (DI) est définie comme un dysfonctionnement intellectuel général inférieur à la moyenne, qui s'accompagne de limitations significatives du fonctionnement adaptatif (DSM-V). Il s'agit d'un handicap fréquent qui concerne près de 3% de la population générale. L'identification de l'étiologie d'une DI est une question primordiale car elle permet d'optimiser la prise en charge des patients sans risque de passer à côté d'une cause curable, et d'évaluer le risque de récidive dans la famille afin d'offrir un conseil génétique pour les grossesses à venir. Malgré les récents progrès, l'étiologie de la maladie reste inconnue dans près de 40% des cas. Le démembrement des causes génétiques et la compréhension des bases physiopathologiques des DI constituent donc un grand défi scientifique et médical. Par ailleurs, l'identification des gènes impliqués dans les DI et le décryptage des processus cellulaires sous-jacents à ces phénotypes sont une approche de choix pour étudier le développement et la plasticité cérébrale chez l'homme d'une part et entrevoir le développement de nouvelles stratégies thérapeutiques d'autre part. Le travail de thèse présenté dans ce manuscrit s'inscrit dans cette thématique de recherche et a porté sur l'analyse, par la méthode de Whole Exome Sequencing (WES), de cinq familles indépendantes dans lesquelles ségrège une forme syndromique de DI. La première partie détaille les résultats obtenus pour l'analyse de trois familles consanguines dans lesquelles ségrège une DI autosomique récessive. La seconde partie présente l'étude de deux familles indépendantes dont les enfants atteints présentent une clinique très semblable. Au total, ce mémoire décrit l'identification de i) deux gènes précédemment associés à la DI (WDR62 et AP4M1), ii) deux gènes candidats (RAD54B et HERC2), potentiels modificateurs des symptômes observés, puis iii) la définition d'un nouveau mode d'hérédité, et enfin iv) la caractérisation de deux nouveaux gènes impliqués dans la DI (TTI2 et NONO) suivie des études fonctionnelles des efiets des mutations sur les cellules de patients et l'analyse d'un modèle murin Nonogt
Intellectual deficiency (ID) is characterized by a broad range of deficits in higher brain functions that result in significant limitations in adaptive and cognitive capacities required for competence in daily living, communication, social interaction and integration, self-direction, and work (DSM-V). ID affects approximately 3% of the population. Identifying ID causes is essential to improve patients' care services with no risk to miss a curable cause, but also to provide genetic counselling to the family for future pregnancies. Little is known about the biological bases of these conditions. Indeed, despite recent advances in cytogenetic and molecular genetics, the cause of the mental handicap remains unexplained in 40% of the cases. Understanding the molecular bases of these disorders is therefore an important medical challenge for the next years. Also, ID genes identification and analysis of the cellular mechanisms underlying these conditions should provide significant insight into the molecular and cellular pathways involved in cognition and may lead to new therapeutic trials aiming at improving the daily living of these patients and their families. The PhD work presented here report on the analysis, using Whole Exome Sequencing (WES), of five different families presenting with syndromic ID. The first part develops results from the analysis of three consanguineous families with an autosomal recessive form of ID. The second part presents the study of 2 unrelated male ID patients who presented the same clinical features. Overall, this work allowed the identification of i) two genes previously associated with ID (WDR62 and AP4M1), ii) two candidate genes (RAD54B and HERC2), potential modifiers of the phenotype, then iii) the definition of a novel hereditary mode, and finally iv) the characterization of two new genes of ID (TTI2 and NONO) followed by the functional analysis of mutations effects in patients' cells and the Nonogt mouse model
Styles APA, Harvard, Vancouver, ISO, etc.
34

Ferreira, de Carvalho Julie. « Évolution du génome des spartines polyploïdes envahissant les marais salés : apport des nouvelles techniques de séquençage haut-débit ». Phd thesis, Université Rennes 1, 2013. http://tel.archives-ouvertes.fr/tel-00795861.

Texte intégral
Résumé :
Les Spartines jouent un rôle écologique majeur sur les marais salés. Elles représentent un excellent modèle pour appréhender les conséquences écologiques de la spéciation par hybridation et polyploïdie dans le contexte d'invasion biologique. On s'intéresse plus particulièrement, à l'hybridation récente entre une espèce hexaploïde d'origine américaine Spartina alterniflora et une espèce hexaploïde européenne S. maritima ayant donnés deux hybrides F1 (S. x townsendii et S. x neyrautii) et la nouvelle espèce envahissante allododécaploïde (S. anglica). Les nouvelles technologies de séquençage haut-débit facilitent l'exploration de ces génomes peu connus. L'assemblage et l'annotation d'un transcriptome de référence ont permis d'annoter 16 753 gènes chez les spartines hexaploïdes et d'identifier des gènes d'intérêts écologique et évolutif. Une sélection de ces gènes a ensuite été analysée à travers une étude d'expression par PCR quantitative sur les populations naturelles des 5 espèces du complexe. Les résultats ont permis de mettre en évidence une expression homogène intra-populations mais une grande variabilité entre les espèces. L'analyse du génome des Spartines a ciblé prioritairement le développement de ressources génomiques concernant l'espèce S. maritima pour l'analyse des compartiments codant et répété à l'aide de séquençage d'une banque BAC et d'un run de pyroséquençage d'ADN génomique. Les analyses ont permis d'évaluer une proportion d'éléments répétés représentant près de 30% du génome. Les données générées ont alors été comparées avec les génomes séquencés phylogénétiquement proches et ont permis de premières comparaisons entre les spartines et les autres Poaceae.
Styles APA, Harvard, Vancouver, ISO, etc.
35

Bernard, Elsa. « Etude de l'épissage grâce à des techniques de régression parcimonieuse dans l'ère du séquençage haut débit de l'ARN ». Thesis, Paris Sciences et Lettres (ComUE), 2016. http://www.theses.fr/2016PSLEM063/document.

Texte intégral
Résumé :
Le nombre de gènes codant pour des protéines chez l’'homme, le vers rond et la mouche des fruits est du même ordre de grandeur. Cette absence de correspondance entre le nombre de gènes d’un eucaryote et sa complexité phénotypique s’explique en partie par le caractère alternatif de l’épissage.L'épissage alternatif augmente considérablement le répertoire fonctionnel de protéines codées par un nombre limité de gènes. Ce mécanisme, très actif lors du développement embryonnaire, participe au devenir cellulaire. De nombreux troubles génétiques, hérités ou acquis (en particulier certains cancers), se caractérisent par une altération de son fonctionnement.Les technologies de séquençage à haut débit de l'ARN donnent accès a une information plus riche sur le mécanisme de l’épissage. Cependant, si la lecture à haut débit des séquences d’ARN est plus rapide et moins coûteuse, les données qui en sont issues sont complexes et nécessitent le développement d’outils algorithmiques pour leur interprétation. En particulier, la reconstruction des transcrits alternatifs requiert une étape de déconvolution non triviale.Dans ce contexte, cette thèse participe à l'étude des événements d'épissage et des transcrits alternatifs sur des données de séquençage à haut débit de l'ARN.Nous proposons de nouvelles méthodes pour reconstruire et quantifier les transcrits alternatifs de façon plus efficace et précise. Nos contributions méthodologiques impliquent des techniques de régression parcimonieuse, basées sur l'optimisation convexe et sur des algorithmes de flots. Nous étudions également une procédure pour détecter des anomalies d'épissage dans un contexte de diagnostic clinique. Nous suggérons un protocole expérimental facilement opérant et développons de nouveaux modèles statistiques et algorithmes pour quantifier des événements d’épissage et mesurer leur degré d'anormalité chez le patient
The number of protein-coding genes in a human, a nematodeand a fruit fly are roughly equal.The paradoxical miscorrelation between the number of genesin an organism's genome and its phenotypic complexityfinds an explanation in the alternative natureof splicing in higher organisms.Alternative splicing largely increases the functionaldiversity of proteins encoded by a limitednumber of genes.It is known to be involved incell fate decisionand embryonic development,but also appears to be dysregulatedin inherited and acquired human genetic disorders,in particular in cancers.High-throughput RNA sequencing technologiesallow us to measure and question splicingat an unprecedented resolution.However, while the cost of sequencing RNA decreasesand throughput increases,many computational challenges arise from the discrete and local nature of the data.In particular, the task of inferring alternative transcripts requires a non-trivial deconvolution procedure.In this thesis, we contribute to deciphering alternative transcript expressions andalternative splicing events fromhigh-throughput RNA sequencing data.We propose new methods to accurately and efficientlydetect and quantify alternative transcripts.Our methodological contributionslargely rely on sparse regression techniquesand takes advantage ofnetwork flow optimization techniques.Besides, we investigate means to query splicing abnormalitiesfor clinical diagnosis purposes.We suggest an experimental protocolthat can be easily implemented in routine clinical practice,and present new statistical models and algorithmsto quantify splicing events and measure how abnormal these eventsmight be in patient data compared to wild-type situations
Styles APA, Harvard, Vancouver, ISO, etc.
36

Mouden, Charlotte. « Holoprosencéphalie : identification de nouveaux gènes et redéfinition du mode de transmission par des approches de séquençage haut-débit ». Thesis, Rennes 1, 2016. http://www.theses.fr/2016REN1B012/document.

Texte intégral
Résumé :
L’holoprosencéphalie (HPE) est la malformation congénitale cérébrale la plus fréquente chez l’Homme. Elle est caractérisée par une non-séparation plus ou moins importante des hémisphères cérébraux. Lorsqu’elle ne provient pas de défauts chromosomiques, une origine génétique est suspectée. Quatorze gènes sont impliqués, appartenant majoritairement aux voies de signalisation SHH, NODAL, FGF et NOTCH. Au total, les mutations retrouvées n’expliquent qu’environ un tiers des cas d’HPE non-chromosomique, et le mode de transmission n’est pas clairement établi. Afin d’améliorer le rendement diagnostique et le conseil génétique auprès des familles concernées, l’équipe GPLD (IGDR) cherche à identifier de nouveaux gènes impliqués. Dans ce but, le séquençage exomique de familles a été initié depuis 2013. Dans une famille consanguine, une mutation homozygote délétère dans le gène STIL a été identifiée. La protéine STIL est impliquée dans l’assemblage du cil primaire par lequel transite le signal SHH, dont la dysfonction est la première cause d’HPE. Dans une autre famille consanguine, une mutation homozygote candidate est présente dans FAT1, protocadhérine impliquée dans le développement cérébral et responsable d’HPE chez les modèles animaux. D’autres familles, non-consanguines, ont été analysées en trio. Les enfants de toutes ces familles portent une mutation dans un gène de l’HPE, héritée d’un de leur parent asymptomatique. Des mutations additionnelles ont été recherchées, en supposant une origine multigénique de l’HPE chez ces enfants. Un digénisme SHH/DISP1 est présent dans l’une d’elles, et des associations de mutations candidates ont été mises en évidence dans les autres familles, dont une impliquant également FAT1. En conclusion, ces travaux apportent de nouveaux éléments pour la compréhension des bases génétiques de l’HPE et notamment de nouveaux arguments en faveur d’une part importante de multigénisme. L’investigation de ces bases génétiques complexes nécessite le développement de nouvelles méthodes d’analyses, qui pourront être utiles à d’autres pathologies du développement pour lesquelles une origine multigénique est suspectée
Holoprosencephaly (HPE) is the most common developmental disorder affecting the brain in humans. HPE is characterised by a lack of interhemispheric separation, on a varying scale of severity. When HPE is not due to chromosomal aberrations, a genetic origin is suspected. Alterations of fourteen genes have been implicated in HPE, mainly involved in SHH, NODAL, FGF and NOTCH signalling pathways, with an unclear mode of inheritance. In order to increase the molecular diagnosis yield and to improve genetic counselling, the goal of the GPLD team (IGDR) is to identify new genes. In one inbred family, a deleterious homozygous mutation in STIL gene has been identified. The STIL protein is involved in primary cilia assembly, through which SHH signalling transits. In another inbred family, a homozygous candidate mutation was located in FAT1, a protocadherin involved in brain development that causes HPE-like phenotypes in animal models. For other non-consanguineous families, exome sequencing data were analysed in trios. All children of these families have a previously identified mutation in a HPE gene that is transmitted from a healthy parent. The approach consisted in searching for additional genetic events, under the hypothesis of a multigenic inheritance. Thus, a digenic inheritance of mutations in SHH and DISP1 has been identified in one family. Further associations of candidate mutations have been identified in others, one also involving FAT1. In conclusion, this work provides new elements accounting for the understanding of HPE genetic bases and particularly new arguments in favour of a multigenic inheritance. The study of these complex genetics bases requires the development of new analytical methods that could be of use in relation to other developmental disorders in which a multigenic inheritance is suspected
Styles APA, Harvard, Vancouver, ISO, etc.
37

Osman, Naoum Jorge. « Étude des populations bactériennes des écosystèmes des sols oligotrophes en utilisant des technologies de séquençage à haut débit ». Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS196/document.

Texte intégral
Résumé :
"Où peut-on trouver des microbes, et comment survivent-ils dans ces lieux ?" sont des questions essentielles afin de comprendre la vie sur Terre. Les populations bactériennes du sol sont connues pour jouer un rôle important dans les cycles biogéochimiques, l'entretien des sols, les effets climatiques et l'agriculture.Dans ce travail, j'ai utilisé la technique de pyroséquençage, via le produit d’une PCR d’ADNr 16S amplifiée extraite d’ADN totale, afin de révéler les populations bactériennes présentes dans quatre environnements inhabituels et oligotrophes différents:A. Les écosystèmes saumâtres sont largement distribués sur Terre et sont représentés par des systèmes aquifères salés et des sols salins. Nous avons examiné la composition bactérienne des sédiments des estuaires, sols saumâtres et des échantillons de sol sablonneux de la région de Camargue, échantillonnés pendant deux années consécutives. Les membres appartenant au phylum Proteobacteria, Bacteroidetes, Chloroflexi, Firmicutes, Acidobacteria et Actinobactéries ont été trouvés principalement dans les sols et sédiments. Nous avons constaté que les membres de ces groupes bactériens étaient associés principalement à des bactéries halophiles, sulfatoréductrices (SRB), nitratoréductrices et coliformes, dont leurs proportions ont probablement été affectées par la salinité et leurs localisations géographiques.B. Les bactéries associées à la rhizosphère des plantes sont connues pour jouer un rôle essentiel dans les cycles biogéochimiques, la nutrition des plantes et la lutte biologique contre les maladies végétales. Nous avons examiné les populations bactériennes de la rhizosphère du riz (Oryza sativa) en fin de croissance dans la région de la Camargue en 2013 et 2014. Les populations bactériennes les plus abondantes se sont révélées être des membres appartenant au phylum Proteobacteria, Acidobacteria, Chloroflexi et Gemmatimonadetes. Les genres bactériens auxquels appartiennent ces différents phylums sont connus pour participer dans des processus biogéochimiques du sol, tel que la nitrification, la dénitrification, l'oxydation, ainsi que comme agents de control biologique. Les proportions bactériennes trouvées varient considérablement en fonction de leur localisation géographique et selon l’année d’échantillonnage.C. Nous avons examiné les sols de surface de "Padza de Dapani" situés sur l'île de Mayotte au large de la côte est de l'Afrique, car cette région n’est pas un vrai désert, mais y ressemble due à l’érosion du sol. Les sols de Mayotte sont acides, oligotrophes et minéralisées, et leur population bactérienne principale appartient aux phylums des Actinobactéries, Proteobacteria et Acidobacteria. Un fait intéressant, les membres des genres Acinetobacter, Arthrobacter, Burkholderia et Bacillus sont prédominants dans nos échantillons, comme observé dans des déserts (asiatiques) chauds et jouant probablement un rôle dans la minéralisation des sols, expliquant la désertification.D. Les régions arides de la Terre constituent > de 30% de la surface continentale et les sols oligotrophes sont soumis à des facteurs environnementaux difficiles tels que la faible pluviométrie moyenne annuelle, l'exposition aux UV et les grandes fluctuations de température. Nous avons examiné les populations bactériennes présentes dans la rhizosphère des plantes pionnières et les sols de surface du désert de Jizan d'Arabie Saoudite. Les phylums bactériens les plus abondants appartiennent aux groupes des Bacteroidetes, Proteobacteria et Firmicutes qui diffèrent entre la rhizosphère des plantes étudiées par rapport à la surface du sol, à l'exception de la plante "Panicum Turgidum" qui contient des proportions élevées (70%) des membres appartenant au genre Flavobacterium
“What microbes are where, and how do they live there” is now an essential question to understand life on Earth, even when comparing seemingly similar ecosystems in different locations. Soil bacterial populations are known to play important roles in biogeochemical cycles, soil maintenance, climatic effects and agriculture. I used pyrosequencing of PCR amplified 16S rDNA from total extracted DNA in order to reveal the bacterial populations living in four different unusual and oligotrophic environments: A. Saline areas are widely distributed on Earth’s and are represented by both saline lakes and saline soils. We examined the bacterial composition of estuary sediments, brackish and sandy soil samples from the Camargue region (Rhône delta in southern France) sampled in two consecutive years. Members belonging to the Proteobacteria, Bacteroidetes, Chloroflexi, Firmicutes, Acidobacteria and Actinobacteria phyla were found principally in saline sediment and soil samples. We found that members from these phyla were associated principally to halophilic bacteria, sulphate reducing bacteria (SRB), nitrate reducing bacteria and coliforms, and that their varying proportions were likely affected by salinity and geographical location. B. Bacterial populations associated with the rhizosphere of plants are known to play essential roles in biogeochemical cycles, plant nutrition and disease biocontrol. We examined the bacterial populations of the rhizosphere of rice (Oryza sativa) growing in the Camargue region in 2013 and 2014. The most abundant bacterial populations were found to be members belonging to the Proteobacteria, Acidobacteria, Chloroflexi and Gemmatimonadetes phyla. The genera members belong these phyla were found to participate in soil biogeochemical processes such as nitrification, denitrification, oxidation, as well as act as biocontrol agents. The bacterial populations were found to significantly vary by geographical location as well by year of collection. C. We examined the surface soils from “Padza de Dapani” on the island of Mayotte off the east coast of Africa, as this region is not a true (hot) desert, but resembles one due to extensive soil erosion. In the acidic, oligotrophic and mineralized soil samples from Mayotte, members of the Actinobacteria, Proteobacteria and Acidobacteria phyla dominated the bacterial populations. Interestingly, members of the genera Acinetobacter, Arthrobacter, Burkholderia and Bacillus were found to be predominant in our samples, as is also observed in hot (Asian) deserts and may play roles in soil mineral weathering, thus helping to understand desertification processes. D. Earth’s arid regions comprise >30% of the continental surface and the oligotrophic soils are subjected to harsh environmental factors such as low average annual rainfall, high UV exposure and large temperature fluctuations. We examined the bacterial populations present in the rhizosphere of pioneer plants and surface soils in the Jizan desert of Saudi Arabia. The most abundant bacterial phyla belonged to the Bacteroidetes, Proteobacteria and Firmicutes phyla that were different between the rhizosphere of plant versus these from surface sand, with the exception of the plant “Panicum Turgidum”, which contain in its rhizosphere high proportions (70%) of members belonging to the Flavobacterium genus
Styles APA, Harvard, Vancouver, ISO, etc.
38

Molet, Lucie. « Génotypage des papillomavirus humains par séquençage haut-débit : conséquences dans le dépistage du cancer du col de l’utérus et apport conceptuel au virome cutané ». Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLS231/document.

Texte intégral
Résumé :
Les papillomavirus humains (HPV) sont classés en 5 genres α, β, γ, µ et η. Leur génome comprend six gènes précoces dont deux oncogènes E6 et E7 et deux gènes tardifs codant les protéines de capside. Les β- et γ-HPV constituent une part importante du virome cutané. Généralement asymptomatiques ils peuvent se manifester par des papillomatoses et sont associés à certains cancers de la peau, en particulier chez l’immunodéprimé. Les α-HPV ont un tropisme muqueux ; les α-HPV à haut risque (HR) HPV16 et 18 sont impliqués dans 99% des cancers du col de l’utérus.La détection des α-HR-HPV dans les frottis cervico-utérins (FCU) lors d’atypie cellulaire de signification indéterminée (ASCUS) constitue une information décisive dans le dépistage du cancer du col de l’utérus, bien que les tests de génotypage ne ciblent que les types les plus fréquents. Le génotypage des β- et γ-HPV devient nécessaire pour l’étude du virome notamment dans des contextes de susceptibilité aux pathogénies HPV (syndrome WHIM : Warts, Hypogammaglobulimemia, Infections and Myelokathexis). Cet immunodéficit congénital rare causé par une mutation gain de fonction du récepteur CXCR4 se manifeste dans 70% des cas par des papillomatoses cutanées étendues et ano-génitales évoluant souvent en cancer. Des études du laboratoire ont identifié le rôle intrinsèque de l’axe CXCL12/CXCR4 dérégulé dans la pathogénie virale en démontrant notamment l’action bénéfique du blocage de cet axe par un antagoniste de CXCR4 (AMD3100) in vitro et in vivo sur l’oncogenèse due à HPV.Nos objectifs étaient : (i) d’identifier dans des FCU ASCUS, les HPV dont le génotype n’avait pu être déterminé (HPV-X) par un test classique (INNO-LiPA HPV Genotyping Extra II®), (ii) de caractériser le virome HPV d’un patient atteint de WHIM au cours d’un essai thérapeutique par AMD3100 administré à titre compassionnel pendant 7 mois avec pour objectif d’évaluer son impact sur les anomalies associées à HPV.Dans les deux cas, nous avons mis au point une méthode de génotypage par séquençage haut débit sur Illumina Miseq®. La distribution des génotypes et leur polymorphisme nucléotidique ont été étudiés par analyses comparatives et phylogénétiques. (i) Notre stratégie a permis d’identifier dans 54 ASCUS/HPV-X étudiés une majorité d'HPV bas risque réalisant dans 41% des cas une infection à multiples génotypes (2 à 7), et aussi l’existence de quasi-espèces (41% des FCU) comprenant jusqu’à 17 variants pour un même génotype. Ainsi, de probables compétitions ou défauts d’hybridation des variants minoritaires peuvent expliquer le manque de performance du test INNO-LiPA. (ii) Chez le patient WHIM, le séquençage a été complété par des qPCR spécifiques de types, permettant une étude qualitative et quantitative. L’AMD3100 n’a pas modifié qualitativement le virome HPV cutané composé de 16 types, principalement des β- et γ-HPV, déjà présents 3 ans auparavant dans des verrues cutanées analysées rétrospectivement. En revanche, l’analyse quantitative montre des modifications en proportion relative des génomes viraux suggérant un effet du traitement sur l‘expression de certains types pouvant être associés sélectivement à la papillomatose. A cet égard, un des HPV composant le virome cutané du patient qui se trouve être un des deux seuls types présents dans une biopsie profonde de verrue, étaye l’hypothèse d’une sélection dans le processus lésionnel. De plus, les protéines oncogènes E6 et E7 de ce virus présentent des mutations, en comparaison à la séquence du génome HPV de référence, qui pourraient favoriser le potentiel pathogène de ce varian; hypothèse en cours d’investigation.En conclusion, les techniques de séquençage haut débit que nous avons développées ont permis de mieux caractériser la composition du virome HPV démontrant à la fois sa complexité en génotypes viraux ou en dérivés de ceux-ci (concept de quasi-espèces) et sa dynamique d’évolution qui pourraient sous-tendre le potentiel pathogène de ce virome HPV
Human papillomaviruses (HPV) are classified into 5 genera α, β, γ, μ and η. Their genome comprises six early genes including two oncogenes E6 and E7, and two late genes encoding the L1 and L2 capsid proteins. β- and γ-HPV constitute an important part of the cutaneous virome; usually asymptomatic, they can manifest as papillomatosis like warts and are associated with certain skin cancers, especially in immunocompromised patients. α-HPV has a mucosal tropism; high-risk (HR) α-HPV16 and 18 are involved in 99% of cervical cancers.Detection of α-HR-HPV in cervical samples guide the management of women whose Pap smear result shows atypical squamous cells of undetermined significance (ASCUS), although genotyping targets only the most common HPV types. Genotyping of β- and γ-HPV becomes necessary for the study of the virome especially in contexts of susceptibility to HPV pathogenesis (i.e. WHIM syndrome (for Warts, Hypogammaglobulimemia, Infections and Myelokathexis)). WHIM syndrome is a rare congenital immunodeficiency caused by a gain-of-function mutation of the CXCR4 receptor of the chemokine CXCL12 and manifests in 70% of cases by extensive cutaneous papillomatosis and ano-genital lesions that often evolve into cancer. Studies in our laboratory have identified the intrinsic role of the dysregulated CXCL12/CXCR4 axis in viral pathogenesis by demonstrating in particular the beneficial action of the blocking of this axis by an antagonist of CXCR4 (AMD3100) in vitro and in vivo on HPV-associated oncogenesis.Our objectives were: (i) to identify HPV whose genotype could not be determined (HPV-X) by a conventional test (INNO-LiPA HPV Genotyping Extra II®) in cervical samples with Pap smear report of ASCUS (ii) to characterize the HPV virome of a patient suffering from WHIM syndrom during a 7-month compassionate AMD3100 clinical trial to assess its impact on HPV-associated abnormalities.In both cases, we have developed a high-throughput sequencing genotyping method on Illumina Miseq®. The distribution of genotypes and their nucleotide polymorphism were studied by comparative and phylogenetic analyzes. (i) Our strategy identified in the 54 investigated ASCUS/HPV-X a majority of low-risk HPV, achieving a multiple infection (2 to 7 genotypes) in 41% of cases, and also the existence of quasi-species (41% of FCU) comprising up to 17 variants for the same genotype. Thus, probable competitions or hybridization defects of the minority variants may explain the lack of performance of the INNO-LiPA test. (ii) In the WHIM patient, sequencing was supplemented with type-specific qPCRs, allowing a qualitative and quantitative study. AMD3100 did not qualitatively modify the cutaneous HPV virome composed of 16 types, mainly β- and γ-HPV. In contrast, the quantitative analysis shows changes in the relative proportions of viral genomes suggesting a treatment effect on the expression of certain types that can be selectively associated with. papillomatosis. In this respect, one of the HPVs belonging to the cutaneous virome of the patient was found to be one of only two types present in a deep wart biopsy. This result supports the hypothesis of HPV selection in the lesion process. In addition, the oncogenic proteins E6 and E7 of this virus have mutations which could promote the pathogenic potential of this viral variant in comparison with the sequence of the reference HPV genome; a hypothesis that is under investigation.In conclusion, the high throughput sequencing techniques that we have developed have made it possible to better characterize the composition of the HPV virome demonstrating both its complexity in viral genotypes or in derivatives (i.e. quasi-species concept). The dynamics of which may underlie the pathogenic potential of this HPV virome
Styles APA, Harvard, Vancouver, ISO, etc.
39

Mansour-Hendili, Lamisse. « Mise en place d’une stratégie de validation fonctionnelle de variations de signification incertaine dans les pathologies constitutionnelles du globule rouge ». Electronic Thesis or Diss., Paris 12, 2022. http://www.theses.fr/2022PA120057.

Texte intégral
Résumé :
Le déploiement du séquençage haut débit (SHD) ces dernières années au sein des laboratoires de génétique hospitaliers en France et dans le monde a révolutionné la prise en charge des maladies rares dont les anémies hémolytiques constitutionnelles (AHC). Il a conduit à la multiplication des variations de signification incertaine (VSI) nécessitant la mise en œuvre de tests fonctionnels pour aboutir à une re-classification. L’objectif de ce travail est de proposer une stratégie réaliste et efficace d’exploration fonctionnelle de VSI associés aux AHC. Cette démarche repose sur les études génétiques familiales, l’étude de transcrits sur tubes Paxgene, le développement de méthodes d’études du GR comme le LORRCA pour l’étude de la membrane, la réorientation de techniques comme la courbe de densité des GR par gradient de phtalates et la mise en place d’un réseau collaboratif (CNRS de Roscoff pour les études électrophysiologiques). Nous avons montré l’intérêt du SHD chez ces patients avec suspicion d’AHC et mis en évidence des associations de variations d’intérêt dans différents gènes de pathologies du GR chez un même patient (Mansour-Hendili et al 2020). Nous avons identifié une nouvelle entité pathologique chez deux patients avec une anémie hémolytique « auto-immune à test direct à l’antiglobuline négatif » non répondeurs aux immunomodulateurs. Il s’agit d’un mécanisme de sphérocytose acquise par mutation ponctuelle du gène ANK1 probablement associé à une hématopoièse clonale du sujet âgé (soumission en cours). La réalisation d’un génome entier a permis d’aboutir à un diagnostic pour un enfant atteint d’une hémolyse inexpliquée transfuso-dépendante avec retard neurodéveloppemental due au gène VPS4A (Lunati-Rozie et al 2021). Via un système de reconvocation de patients, les explorations complémentaires ont pu être réalisées. Vingt-cinq patients ont eu une étude de transcrits permettant la reclassification de seize variations. Dix études familiales ont été réalisées dont une excluant le caractère délétère d’un VSI du gène GATA1. Nous avons montré l’intérêt de la mesure de la densité des GR comme outil de screening des pathologies de membrane du GR. Son utilisation comme test fonctionnel dans les cas d’associations de variations dans des gènes de membrane a mis en exergue l’utilité du taux de cellules denses comme marqueur différentiel de la présence/absence de la variation associée. De plus, les profils d’osmoscan permettent de discriminer des profils de patients avec associations de variations comparativement à des témoins « positifs » sans association. Les études de stabilité menées pour ces tests à différents temps et températures de stockage montrent l’importance des conditions pré-analytiques. Nous avons illustré ce problème avec la mutation connue du gène KCNN4 : p.R352H décrite avec des profils d’osmoscan et d’ektacytométrie normaux. Nous avons retrouvé à deux reprises sur deux échantillons et manipulations indépendantes réalisées sans stockage des profils d’osmoscan anormaux. Par ailleurs, nous montrons l’intérêt de l’étude des propriétés électrophysiologiques des canaux PIEZO1 et KCNN4 réalisée à Roscoff dans la classification de VSI (Mansour-Hendili et al 2021). Pour les cas d’associations de variations d’intérêt les profils d’interprétation sont plus complexes mais montrent également des différences de profil par rapport à des témoins bien choisis. Ce travail a permis de démontrer l’utilité en plus des études familiales et de transcrits, d’outils diagnostic ou de suivi phénotypiques du GR (LORRCA, densité des GR) pour l’aide à la validation fonctionnelle de VSI isolés ou en association. Cela nécessite des moyens de reconvocation, des contrôles positifs adéquats et un respect des conditions préanalytiques. La mise en place de réseaux collaboratifs apporte une véritable utilité et une plus-value intellectuelle et humaine réciproque. Le retour au phénotype est indispensable à la classification des VSI concernant les AHC
The deployment of next generation sequencing (NGS) over the past ten years in hospital genetic laboratories in France and around the world has revolutionized the management of rare diseases, including constitutional hemolytic anemia (CHA). It has led to the multiplication of variations of uncertain significance (VUS) requiring the implementation of functional tests to permit a re-classification. The objective of this work is to propose a realistic and effective strategy for the functional exploration of VUS associated with CHs. This approach is based on family genetic studies, study of transcripts on Paxgene tubes, development of methods on-site such as the LORRCA MaxSis for the study of the RBC membrane properties, improvment of techniques such as the RBC density measurement by phthalate gradient and establishment of a collaborative network (example of CNRS in Roscoff for electrophysiological studies). We have shown the interest of NGS in these patients with suspected CHA and have highlighted associations of variations of interest in different genes of RBC pathologies in the same patient (Mansour-Hendili et al 2020). We identified a new pathological entity in two patients with “autoimmune direct antiglobulin test negative” haemolytic anemia who did not respond to immunomodulators. This is a mechanism of acquired spherocytosis by point mutation of the ANK1 gene probably due to clonal hematopoiesis in the elderly (submission in progress). The realization of a whole genome sequencing led to a diagnosis for a child suffering from unexplained transfusion-dependent hemolysis with neurodevelopmental delay due to the VPS4A gene (Lunati-Rozie et al 2021). Via a patient recall system, additional explorations have been carried out. Twenty-five patients underwent a transcript study allowing the reclassification of sixteen variations. Ten family studies have been carried out, one of which excludes the deleterious nature of a VUS of the GATA1 gene. We have shown the interest of measuring RBC density as screening tool for RBC membrane diseases. Its use as a functional test in the case of associations of variations in RBC membrane genes has highlighted the usefulness of the dense cell rate as a differential marker of the presence/absence of the associated variation. Concerning the LORRCA, osmoscan profiles make it possible to discriminate patient with associations of variations compared to “positive” controls without association. Stability studies conducted for these phenotypic tests at different storage times and temperatures show the importance of pre-analytical conditions. We illustrated this problem with the known KCNN4 gene mutation: p.R352H described with a normal osmoscan and ektacytometry profiles. We found twice on two independent samples and manipulations realized on D0 without storage abnormal osmoscan profiles. In addition, we show the interest of the study of electrophysiological properties of the PIEZO1 and KCNN4 channels carried out in Roscoff in the classification of VUS (case one patient with a new KCNN4 mutation and thrombosis, Mansour-Hendili et al 2021). For the associations of variations of interest, the interpretation profiles are more complex but also show profiles differences compared to well-chosen controls. This work has made it possible to demonstrate the usefulness, in addition to family and transcript studies, of RBC phenotypic diagnostic or monitoring tools (LORRCA, density of the GR) to help with the functional validation of isolated or associated VUS in CHA patients. This requires means of revocation, adequate positive controls (intrafamilial cases) and compliance with preanalytical conditions. The establishment of collaborative networks also brings real usefulness and reciprocal intellectual and human added value. The return to the phenotype is an essential recourse for the classification of VUS in particular for the CHA
Styles APA, Harvard, Vancouver, ISO, etc.
40

Seesao, Yuwalee. « Caractérisation des Anisakidae dans les poissons marins : développement d’une méthode d’identification par séquençage à haut-débit et étude de prévalence ». Thesis, Lille 2, 2015. http://www.theses.fr/2015LIL2S043/document.

Texte intégral
Résumé :
Les genres Anisakis, Pseudoterranova, Hysterothylacium et Contracaecum, membres de la famille des Anisakidae, sont des nématodes dont les larves sont présentes chez de nombreuses espèces de poissons et céphalopodes. Ces larves peuvent induire des pathologies digestives et/ou allergiques chez l’Homme. En France, la consommation des produits de la pêche, surtout crus ou peu cuits est en augmentation. Ce travail de thèse s’intègre dans le programme ANR Fish-Parasites, financé par l’ANR (ANR-10-ALIA-004). Il a pour but d’évaluer les risques liés à la consommation des produits de la pêche et pour objectif principal d’étudier la répartition des Anisakidae dans les produits de la pêche. _x000D_Le plan d’échantillonnage a été établi suite à une analyse de type risk-ranking utilisant les données de consommation, l’origine géographique, des données de prévalence déjà existantes sur les Anisakidae. Au total, 1768 poissons appartenant à 18 espèces ont été collectés. L’ensemble des organes a été disséqué pour isoler les parasites. Ceux-ci ont été identifiés selon 2 méthodes : i) analyse individuelle par séquençage Sanger pour les organes ayant moins de 11 nématodes ii) analyse en pool par séquençage à haut débit (HTS) pour le reste. Le développement de plusieurs outils (création d’une base de séquences de référence, conception des amorces, mise au point de la préparation de matrice de séquençage et développement d’un pipeline d’analyse automatisé) a été nécessaire pour la mise en place de la méthode HTS. A partir des résultats obtenus, une acquisition et une structuration des données de prévalence des parasites potentiellement pathogènes pour l’Homme et présents dans les produits de la pêche couramment consommés a pu être réalisée.Sur 1 768 poissons échantillonnés, deux espèces n’étaient pas du tout parasitées : plies (Pleuronectes platessa) et saumon Atlantique (Salmo salar) d’élevage. 43,30 % des poissons n’étaient pas infectés par des Anisakidae. Sur la totalité des poissons, 28,62 % étaient infectés au niveau des viscères ; 22,96% dans les viscères et les filets et 5,49 % n’étaient infectés par des Anisakidae que dans les filets.Les cinq espèces de poisson dont la prévalence dans les filets était la plus élevée étaient : la lingue bleue (100 %), la cardine franche (70 %), le lieu noir (63 %), la baudroie (61 %) et le merlu (60 %).Les Anisakidae les plus identifiés étaient : Anisakis simplex, Anisakis pegreffii, Hysterothylacium aduncum, Pseudoterranova krabbeii.Anisakis a été retrouvé dans toutes les localisations et généralement de façon plus importante, Contracaecum a été retrouvé principalement dans le foie, Hysterothylacium dans la cavité corporelle et Pseudoterranova dans les filets et la cavité corporelle.Anisakis simplex était présent dans toutes les zones de pêches sauf dans le golfe du Lion. La zone des eaux féringiennes était la zone dans laquelle la diversité des Anisakidae était la plus importante sur une seule espèce de poisson échantillonnée (lingue bleue).L’étude statistique logistique multivariée a montré que la variable espèce et la variable taille du poisson influencent la prévalence d’Anisakis et Pseudoterranova dans les filets.Le HTS sur le PGM™ Ion Torrent s’est révélé être un outil puissant et innovant permettant l’analyse d’un grand nombre d‘échantillons d’Anisakidés à moindre coût, en peu de temps et avec un résultat équivalent à la méthode individuelle par séquençage Sanger
Anisakis, Pseudoterranova, Hysterothylacium and Contracaecum genera, members of the Anisakids family, are nematodes which larvae are recovered from numerous fish and cephalopods species. These larvae may induce digestive and/or allergic pathologies in human being. In France, the consumption of fishery products, mostly raw or undercooked is increasing. This PhD work is part of the research program Fish-Parasites funded by the ANR (ANR-10-ALIA-004). It aimed to assess risks related to fishery products consumption and its main goal was to study the distribution of Anisakids in fishery products.The sampling plan was based on a risk-ranking analysis using data on fishery products consumption, fishing areas and prevalence data from previous work on Anisakids. A total of 1 768 fish from 18 species were collected. All the organs were dissected for parasites isolation. Parasites were identified using two approaches : i) single analysis by Sanger sequencing for organs containing less than 11 nematodes ii) pooled analysis by high throughput sequencing (HTS) for the remaining. The development of numerous tools (database creation with reference sequences, primers design, set up of the sequencing template preparation and development of an automatic analytical pipeline) was necessary for the HTS method set up. From the sequencing results, acquisition and structuring of the prevalence data has been carried out on parasites potentially pathogenic for human being and recovered from commonly consumed fishery products.On 1 768 sampled fish, two species were not parasitized at all: plaice (Pleuronectes platessa) and aquacultured Atlantic salmon (Salmo salar). 43.30 % of the fish were not infected by Anisakids. Concerning infected fish, 28.62% were contaminated in the visceral organs; 22.96% in both visceral organs and fillets and, finally, 5.49% of the fish were infected by Anisakids only in fillets.The five fish species with an elevated prevalence in their fillets were by decreasing values: blue ling (100 %), megrim (70 %), saithe (63 %), monkfish (61 %) and hake (60 %). The most identified Anisakids were: Anisakis simplex, Anisakis pegreffii, Hysterothylacium aduncum, Pseudoterranova krabbeii.Anisakis has been recovered in all the localisations and generally in higher quantities, Contracaecum has mainly been recovered from the liver, Hysterothylacium from the corporal cavity and Pseudoterranova from both fillets and corporal cavity. Anisakis simplex was isolated from all the fishing areas except for the Lion Gulf and it was the genus with the most important number of individuals. The zone of Feroan waters was the region with the most important diversity of Anisakids into a single sampled fish species (blue ling).The multivariate logistic statistical study showed that the fish species and size affect the prevalence of Anisakis and Pseudoterranova in fish fillets.HTS with the PGM™ Ion Torrent proved to be a powerful and innovative tool for the analysis of large numbers of Anisakids samples with low cost, in a shorter time and with a result equivalent to the individual method of Sanger sequencing
Styles APA, Harvard, Vancouver, ISO, etc.
41

Mallaret, Martial. « Identification de nouveaux gènes d'ataxies cérébelleuses récessives et intérêt du séquençage haut débit dans le diagnostic des ataxies d'origine génétique ». Thesis, Strasbourg, 2015. http://www.theses.fr/2015STRAJ090/document.

Texte intégral
Résumé :
Les ataxies cérébelleuses héréditaires sont un ensemble de pathologies neurodégénératives ou neuro-développementales rares responsables d’un handicap fonctionnel important. Nous décrivons la découverte dans deux familles consanguines avec une ataxie cérébelleuse, une épilepsie et un retard mental deux mutations homozygotes dans le gène WWOX à l’aide du séquençage de l’exome d’un des patients de chaque famille. Ce gène était connu comme un gène suppresseur de tumeur. Par une stratégie de capture ciblée de 57 gènes d’ataxies cérébelleuses sur une série de 155 patients, nous avons posé un diagnostic dans 20,6% des cas dont des mutations d’ANO10 et SYNE1. Des études multicentriques ont permis d’étendre les connaissances sur ces maladies et montrer l’existence de phénotypes sévères dans ARCA1.A partir de cette série, nous avons validé en aveugle la pertinence d’un algorithme diagnostique clinico-biologique proposé par l’article de Anheim dans le New England Journal of Medicine en 2012
Hereditary cerebellar ataxias are a group of neurodegenerative or neurodevelopemental diseases responsible of major disability. We found thanks to exome sequencing mutations in the WWOX gene in two consaguineous families presenting with cerebellar ataxia, epilepsy and mental retardation. This gene was until recently only recognized to be a tumor suppressor.With a 57 ataxia genes targeted capture strategy, next generation sequencing in 155 patients found 20,6% of positive diagnosis, including several new mutations in ANO10 and SYNE1. Multi center studies allow to extend clinical knowledge with severes phenotypes especially in ARCA1.We validate a clinico-biological algorithm for recesssive ataxias diagnosis published by Anheim in the in New England Journal of Medicine, 2012 in a blinded manner
Styles APA, Harvard, Vancouver, ISO, etc.
42

Fenouil, Romain. « Etude des mécanismes de la régulation transcriptionnelle et développement d'outils bioinformatiques pour le traitement des données de séquençage haut débit ». Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM4089.

Texte intégral
Résumé :
Les mécanismes de régulation de l’expression génétique sont essentiels pour l’adaptation du comportement cellulaire face à son environnement (différenciation, développement, réponse à un stimulus). Les études moléculaires décrivent une grande diversité de facteurs impliqués dans ce phénomène (TFs, marques épigénétiques, nucléosomes) et plusieurs niveaux de régulation (initiation, élongation, épissage, maturation) qui expliquent la complexité du transcriptome cellulaire. Durant ma thèse, nous nous sommes intéressés aux processus de régulation de la transcription en nous appuyant sur le modèle de la différenciation lymphocytaire murine. Nos études décrivent le recrutement des GTFs et une activité transcriptionnelle caractéristique aux promoteurs des gènes et sur les enhancers. Nous montrons également que les ilots CpG (CGIs) sont des éléments régulateurs majeurs chez les mammifères et qu’ils contribuent de manière transcription-indépendante à la déplétion nucléosomale observée aux promoteurs de certains gènes. Nos collaborations nous ont également permis d’aborder des sujets relatifs à l’élongation de la transcription, l’épissage alternatif, ou les combinatoires de PTMs que peuvent exhiber le CTD de l’ARN Pol II et les queues d’histones. Dans un contexte de transition de l’ère pré-génomique vers des approches expérimentales pangénomiques (s’appuyant notamment sur les technologies de séquençage haut débit), une proportion importante de ma période doctorale fut consacrée au développement d’outils bioinformatiques pour le traitement et les analyses de données expérimentales, issues de ChIP-on-chip puis de HTS (ChIP-Seq, MNase-Seq, RNA-Seq)
Mechanisms underlying the regulation of genetic expression are crucial for cell maintenance and adaptation to environment (differentiation, development...). Molecular approaches reveal a great diversity of factors involved in this process (TFs, epigenetics, nucleosomes) and several layers of regulation (transcription initiation, elongation, splicing, maturation) which contribute to the observed transcriptome complexity. During my thesis, we studied the mechanisms of transcription regulation in mammals during lymphocyte differentiation. Briefly, we described the recruitment of GTFs and the transcriptional activity occurring on promoters and enhancers. We also reveal that CpG islands (CGIs) are major regulator elements in mammals, which contribute to nucleosome depletion in a transcription-independent manner on a significant amount of promoters. Together with our collaborators, we also studied the mechanisms of transcription elongation, alternative splicing, or the complex combinatorial patterns of PTMs that can be set on the CTD of RNA Polymerase II and on histone tails. In the context of transition from pre-genomic studies to genome-wide experiments, an important part of my work consisted in the development of bioinformatics tools for the processing and analysis of experimental datasets from ChIP-on-chip, and HTS technologies (ChIP-Seq, MNase-Seq, RNA-Seq)
Styles APA, Harvard, Vancouver, ISO, etc.
43

Lussac-Sorton, Florian. « Effet des thérapies protéiques sur l’axe intestin-poumon dans la mucoviscidose ». Electronic Thesis or Diss., Bordeaux, 2024. http://www.theses.fr/2024BORD0428.

Texte intégral
Résumé :
La mucoviscidose est une pathologie multi-organes dont la progression est principalement déterminée par les atteintes respiratoires et digestives. L’avènement des modulateurs de CFTR en a révolutionné le pronostic au cours de la dernière décennie. Les perturbations du microbiote et du mycobiote ont été bien décrites dans la mucoviscidose, ainsi que dans une moindre mesure les connexions inter-organes définissant l’axe intestin-poumon. Cependant les données sont encore lacunaires concernant l’impact des thérapies protéiques sur le myco-microbiote.Le protocole LUM-IVA-BIOTA est une étude nationale multicentrique visant à documenter l’évolution du myco-microbiote et de l’inflammation chez des patients recevant l’association lumacaftor-ivacaftor (LUM/IVA), grâce à des approches de métagénomique ciblée. La première partie du travail portant sur des patients de plus de 12 ans a montré que l’effet de LUM/IVA sur le microbiote pulmonaire dépendait de la colonisation chronique par Pseudomonas aeruginosa. La suite du projet a porté sur une cohorte d’enfants de 2 à 11 ans et a permis de mettre en évidence des améliorations des microbiotes pulmonaire et intestinal sous LUM/IVA avec modification de l’axe intestin-poumon, en confirmant le rôle clé de la colonisation par P. aeruginosa dans l’amélioration du microbiote pulmonaire. Ces résultats soulignent que les thérapies protéiques peuvent améliorer la diversité des flores microbiennes au sein de l’axe intestin-poumon si elles sont initiées précocement, avant le tournant évolutif de la colonisation par P. aeruginosa. Ils seront à confirmer chez des patients recevant les nouvelles générations de modulateurs tels que la trithérapie élexacaftor-tézacaftor-ivacaftor
Cystic fibrosis is a multi-organ disease whose progression is mainly determined by respiratory and digestive damage. The advent of CFTR modulators has revolutionized its prognosis over the last decade. Alterations in microbiota and mycobiota have been well described in cystic fibrosis, as have, to a lesser extent, the inter-organ connections defining the gut-lung axis. Yet there is still a lack of data regarding the impact of protein therapies on the mycobiota-microbiota.The LUM-IVA-BIOTA protocol is a national multicentric study designed to decipher the evolution of mycobiota-microbiota and inflammation in patients receiving the lumacaftor-ivacaftor (LUM/IVA) combination, using targeted metagenomic approaches. The first part of this work, involving patients over 12 years of age, showed that the effect of LUM/IVA on lung microbiota depended on chronic colonization with Pseudomonas aeruginosa. The next stage of the project involved a cohort of children aged 2 to 11 and demonstrated improvements in lung and gut microbiotas on LUM/IVA with changes in the gut-lung axis, while confirming the key role of P. aeruginosa colonization in improving lung microbiota. These results highlight that protein therapies can improve the diversity of microbial florae within the gut-lung axis if initiated early on, before the turning point of P. aeruginosa colonization. These findings need to be further confirmed in patients receiving next-generation modulators such as the elexacaftor-tezacaftor-ivacaftor triple therapy
Styles APA, Harvard, Vancouver, ISO, etc.
44

Chalabi, Smahane. « Caractérisation de la reprogrammation de l'expression des gènes chez les blés allopyloïdes ». Thesis, Evry-Val d'Essonne, 2014. http://www.theses.fr/2014EVRY0040.

Texte intégral
Résumé :
La polyploïdie ou la duplication des génomes est une force majeure dans l'évolution et l'adaptation des espèces, notamment des angiospermes qui ont tous eu des évènements de polyploïdisation réccurrents au cours de leur évolution. Afin de comprendre la reprogrammation de l'expression des gènes en réponse à la polyploïdie chez les espèces économiquement importantes du blé (genres Triticum et Aegilops), j'ai utilisé un modèle original, qui consiste à caractériser les réponses à la diminution puis la ré-augmentation du niveau de ploïdie. Ainsi, le blé allotétraploïde (T. turgidum, BBAA) est extrait à partir du blé naturel allohexaploïde (T. aestivum, BBAADD). Ce blé allotétraploïde extrait est hybridé à son tour à l'espèce diploïde Ae. tauschii (DD) pour synthétiser un blé allohexaploïde.J'ai utilisé des méthodes d'analyse de l'expression des gènes basées sur les microarrays ainsi que le séquençage massif des ARN (RNA-Seq), basé sur les outils de nouvelles générations de séquençage (NGS) et rendu possible par la récente mise à disposition des séquences de trois copies homéologues (Ah, Bh, Dh) de 8605 gènes. Les méthodes bioinformatiques et statistiques appropriées ont été développées et/ou utilisées.Mes travaux révèlent un partitionnement de l'expression des gènes en celles des homéologues qui les composent dans les différents allopolyploïdes étudiés. La majorité des homéologues contribuent à l'expression globale des gènes de manière équivalente (1/3 chacun), d'autres présentent un biais d'expression spécifique vers un des homéologues, sans montrer de dominance d'un des sous-génomes. Une concertation dans le partitionnement et le niveau d'expression des homéologues est bien établie dans le blé: la majorité des homéologues augmentent leur expression lorsqu'ils sont séparés et la diminuent lorsqu'ils sont rassemblés dans un niveau de ploïdie supérieur. Ainsi, dans le blé allohexaploïde, pour la majorité des gènes, l'expression des homéologues Ah et Bh est égale au 2/3 de leur niveau d'expression dans le blé allotétraploïde extrait, et l'expression de l'homéoallèle Dh est égale au 1/3 du niveau d'expression dans le blé diploïde donneur du génome D. Cette concertation de l'expression des homéologues maintiendrait l'expression globale des gènes à des niveaux similaires dans les différentes espèces de blé de différents niveaux de ploïdie.Les résultats obtenus contribuent à la compréhension de la régulation de l'expression des gènes dans les polyploïdes du blé et la contribution des homéologues qui les composent. Les analyses futures des fonctions des différentes catégories d'expression des gènes permettraient d'identifier des fonctions particulières régulées en réponse à la polyploïdie
Polyploidy is a major evolutionary force, especially in angiosperms, all of which species have undergone recurrent polyploidization events during their evolution.In order to understand reprogramming of gene expression in response to polyploidy in the economically important wheat species (genera Triticum and Aegilops), I used an original model that consists in decreasing and reincreasing ploidy levels. Thus, the allotetraploid T. turgidum (BBAA) is extracted from the allohexaploid bread wheat T. aestivum (BBAADD), consisting in decreasing ploidy level. This extracted allotetraploid is crossed with the diploid species Ae. tauschii (DD) to synthesize an allohexaploid wheat, consisting in re-increasing ploidy level.The characterization of reprogramming of gene expression in response to decreasing and re-increasing ploidy levels was done here using first microarray technologies and then massive parallel mRNA sequencing (RNA-Seq), that has been rendered possible by the recent ‘draft' hexaploid wheat genome sequencing and subsequently the availability of the three homoeologs sequences (Ah, Bh, Dh) of 8605 genes. Adequate bioinformatics and statistics methods have been adopted and/or developed and used.My work reveals a partitioning of global expression of genes into that of their constituent homoeologs in different wheats allopolyploids. Most of homoeologs contribute equally to the overall gene expression and a low proportion reveals a bias towards one homoeolog, without showing a global dominance of a specific sub-genome. The partitioning and concerted expression of homoeologs is also established in wheat. Most homoeologs increase their expression when separated and reduce their expression levels when joined together in a higher ploidy level. For most genes, Ah and Bh homoeolog expression in allohexaploid wheat is equal to 2/3 of their expression level in the extracted allotetraploid wheat whereas the Dh homoeolog expression level is equal to 1/3 of that in the wheat diploid genome. This concerted change in homoeolog expression maintains the global gene expression at nearly similar levels in different ploidy levels.Results obtained in this work contribute to our understanding of global gene expression regulation and its partitioning between constituent homoeologs at different ploidy levels. Functional analysis of the different gene expression categories would reveal important gene functional categories that are regulated in response to polyploidy
Styles APA, Harvard, Vancouver, ISO, etc.
45

Vandenborght, Louise-Eva. « Étude des microbiotes endogènes et exogènes de patients atteints de maladie respiratoire chronique ». Thesis, Bordeaux, 2019. http://www.theses.fr/2019BORD0410.

Texte intégral
Résumé :
Du pôle nord au fin fond des océans jusque dans l’atmosphère, des microorganismes, qui nous ont précédé pour certain il y a des milliards d’années, ont été identifiés. L’avènement des technologies de séquençage haut débit (NGS) a facilité la découverte et l’étude de ces communautés microbiennes issues de divers milieux, dont le corps humain. Ainsi, le corps humain apparait composé de dix fois plus de microorganismes que de ses propres cellules. Le microbiote intestinal, de biomasse importante, est l’un des plus étudiés. En revanche, les études portant sur le microbiote pulmonaire n’en sont qu’à leurs prémisses, en particuliers dans le cadre de maladies respiratoires chroniques (MRC). Alors que les poumons étaient jusque très récemment considérés comme stériles, ils s’avèrent être composés d’une communauté poly-microbienne constituée de bactéries, de virus, de phages et de micromycètes. Dans le cas des MRC, comme l'asthme et la mucoviscidose étudiés dans ce travail, la composition du microbiote pulmonaire déterminée par NGS semble corrélée à l’évolution clinique des patients.Dans la mucoviscidose (maladie génétique la plus fréquente dans la population caucasienne) comme dans l’asthme (une pathologie multifactorielle attribuée à des facteurs environnementaux associés à une prédisposition génétique qui connait une prévalence en constante augmentation), les modifications en abondance et diversité (ou dysbiose) des communautés bactériennes (microbiote endogène) sont bien documentées. Cependant, l’étude du mycobiote endogène (des communautés de micromycètes au niveau pulmonaire) reste beaucoup moins réalisée. En effet, cette étude du mycobiote présente des défis méthodologiques inhérents à sa très faible biomasse, mais aussi à la structure même de la paroi des champignons.De plus, peu d’informations existent sur les relations entre ce microbiote pulmonaire endogène et celui de l’environnement immédiat des patients (microbiote exogène ou exposome), alors que cet exposome microbien en particulier fongique représente un facteur de risque connu de développement d’une MRC. L’étude de l’exposome microbien présente un challenge méthodologique, en termes d’échantillonnage et de caractérisation des communautés microbiennes qui sont aussi de faible biomasse.L’objectif de ce travail était dans un premier temps d’optimiser l’analyse du mycobiote, à partir de communautés artificielles de micromycètes depuis l’étape d’extraction jusqu’à la sélection des cibles les plus efficientes pour une approche de métagénomique ciblée appliquée à l’étude du mycobiote dans la mucoviscidose et l’asthme. Concernant l’étude de l’exposome microbien, l’évaluation d’un dispositif de recueil des microorganismes présents dans l’environnement intérieur des patients a fait l’objet d’un développement durant ce travail de thèse ; ceci afin de mettre à disposition de la communauté scientifique un outil optimisé et standardisé.Dans un second temps, les microbiotes et mycobiotes endogènes de patients atteints de mucoviscidose, caractérisés par NGS ont été analysés en prenant en compte l’état clinique des patients, notamment l’existence d’une exacerbation pulmonaire. En s’intéressant aux interactions interrègnes entre les bactéries et les micromycètes identifiés chez ces patients, des corrélations impliquant des genres fongiques connus comme pathogènes et pouvant être responsable de colonisation et/ou infections tel qu’Aspergillus, Scedosporium et Candida ont été mises en évidences. Ceci a permis pour la première fois de confirmer (à partir de nos données expérimentales) la place du mycobiome endogène dans le modèle écologique « Climax/Attack » adapté à la mucoviscidose. [...]
The microorganisms, some of which preceded us billions of years ago, have been identified from the North Pole to the bottom of the ocean until in the atmosphere. The advent of High Throughput Sequencing (HTS) technologies has facilitated the discovery and study of these microbial communities, including the human body. Thus, the human body appears to be composed of ten times more microorganisms than its own cells. Notably, the intestinal microbiota is one of the most investigated; it is composed of a significant biomass. In contrast, studies on the pulmonary microbiota are only in their early stages, particularly in the context of chronic respiratory diseases (CRD). While until recently lungs were considered as sterile organs, they are now found to be composed of a poly-microbial community of bacteria, viruses, phages and fungi. In the case of CRD, such as asthma and cystic fibrosis studied in this PhD work, the composition of the pulmonary microbiota determined by NGS appears to correlate with the clinical course of the patients.In cystic fibrosis (the most common genetic disease in the Caucasian population) and asthma (a multifactorial disease attributed to environmental factors associated with a genetic predisposition which knows a constantly increasing prevalence), changes in abundance and diversity (known as dysbiosis) of bacterial communities (endogenous microbiota) are well documented. However, the study of endogenous mycobiota (fungal community that resides into the lungs) remains much less investigated. Indeed, it presents methodological challenges inherent to its very low biomass, but also to the structure of fungi wall.In addition, very few information exits on the relationship between the endogenous pulmonary microbiota of patients and the corresponding indoor environment (or exogenous microbiota), whereas this specific fungal exposure represents a known risk factor for the development of a CRD. The study of such microbial exposome also presents methodological challenges, in terms of sampling and characterization of the microbial communities that are also of low biomass.The main objective of this work was initially to optimize mycobiota analysis, using an artificial fungal community from the extraction steps to the selection of the most efficient fungal targets to perform targeted metagenomics in cystic fibrosis and asthma context. Concerning the study of the microbial exposome, the evaluation of a device for the collection of microorganisms present in the patient's indoor environment was developed during this work in order to provide an optimized, standardized, and scientifically relevant tool.Secondly, the NGS characterization of endogenous microbiota and mycobiota of cystic fibrosis patients was investigated by taking into account their clinical state, in particular the existence of a pulmonary exacerbation. Correlations involving fungal genera known to be medically relevant such as Aspergillus, Scedosporium and Candida have been identified by focusing on the inter-kingdom network between bacteria and fungi identified in patients. It allowed us to confirm (from our experimental data) the role of the endogenous mycobiota in the ecological model “Climax / Attack" adapted to cystic fibrosis. [...]
Styles APA, Harvard, Vancouver, ISO, etc.
46

Ben, Nsira Nadia. « Algorithme de recherche incrémentale d'un motif dans un ensemble de séquences d'ADN issues de séquençages à haut débit ». Thesis, Normandie, 2017. http://www.theses.fr/2017NORMR143/document.

Texte intégral
Résumé :
Dans cette thèse, nous nous intéressons au problème de recherche incrémentale de motifs dans des séquences fortement similaires (On-line Pattern Matching on Highly Similar Sequences), issues de technologies de séquençage à haut débit (SHD). Ces séquences ne diffèrent que par de très petites quantités de variations et présentent un niveau de similarité très élevé. Il y a donc un fort besoin d'algorithmes efficaces pour effectuer la recherche rapide de motifs dans de tels ensembles de séquences spécifiques. Nous développons de nouveaux algorithmes pour traiter ce problème. Cette thèse est répartie en cinq parties. Dans la première partie, nous présentons un état de l'art sur les algorithmes les plus connus du problème de recherche de motifs et les index associés. Puis, dans les trois parties suivantes, nous développons trois algorithmes directement dédiés à la recherche incrémentale de motifs dans un ensemble de séquences fortement similaires. Enfin, dans la cinquième partie, nous effectuons une étude expérimentale sur ces algorithmes. Cette étude a montré que nos algorithmes sont efficaces en pratique en terme de temps de calcul
In this thesis, we are interested in the problem of on-line pattern matching in highly similar sequences, On-line Pattern Matching on Highly Similar Sequences, outcoming from Next Generation Sequencing technologies (NGS). These sequences only differ by a very small amount. There is thus a strong need for efficient algorithms for performing fast pattern matching in such specific sets of sequences. We develop new algorithms to process this problem. This thesis is partitioned into five parts. In the first part, we present a state of the art on the most popular algorithms of finding problem and the related indexes. Then, in the three following parts, we develop three algorithms directly dedicated to the on-line search for patterns in a set of highly similar sequences. Finally, in the fifth part, we conduct an experimental study on these algorithms. This study shows that our algorithms are efficient in practice in terms of computation time
Styles APA, Harvard, Vancouver, ISO, etc.
47

Morales, Raul. « L'apport du séquençage à haut débit dans la recherche de nouvelles associations génotype-phénotype dans les myopathies : cas particuliers des titinopathies ». Thesis, Montpellier, 2019. http://www.theses.fr/2019MONTT083.

Texte intégral
Résumé :
L’apport du séquençage à haut débit dans la recherche de nouvelles associations génotype-phénotype. Cas particulier des titinopathies.Les myopathies sont un groupe de pathologies hétérogènes sur le plan phénotypique et génétique, avec actuellement plus de 150 gènes identifiés. Compte tenu de cette grande hétérogénéité, de l’existence de gènes de grande taille et de l’absence d’une nette corrélation phénotype-génotype, l’approche classique d’étude gène par gène (technique Sanger) était très chronophage et d’une efficacité limitée. Le séquençage de nouvelle génération a révolutionné leur diagnostic en permettant de séquencer, en un seul temps, l'ensemble des séquences d'intérêt de plusieurs gènes, incluant les gènes de grande taille. La problématique actuelle est que la mise en place de la technique de NGS à visée diagnostique a confronté les laboratoires de diagnostic génétique à des difficultés dans l’interprétation des nombreux variants de séquence retrouvés pour chaque patient.Nous avons analysé par NGS une cohorte de 156 patients atteints d’une myopathie non étiquetée après avoir éliminé les principales hypothèses cliniques par des recherches d’un seul gène par la technique Sanger ou par de mini-panels de gènes. Des variants pathogènes ou probablement pathogènes ont été identifiés chez 74 des 156 patients (47,4%). Un des résultats les plus significatifs de notre étude est le pourcentage très élevé de diagnostics positifs chez les patients de moins d’un an présentant une hypotonie néonatale avec atteinte respiratoire. Notre approche a permis de confirmer le diagnostic chez 82% des cas. Une des conséquences du travail a été la proposition de faire un NGS en première intention chez ce type de patients ce qui permettra de pouvoir réaliser une prise en charge adaptée et un conseil génétique approprié aux parents.Un autre résultat très intéressant a été l'identification de nouvelles associations phénotypes/génotypes dans environ 10% des cas. Nous les avons classées en trois catégories : 1) Phénotype modéré par rapport à la sévérité clinique habituelle associée aux variants pathogènes dans le gène en cause. 2) Phénotype élargi si les symptômes n’avaient pas été décrits précédemment et 3) Variants dans un gène récemment impliqué dans les myopathies. La deuxième partie du travail concernait l’analyse de 13 familles par WES, (séquençage de toutes les régions codantes de l’ADN) pour lesquelles le NGS sur panel de gènes était négatif. Nous avons pu confirmer le diagnostic uniquement chez une famille. Ce résultat est en accord avec les données de la littérature, qui montrent que l’efficacité du WES n’est pas supérieure à celle du NGS sur panel de gènes. La troisième partie de la thèse était focalisée sur l’étude du gène TTN qui représente un exemple des difficultés d’interprétation des variants issus de l’analysé par NGS, étant donné la grande taille du gène avec 364 exons et la présence importante des variants dans la population générale. Nous avons mis en place dans le laboratoire un projet dont l’objectif général a été de développer une approche intégrée phénotype-hérédité-génotype-transcrits-protéine. Un des éléments principaux est l’étude des conséquences des variants TTN sur les transcrits et sur la quantité et la taille de la protéine par WB. Les études réalisées chez des patients atteints de formes de transmission récessive de titinopathie congénitale a montré des effets complexes, avec plusieurs populations de transcrits. Par ailleurs, nous avons pu établir une nouvelle corrélation génotype-phénotype chez une famille avec phénotype de myopathie distale à prédominance postérieure qui portaient une délétion hétérozygote des exons 11 à 18 du gène TTN. A notre connaissance, ce phénotype particulier n’a pas été rapporté jusqu’à présent dans la littérature
Unravelling new phenotype/genotype correlations in myopathies with next generation sequencing. TitinopathiesNext-generation sequencing (NGS) is a revolutionary technology that allows the simultaneous analysis of multiple genes. The main NGS challenge is the clinical interpretation of the molecular findings to differentiate pathogenic, likely pathogenic, and non-clinically significant DNA variants. The purpose of this study was the detection of gene variants that cause myopathy in a cohort of 156 pediatric and adult patients by targeted NGS. We identified a pathogenic variant in 74 of the 156 patients (47.4%). The highest rate of positive diagnosis was in patients with congenital myopathies. Particularly, 82% of patients with severe hypotonia at birth had a pathogenic variant, suggesting that NGS should be considered the first diagnostic tool in this group. The most interesting result was the identification in 10% of patients of new or unusual phenotype/genotype associations concerning several genes. In some cases, this contributed to expand the phenotype associated with a specific gene. In the others, the disease severity or the inheritance mode differed from the classical clinical descriptions. The stepwise diagnostic methodology used in this work and the selected patient population could explain the remarkably high percentage of expanded phenotype-genotype associations (more than 10% of cases). Indeed, in addition to the classical in silico predictions of the variant and familial segregation, the procedure for validating the association between atypical or incomplete phenotypes and a genetic variant included also deep phenotyping (i.e., detailed clinical examination, whole-body muscle MRI, and additional techniques for muscular biopsy analysis, such as electron microscopy), multidisciplinary concertation, exhaustive and continuous literature update and if necessary, advice from international laboratories that are experts in specific genes.Since the widespread use of Next Generation Sequencing (NGS), the exhaustive analysis of the 364 exons of the TTN gene revealed an increasingly number of reported TTN variants. However, it is often difficult to assess the pathogenicity of the identified variants, in particular missense ones, due to the clinical heterogeneity of the pathology, the large size of the gene, the frequency of TTN variants in the general population. The aim of the study is to develop a workflow for interpreting TTN variants. This workflow is based on deep phenotyping, evaluation of the effects of TTN variants predicted to affect transcription and/or splicing on skeletal muscle titin transcripts, and evaluation of the consequences of some variants on protein by Western Blot studies. Our study highlights the importance of analyzing the consequences of variants not only on protein, but also on transcripts, to have an exhaustive understanding of the consequences of variants at the transcriptional and protein level
Styles APA, Harvard, Vancouver, ISO, etc.
48

Gondard, Mathilde. « A la découverte des agents pathogènes et microorganismes des tiques par séquençage de nouvelle génération et QPCR microfluidique à haut débit ». Thesis, Paris Est, 2017. http://www.theses.fr/2017PESC1017.

Texte intégral
Résumé :
Les maladies à transmission vectorielle sont dues à des agents pathogènes transmis par des arthropodes hématophages. Ces vecteurs assurent une transmission active (mécanique ou biologique) d’un agent infectieux d’un vertébré vers un autre vertébré. A l’échelle mondiale, les tiques sont responsables de la transmission de la plus grande variété d’agents pathogènes, elles transmettent des microorganismes responsables de maladies bactériennes (borréliose de Lyme, rickettsioses) ou parasitaires (babésioses, theilérioses), ou même virales (encéphalite à tiques).Les Antilles se situent au cœur de la zone Néotropicale des Caraïbes, et constituent une zone à risque pour l’émergence de maladies vectorielles en raison des conditions climatiques favorables aux vecteurs et des échanges intercontinentaux importants (flux illégal d’animaux, oiseaux migrateurs,…). La situation épidémiologique de la zone Caraïbe vis-à-vis des maladies transmises par les tiques est très peu documentée. Les études menées sur le terrain portent essentiellement sur des agents pathogènes affectant les animaux comme Ehrlichia ruminantium, Babesia (bovis et bigemina) et Anaplasma marginale et sont donc loin de pouvoir répondre aux questions concernant le risque d’émergence ou de réémergence de maladies à tique. Ainsi, il est nécessaire et urgent de développer des outils efficaces de surveillance épidémiologique qui permettraient la détection des agents pathogènes, nouveaux, connus ou non suspectés présents dans les tiques. C’est dans ce contexte d’amélioration des performances de veille sanitaire des maladies à tiques dans les Caraïbes que prend place le projet de thèse. La visée de la thèse était de faire un état des lieux des agents pathogènes d’intérêt médical et vétérinaire présents dans les tiques caribéennes à l’aide de techniques de détection à haut débit. Pour cela nous avons d’abord réalisé un séquençage à haut débit d’ARN extraits de tiques collectées en Guadeloupe et en Martinique afin de réaliser un inventaire sans a priori des agents pathogènes (bactéries, parasites, et virus) présents. Cette analyse a permis de mettre en évidence une grande diversité en microorganismes pathogènes au sein de nos échantillons, révélant également la présence de quatre virus appartenant à de nouveaux genres viraux récemment décrits et associés aux arthropodes. Les informations obtenues via le séquençage, additionnées aux données disponibles dans la littérature ont permis de constituer ainsi une liste des agents pathogènes transmis par les tiques nécessitant une surveillance sanitaire dans les caraïbes. A partir de ce répertoire nous avons développé un système de dépistage à haut-débit d’agents infectieux applicable à toute la zone des caraïbes. L’outil de détection est un support microfluidique de type puce à ADN, basé sur la technologie BioMarkTM dynamic arrays (Fluidigm Corporation) qui permet de réaliser de la PCR en temps réel à haut débit afin de détecter simultanément 48 à 96 cibles au sein de 48 à 96 échantillons. Deux puces ont été développées, une première pour le suivi des bactéries et parasites, et une deuxième pour le suivi des virus. Leur performance a été testée sur des échantillons de tiques collectées en Guadeloupe et en Martinique. Ce dépistage à grande échelle a donné un aperçu complet de la situation épidémiologique de 45 bactéries, 17 parasites and 31 virus potentiellement transmis par les tiques dans les Antilles Françaises. La méthode de surveillance développée durant cette thèse représente une amélioration majeure des techniques de veille épidémiologique, permettant la détection rapide et concomitante d’un large panel d’agent pathogène. Elle sera prochainement appliquée au criblage à haut débit des agents infectieux présent dans des tiques collectées à travers la Caraïbe, provenant notamment de Trinité-et-Tobago, Saint-Kitts, la Barbade, et Sainte-Lucie, grâce à la collaboration du réseau CaribVet, et de vétérinaires locaux
Vector-borne diseases are illnesses caused by pathogens transmitted by haematophagous arthropods which provide active transmission (mechanical or biological) of infectious agents from one vertebrate to another. Among these vectors, ticks are known to carry and transmit the greatest variety of pathogens of public health and veterinary importance. They transmit microorganisms responsible for bacterial (Lyme borreliosis, rickettsioses), parasitic (babesiosis, theileriosis), or viral diseases (tick-borne encephalitis).The Antilles are located in the heart of the Caribbean Neotropical Zone. This area can be considered at risk for the emergence of vector-borne diseases mainly due to favorable environmental conditions and intercontinental exchanges (e.g. legal and illegal animal trade, migratory birds). However, the epidemiological situation of the Caribbean area, with regard to tick-borne diseases, is still poorly documented. Indeed, most of field studies only focused on animal pathogens such as Ehrlichia ruminantium, Babesia (bovis and bigemina) and Anaplasma marginale and questions about the risk of emergence or re-emergence of tick-borne diseases remain unanswered. Thus, it is crucial to develop efficient epidemiological surveillance tools that would enable the detection of new, known or unexpected pathogens present in ticks. In this context, the main objective of my thesis was to obtain an overview of pathogens of medical and veterinary interest present in Caribbean ticks using new high-throughput technologies. We first used a high-throughput sequencing approach to determine pathogens present in ticks (bacteria, parasites, and viruses) collected in Guadeloupe and Martinique. This analysis revealed a great diversity of pathogenic agents in our samples and highlighted the presence of four viruses belonging to new viral families recently described and associated with arthropods. Results of sequencing combined with data available in the literature allowed us to make the most exhaustive list of pathogens potentially transmitted by ticks and requiring health surveillance in the Caribbean area. From this pathogen inventory, we developed a system of high-throughput screening of infectious agents applicable to the whole Caribbean area. This molecular tool is a microfluidic system based on the BiomarkTM dynamic arrays technology (Fluidigm Corporation), which enables high-throughput real-time PCR to simultaneously detect 48-96 targets within 48 to 96 samples. Two different chips have been developed, one for bacteria and parasites monitoring, and one for viruses. Their efficiency was tested on tick samples collected in both Guadeloupe and Martinique. This large-scale screening provided a comprehensive overview of the epidemiological situation of 45 bacteria, 17 parasites and 31 viruses potentially transmitted by ticks in the French West Indies. The high-throughput detection tool developed during my thesis represents a major improvement in epidemiological surveillance technology, enabling the rapid and concomitant monitoring of a wide range of pathogens. It will soon be applied to high-throughput screening of infectious agents found in ticks collected throughout the Caribbean, including Trinidad and Tobago, St. Kitts, Barbados, and St. Lucia, thanks to the collaboration with the CaribVet network, and local veterinarians
Styles APA, Harvard, Vancouver, ISO, etc.
49

Gagné, Patrick. « Élaboration d’une méthodologie d’analyses bio-informatiques pour des données de séquençage Illumina dans un contexte de metabarcoding ». Master's thesis, Université Laval, 2020. http://hdl.handle.net/20.500.11794/66444.

Texte intégral
Résumé :
Le metabarcoding, un domaine alliant les technologies de séquençage à haut débit et l’identification d’organismes biologiques via l’ADN, a permis d’ouvrir les portes à un grand nombre de nouveaux projets scientifiques. Il existe une multitude de programmes capables d’effectuer les analyses, mais ces programmes ne sont souvent pas adaptés pour des projets particuliers comme la détection de pathogènes. ADAPTI a été développé afin de répondre à ce manque. ADAPTI est une méthodologie complète d’analyse adaptée pour la détection de pathogènes, mais capable de s’adapter à différents contextes de recherche grâce à son développement flexible et extensible. Toute la méthodologie a été mise à l’épreuve afin d’évaluer sa capacité, tant au niveau de l’efficacité en temps, mémoire vive et en espace disque, qu’au niveau de la validité et l’exactitude des résultats. Il a été démontré qu’ADAPTI est non seulement capable de fournir des résultats sur des jeux de données de grande taille, mais il le fait avec une grande sensibilité tout en conservant une efficacité multifilaire acceptable. ADAPTI a ensuite été comparé à des programmes open source en utilisant un jeu de données standardisé et il a été déterminé qu’il permet d’effectuer de meilleures analyses que les autres programmes testés. Il a été déterminé que la haute sensibilité fait la force d’ADAPTI, mais aussi l’une de ses faiblesses en permettant une plus grande quantité de séquences « bruits », lesquelles nécessitent des traitements supplémentaires. Certains programmes composant la suite d’ADAPTI nécessitent de l’optimisation au niveau de l’utilisation de la mémoire vive, ce qui est souvent un enjeu en bio-informatique. Il sera aussi nécessaire d’implémenter des capacités de calcul parallèle massif, car l’évolution rapide des technologies de séquençage rendra ADAPTI inefficace dans sa forme actuelle d’ici quelques années. Somme toute, ADAPTI est une méthodologie fonctionnelle capable de répondre à la demande en pathologie.
Styles APA, Harvard, Vancouver, ISO, etc.
50

Karkar, Adnane. « Leucodystrophies : aspects génétiques et moléculaires au Maroc ». Thesis, Sorbonne Paris Cité, 2018. http://www.theses.fr/2018USPCC258.

Texte intégral
Résumé :
Les leucodystrophies (LD) sont des troubles héréditaires affectant la substance blanche (SB) du système nerveux central (SNC) avec ou sans atteinte du système nerveux périphérique (SNP). Ces troubles ont en commun des anomalies de la cellule gliale ou de la gaine de la myéline. L’imagerie par résonance magnétique (IRM) représente l’outil majeur pour la détection des anomalies de la SB, ainsi l’IRM accompagnée d’un examen clinique permettent d’orienter le diagnostic étiologique. La confirmation de ce diagnostic est principalement basée sur la biologie moléculaire qui permet la détermination du gène muté. Sachant qu’au Maroc aucune étude sur les leucodystrophies n’avait été réalisée auparavant, nous avons mené une étude prospective afin de déterminer le profil des patients marocains atteints de ces troubles et de mettre en place un diagnostic moléculaire des formes les plus fréquentes. Pour cela nous avons rassemblé des échantillons de familles dont un ou plusieurs membres avaient une suspicion de leucodystrophie. Par la suite nous avons réalisé un séquençage des gènes connu pour leur implication dans les leucodystrophies. Le séquençage s’est déroulé en deux phases. La première, par séquençage Sanger, a concerné les patients présentant un marqueur biochimique positif. La deuxième phase, par séquençage nouvelle génération ou Next-Generation Sequencing (NGS) a concerné les patients sans marqueurs biochimiques apparent. Cette approche nous a permis d’identifier les types de leucodystrophies présentes au sein de la population marocaine, mais aussi de mettre en évidence de nouvelles mutations
Leukodystrophies are hereditary disorders affecting central nervous system white matter (WM) with or without damages in peripheral nervous system. These disorders have in common abnormalities of the glial cell and the sheath of the myelin. Magnetic resonance imaging (MRI) is the major tool to detect WM abnormalities, so MRI in association with a good clinical examination can help to provide an accurate medical diagnosis. Moreover, the confirmation of this or that leukodystrophy remains in the field of molecular biology by the detection of mutated gene translating the phenotype of the patient. Knowing that in Morocco no previous study on leukodystrophies had been carried out, we sought to know the characteristics of Moroccan patients carrying these disorders so as to be able to establish a molecular diagnosis of the most frequent forms. We collected samples from families with one or more members had a suspicion of leukodystrophy. Thus, we carried out a sequencing with an approach that consists in analyzing directly by Sanger method the leukodystrophies having a positive biochemical marker and by next generation sequencing or Next-Generation Sequencing (NGS) leukodystrophies without known biochemical markers. This approach allowed us, to identify leukodystrophies in a sample of the Moroccan population but also to identify new mutations
Styles APA, Harvard, Vancouver, ISO, etc.
Nous offrons des réductions sur tous les plans premium pour les auteurs dont les œuvres sont incluses dans des sélections littéraires thématiques. Contactez-nous pour obtenir un code promo unique!

Vers la bibliographie