To see the other types of publications on this topic, follow the link: Prédiction génomique.

Dissertations / Theses on the topic 'Prédiction génomique'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 25 dissertations / theses for your research on the topic 'Prédiction génomique.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Iragne, Florian. "Prédiction de réseaux d'interactions biomoléculaires à partir de données de la génomique comparée." Phd thesis, Université Sciences et Technologies - Bordeaux I, 2007. http://tel.archives-ouvertes.fr/tel-00409871.

Full text
Abstract:
Les systèmes biologiques présentent de nombreux phénomènes complexes, aux interactions encore plus complexes. La modélisation a pour but de faciliter l'étude et la compréhension des systèmes biologiques, par l'observation ou la simulation des modèles créés. Les réseaux d'interactions biomoléculaires sous-tendent ces modèles. Les travaux de thèse que nous présentons portent sur la prédiction systématique de réseaux d'interactions biomoléculaires, afin de fournir les éléments d'entrée nécessaires au processus de modélisation. Les deux thèmes centraux seront la prédiction de réseaux d'interactions protéine-protéine et l'extrapolation de voies métaboliques. Nous définissons tout d'abord un cadre formel d'extraction de graphes d'interactions dictée par des politiques, qui permet de créer des résumés intelligents à partir de jeux de données hétérogènes. Une séparation claire des tâches d'extraction et de visualisation de l'information nous permet d'exprimer différents algorithmes existants, estimant par exemple la qualité des réseaux d'interactions biomoléculaires prédits. Nous avons mis en oeuvre ce cadre formel dans le logiciel ProViz [Iragne et al., 2005]. Nous présentons par la suite, des méthodes informatiques d'extrapolation de voies métaboliques, inspirées du précédent formalisme et basées sur l'utilisation de voies de référence et sur une identification robuste d'équivalents fonctionnels. Ces méthodes nous permettent de prédire un ensemble de voies métaboliques centrales, formant la base de modèles pour des organismes dont seules les données génomiques sont disponibles. Les différents résultats, disponibles en ligne [Sherman et al., 2006] ou en cours de publication, nous permettent de valider notre approche.
APA, Harvard, Vancouver, ISO, and other styles
2

Hereil, Alexandre. "Génétique d'association et prédiction génomique de la tolérance au stress abiotique chez la tomate." Electronic Thesis or Diss., Avignon, 2024. http://www.theses.fr/2024AVIG0374.

Full text
Abstract:
Les stress abiotiques, tels que la salinité excessive ou la carence en nutriments, qui entraînent souvent une perte de rendement importante, constituent des défis majeurs pour l'agriculture mondiale. Ces stress sont particulièrement préjudiciables dans les régions confrontées à la pauvreté, à l'insécurité alimentaire et à la pénurie d'eau. L'amélioration de la résilience des cultures à haute valeur économique et nutritionnelle comme la tomate (Solanum lycopersicum L.) aux stress abiotiques pourrait offrir des avantages significatifs, à la fois sur le plan économique et en termes de santé publique. L'objectif de cette thèse est d'identifier les composantes génétiques de la tolérance aux stress abiotiques chez la tomate et d'explorer le potentiel de la prédiction génomique pour améliorer cette tolérance. Dans le premier chapitre, nous avons examiné l'architecture génétique de la tolérance à la carence en azote. Nous avons utilisé une méthodologie complète qui intègre la cartographie des QTL en utilisant une population multiparentale, une étude d'association à l'échelle du génome (GWAS) en utilisant un panel de diversité, et une analyse RNA-seq pour identifier les gènes candidats liés à la réponse à la carence en azote. Les deux chapitres suivants sont consacrés à l'étude de la tolérance au stress salin. Nous avons tout d'abord étudié plusieurs traits associés à l'accumulation de sodium dans différents organes et stades de développement de la plante dans le panel de GWAS, ce qui nous a permis d'identifier des QTLs et un gène candidat clé impliqué dans le transport du sodium au sein de la plante. En outre, nous avons également étudié l'impact du stress salin sur le métabolome des racines, en caractérisant les métabolites régulés de manière différentielle par le stress salin et en identifiant des biomarqueurs de la tolérance à la salinité. Des QTL et des gènes candidats liés à ces métabolites cibles ont été identifiés. Dans les derniers chapitres, nous avons utilisé la GWAS et la prédiction génomique dans des analyses multi-environnementales à l'aide d'un panel de diversité cultivé dans plusieurs conditions environnementales. Nous avons identifié des QTL d'interaction - dont les effets alléliques varient en fonction des conditions environnementales - et comparé différentes méthodologies GWAS. Nous avons également évalué l'efficacité de différents modèles de prédiction génomique pour améliorer la tolérance aux stress abiotiques. Cette étude a permis d'identifier plusieurs gènes candidats qui nécessitent une validation expérimentale plus poussée afin d'élucider leurs rôles fonctionnels et leurs applications potentielles dans les programmes de sélection. Les résultats préliminaires des modèles de prédiction génomique soulignent l'utilité de l'utilisation de ces approches pour prédire la tolérance aux stress abiotiques
Abiotic stresses, such as excessive salinity or nutrient deficiency, which often result in substantial yield losses, constitute significant challenges to global agriculture. These stresses are particularly detrimental in regions facing poverty, food insecurity and water scarcity. Improving the resilience of crops of high economic and nutritional value such as tomato (Solanum lycopersicum L.) to abiotic stresses could offer significant benefits, both economically and in terms of public health. The aim of this thesis is to identify the genetic components of abiotic stress tolerance in tomato and to explore the potential of genomic prediction to improve these traits. In the first chapter, we looked at the genetic architecture of nitrogen deficiency tolerance. We used a comprehensive methodology that integrates QTL mapping with multiparental population, genome-wide association study (GWAS) using a diversity panel, and RNA-seq to identify candidate genes related to nitrogen metabolism. The next two chapters are devoted to the study of salt stress tolerance. We first studied several traits associated with sodium accumulation in various plant organs and developmental stages in a GWAS panel, which enabled us to identify QTLs and a key candidate gene involved in sodium transport within the plant. In addition, we have also studied the impact of salt stress on the root metabolome, characterising metabolites differentially regulated by salt stress and identifying biomarkers of salinity tolerance. QTLs and candidate genes linked to these target metabolites have been identified. In the following two chapters, we engaged GWAS and genomic prediction in multi-environmental analyses using a diversity panel grown under a range of environmental conditions. We have identified interaction QTLs - whose allelic effects vary according to environmental conditions - and compared different GWAS methodologies. Then we have evaluated the effectiveness of various genomic prediction models for improving tolerance to abiotic stress. Our results revealed several candidate genes that require further experimental validation to elucidate their functional roles and potential applicability in breeding programmes. Preliminary results from genomic prediction models highlight the interest of using these approaches to predict tolerance to abiotic stresses, although further validation in breeding populations is required
APA, Harvard, Vancouver, ISO, and other styles
3

Colombani, Carine. "Modèles de prédiction pour l'évaluation génomique des bovins laitiers français : application aux races Holstein et Montbéliarde." Thesis, Toulouse, INPT, 2012. http://www.theses.fr/2012INPT0078/document.

Full text
Abstract:
L'évolution rapide des techniques de séquençage et de génotypage soulèvent de nouveaux défis dans le développement des méthodes de sélection pour les animaux d’élevage. Par comparaison de séquences, il est à présent possible d'identifier des sites polymorphes dans chaque espèce afin de baliser le génome par des marqueurs moléculaires appelés SNP (Single Nucleotide Polymorphism). Les méthodes de sélection des animaux à partir de cette information moléculaire nécessitent une représentation complète des effets génétiques. Meuwissen et al. (2001) ont introduit le concept de sélection génomique en proposant de prédire simultanément tous les effets des régions marquées puis de construire un index "génomique" en sommant les effets de chaque région. Le challenge dans l’évaluation génomique est de disposer de la meilleure méthode de prédiction afin d’obtenir des valeurs génétiques précises pour une sélection efficace des animaux candidats. L’objectif général de cette thèse est d'explorer et d’évaluer de nouvelles approches génomiques capables de prédire des dizaines de milliers d'effets génétiques, sur la base des phénotypes de centaines d'individus. Elle s’inscrit dans le cadre du projet ANR AMASGEN dont le but est d’étendre la sélection assistée par marqueurs, utilisée jusqu’à lors chez les bovins laitiers français, et de développer une méthode de prédiction performante. Pour cela, un panel varié de méthodes est exploré en estimant leurs capacités prédictives. Les méthodes de régression PLS (Partial Least Squares) et sparse PLS, ainsi que des approches bayésiennes (LASSO bayésien et BayesCπ) sont comparées à deux méthodes usuelles en amélioration génétique : le BLUP basé sur l’information pedigree et le BLUP génomique basé sur l’information des SNP. Ces méthodologies fournissent des modèles de prédiction efficaces même lorsque le nombre d’observations est très inférieur au nombre de variables. Elles reposent sur la théorie des modèles linéaires mixtes gaussiens ou les méthodes de sélection de variables, en résumant l’information massive des SNP par la construction de nouvelles variables. Les données étudiées dans le cadre de ce travail proviennent de deux races de bovins laitiers français (1 172 taureaux de race Montbéliarde et 3 940 taureaux de race Holstein) génotypés sur environ 40 000 marqueurs SNP polymorphes. Toutes les méthodes génomiques testées ici produisent des évaluations plus précises que la méthode basée sur la seule information pedigree. On observe un léger avantage prédictif des méthodes bayésiennes sur certains caractères mais elles sont cependant trop exigeantes en temps de calcul pour être appliquées en routine dans un schéma de sélection génomique. L’avantage des méthodes de sélection de variables est de pouvoir faire face au nombre toujours plus important de données SNP. De plus, elles sont capables de mettre en évidence des ensembles réduits de marqueurs, identifiés sur la base de leurs effets estimés, c’est-à-dire ayant un impact important sur les caractères étudiés. Il serait donc possible de développer une méthode de prédiction des valeurs génomiques sur la base de QTL détectés par ces approches
The rapid evolution in sequencing and genotyping raises new challenges in the development of methods of selection for livestock. By sequence comparison, it is now possible to identify polymorphic regions in each species to mark the genome with molecular markers called SNPs (Single Nucleotide Polymorphism). Methods of selection of animals from genomic information require the representation of the molecular genetic effects. Meuwissen et al. (2001) introduced the concept of genomic selection by predicting simultaneously all the effects of the markers. Then a genomic index is built summing the effects of each region. The challenge in genomic evaluation is to find the best prediction method to obtain accurate genetic values of candidates. The overall objective of this thesis is to explore and evaluate new genomic approaches to predict tens of thousands of genetic effects, based on the phenotypes of hundreds of individuals. It is part of the ANR project AMASGEN whose aim is to extend the marker-assisted selection, used in French dairy cattle, and to develop an accurate method of prediction. A panel of methods is explored by estimating their predictive abilities. The PLS (Partial Least Squares) and sparse PLS regressions and Bayesian approaches (Bayesian LASSO and BayesCπ) are compared with two current methods in genetic improvement: the BLUP based on pedigree information and the genomic BLUP based on SNP markers. These methodologies are effective even when the number of observations is smaller than the number of variables. They are based on the theory of Gaussian linear mixed models or methods of variable selection, summarizing the massive information of SNP by new variables. The datasets come from two French dairy cattle breeds (1172 Montbéliarde bulls and 3940 Holstein bulls) genotyped with 40 000 polymorphic SNPs. All genomic methods give more accurate estimates than the method based on pedigree information only. There is a slight predictive advantage of Bayesian methods on some traits but they are still too demanding in computation time to be applied routinely in a genomic selection scheme. The advantage of variable selection methods is to cope with the increasing number of SNP data. In addition, they are able to extract reduced sets of markers based of their estimated effects, that is to say, with a significant impact on the trait studied. It would be possible to develop a method to predict genomic values on the basis of QTL detected by these approaches
APA, Harvard, Vancouver, ISO, and other styles
4

Carillier-Jacquin, Céline. "Etude de la prédiction génomique chez les caprins : faisabilité et limites de la sélection génomique dans le cadre d'une population multiraciale et à faible effectif." Thesis, Toulouse, INPT, 2015. http://www.theses.fr/2015INPT0086/document.

Full text
Abstract:
La sélection génomique, qui a révolutionné la sélection génétique des bovins laitiers notamment, est désormais envisagée dans d’autres espèces comme l’espèce caprine. La clé du succès de la sélection génomique réside dans la précision des évaluations génomiques. Chez les caprins laitiers français, le gain de précision attendu avec la sélection génomique était un des questionnements de la filière en raison de la petite taille de la population de référence disponible (825 mâles et 1945 femelles génotypés sur une puce SNP 50K). Le but de cette étude est d’évaluer comment augmenter la précision des évaluations génomiques dans l’espèce caprine. Une étude de la structure génétique de la population de référence caprine constituée d’animaux de races Saanen et Alpine, a permis de montrer que la population de référence choisie est représentative de la population élevée sur le territoire français. En revanche, les faibles niveaux de déséquilibre de liaison (0,17 entre deux SNP consécutifs) de consanguinité et de parenté au sein de la population, similaires à ceux trouvés en ovins Lacaune, ne sont pas idéaux pour obtenir une bonne précision des évaluations génomiques. De plus, malgré l’origine commune des races Alpine et Saanen, leurs structures génétiques suggèrent qu’elles se distinguent clairement d’un point de vue génétique. Les méthodes génomiques (GBLUP ou Bayésiennes) « two-step », basées sur des performances pré-corrigées (DYD, EBV dérégressées) n’ont pas permis une amélioration significative des précisions des évaluations génomiques pour les caractères évalués en routine (caractères de production, de morphologie et de comptages de cellules somatiques) chez les caprins laitiers. La prise en compte des phénotypes des mâles non génotypés permet d’augmenter les précisions des évaluations de 3 à 47% selon le caractère. L’ajout des génotypes de femelles issues d’un dispositif de détection de QTL améliore également les précisions (de 2 à 14%) que ce soit pour les évaluations two steps ou les évaluations basées sur les performances propres des femelles (single step). Les précisions sont augmentées de 10 à 74% avec les évaluations single step comparées aux évaluations two steps, ce qui permet d’atteindre des précisions supérieures à celles obtenues sur ascendance. Les précisions obtenues avec les évaluations génomiques multiraciales, bicaractères et uniraciales sont similaires même si la précision des valeurs génomiques estimées des candidats à la sélection est plus élevée avec les évaluations multiraciales. La sélection génomique est donc envisageable chez les caprins laitiers français à l’aide d’un modèle génomique multiracial single step. Les précisions peuvent être légèrement augmentées par l’inclusion de gènes majeurs tels que celui de la caséine αs1 notamment à l’aide d’un modèle « gene content » pour prédire le génotype des animaux non génotypés
Genomic selection which is revolutionizing genetic selection in dairy cattle has been tested in several species like dairy goat. Key point in genomic selection is accuracy of genomic evaluation. In French dairy goats, gain in accuracy using genomic selection was questioning due to the small size of the reference population (825 males and 1 945 females genotyped). The aim of this study was to investigate how to reach adequate genomic evaluation accuracy in French dairy goat population. The study of reference population structure (Alpine and Saanen breeds) showed that reference population is similar to the whole population of French dairy goats. But the weak level of linkage disequilibrium (0.17 between two consecutive SNP), inbreeding and relationship between reference and candidate population were not ideal to maximize genomic evaluation accuracy. Despite their common origin, genetic structure of Alpine and Saanen breeds suggested that they were genetically distant. Two steps genomic evaluation (GBLUP, Bayesian) based on performances corrected for fixed effect (DYD, deregressed EBV) did not improve genetic evaluation accuracy compared to classical evaluations for milk production traits, udder type traits and somatic cells score classically selected in French dairy goat. Taking into account phenotypes of ungenotyped sires increased genomic evaluation from 3 to 47% depending on the trait considered. Adding female genotypes also improved genomic evaluation accuracies from 2 to 4% depending on the method (two steps or single step) and on the trait. When using gemomic evaluation directly based on female performances (single step), accuracy of genomic evaluation reach the level obtained from ascendance in classic evaluation which was not the case using two steps evaluations. Genomic evaluation accuracies were similar when using multiple-trait model, multi-breed or single breed evaluation. But accuracies derived from prediction error variances were better when using multi-breed genomic evaluations. Genomic selection is feasible in French dairy goats using single step multi-breed genomic evaluations. Accuracies could be slightly improved integrating major gene as αs1 casein especially when using « gene content » approach to predict genotypes of ungenotyped animals
APA, Harvard, Vancouver, ISO, and other styles
5

Fu, Yu. "Analyse intégrative de données génomiques et pharmacologiques pour une meilleure prédiction de la réponse aux médicaments anti-cancer." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS560.

Full text
Abstract:
Analyse intégrative de données génomiques et pharmacologiques pour améliorer la prédiction de la réponse aux thérapies cibléesL'utilisation de thérapies ciblées dans le contexte de la médecine personnalisée du cancer a permis d’améliorer le traitement des patients dans différents types de cancer. Cependant, alors que la décision thérapeutique est basée sur une unique altération moléculaire (par exemple une mutation ou un changement du nombre de copies d’un gène), les tumeurs montrent différents degrés de réponse. Dans cette thèse, nous démontrons que la décision thérapeutique basée sur une unique altération n’est pas optimale et nous proposons un modèle mathématique intégrant des données génomiques et pharmacologiques pour identifier de nouveaux biomarqueurs prédictifs de la réponse thérapeutique. Le modèle a été construit à partir de deux bases de données de lignées cellulaires (the Genomics of Drug Sensitivity in Cancer, GDSC and the Cancer Cell Line Encyclopedia, CCLE) et validé avec des données de lignées et des données cliniques. De plus, nous avons également développé une nouvelle méthode pour améliorer la détection des mutations somatiques à partir de données de séquençage d'exomes complets et proposons un nouvel outil, cmDetect, disponible gratuitement pour la communauté scientifique
Integrated analysis of genomic and pharmacological data to better predict the response to targeted therapiesThe use of targeted therapies in the context of cancer personalized medicine has shown great improvement of patients’ treatment in different cancer types. However, while the therapeutic decision is based on a single molecular alteration (for example a mutation or a gene copy number change), tumors will show different degrees of response. In this thesis, we demonstrate that a therapeutic decision based on a unique alteration is not optimal and we propose a mathematical model integrating genomic and pharmacological data to identify new single predictive biomarkers as well as combinations of biomarkers of therapy response. The model was trained using two public large-scale cell line data sets (the Genomics of Drug Sensitivity in Cancer, GDSC and the Cancer Cell Line Encyclopedia, CCLE) and validated with cell line and clinical data. Additionally, we also developed a new method for improving the detection of somatic mutations using whole exome sequencing data and propose a new tool, cmDetect, freely available to the scientific community
APA, Harvard, Vancouver, ISO, and other styles
6

Enault, François. "Contribution à la prédiction de la fonction des gènes par l'analyse de leur contexte génomique et de leur co-évolution." Aix-Marseille 2, 2005. http://www.theses.fr/2005AIX22035.

Full text
APA, Harvard, Vancouver, ISO, and other styles
7

Valéry, Christine. "Recherche de nouvelles protéines potentiellement marqueurs du mélanome et importance d'une approche de génomique fonctionnelle pour une stratégie de prédiction du risque." Aix-Marseille 2, 2002. http://theses.univ-amu.fr.lama.univ-amu.fr/2002AIX20665.pdf.

Full text
Abstract:
Le mélanome est un cancer de la peau dont l'incidence double tous les dix ans depuis quarante ans. C'est une pathologie multigénique et multifactorielle. Des études épidémiologiques ont permis d'établir le rôle causal des radiations UV aiguës dans l'induction du mélanome. Cet effet cancérogène des UV a été attribué principalement aux UVB, l'action complémentaire des UVA n'étant pas totalement confirmée. En dépit de ces données, le rôle des UVB dans la genèse du mélanome photo-induit reste mal cerné au niveau biologique. De plus, l'identification des sujets à risque pour le mélanome à partir des gènes de susceptibilité actuellement identifiés, est très difficile, imparfaite. Notre laboratoire s'intéresse à la recherche de nouveaux marqueurs biologiques de susceptibilité au mélanome, et à une meilleure compréhension de la mélanocarcinogenèse, afin d'étayer les études épidémiologiques sur le mélanome et de proposer de nouvelles stratégies de prédiction du risque. Dans un premier temps, nous nous sommes intéressés à une protéine de stress impliquée dans certains cancers : la "Pancreatitis Associated Protein-I" (PAP-I). Nous avons montré que celle-ci avait une interaction avec l'invasivité rencontrée dans le mélanome. La structuration du laboratoire a ensuite permis de mettre en place une stratégie plus globale de recherche et de caractérisation des gènes cibles de la mélanocarcinogenèse photo-induite, par une approche de génomique fonctionnelle. Des gènes fonctionnellement liés dans la réponse des mélanocytes au stress UVB ont été déterminés grâce à la technologie des micromatrices à ADN, appliquée à 9000 gènes humains. Parmi les 198 gènes modulés, 159 sont des gènes connus et 39 correspondent à des « Expressed Sequence Tag » (EST). Plusieurs arguments suggèrent que les gènes modulés ont une interaction forte avec la mélanocarcinogenèse. Certains d'entre eux pourraient représenter des gènes candidats pour les stratégies de prédiction moléculaire du risque chez les patients. Deux ESTs, l'EST46 et l'EST111, exprimées de manière différentielle dans les tumeurs et les cellules de mélanome, ont été choisies dans le but de caractériser leur séquence codante entière. Le transcrit entier de l'EST46, qui correspond à un nouveau gène UVB-sensible, a été déterminé. Il possède deux cadres de lecture ouverts potentiels, codant pour les protéines hypothétiques Mel46. 2 et Myo38. Nous avons pu voir, par surexpression instrumentale, que l'expression de ces deux protéines entraînait une diminution de la résistance des cellules de mélanome SK-MEL-2 au stress UVB. La détermination de la séquence du transcrit EST111 a posé plus de problèmes en raison de la présence de séquences répétées de type Alu et de son appartenance probable à une famille de protéines. Dans un programme parallèle du laboratoire, l'expression de ces deux ESTs, dans des mélanocytes naeviques, ainsi que celle d'autres gènes UVB-sensibles est déjà utilisée dans l'élaboration de cartographies d'expression génique en fonction du tableau clinico­épidémiologique. Le but de cette étude est de proposer une stratégie de prédiction du risque objective fondée sur la génomique fonctionnelle.
APA, Harvard, Vancouver, ISO, and other styles
8

Coutant, Charles. "Optimisation de la prise en charge des cancers du sein : développement de prédicteurs clinicopathologiques et génomiques." Paris 6, 2009. http://www.theses.fr/2009PA066582.

Full text
Abstract:
L’utilisation de prédicteurs - clinicopathologiques ou génomiques – améliore notre connaissance des cancers du sein et nous offre la possibilité de proposer aux patientes une information pertinente et objective mais surtout personnalisée. Dans ce travail, nous avons i) créé et validé un prédicteur clinicopathologique de non envahissement des ganglions non sentinelles en cas de métastase du ganglion sentinelle, ii) mis au point et proposé une méthodologie robuste de validation des modèles prédictifs, iii) comparé différentes méthodes permettant de développer des prédicteurs clinicopathologiques, iv) développé et comparé des prédicteurs clinicopathologiques et génomiques de la réponse à la chimiothérapie néoadjuvante, v) créé de deux signatures génomiques de la mutation de p53 sécifiques des tumeurs ER-positives et -négatives ; et un prédicteur spécifique du risque de métastases cérébrales. Ces prédicteurs permettent d’optimiser la prise en charge des malades en identifiant des sous groupes spécifiques de patientes. Dans l’idéal, ces prédicteurs permettraient de proposer des traitements « à la carte ».
APA, Harvard, Vancouver, ISO, and other styles
9

Seye, Adama Innocent. "Prédiction assistée par marqueurs de la performance hybride dans un schéma de sélection réciproque : simulations et évaluation expérimentale pour le maïs ensilage." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLS078.

Full text
Abstract:
Le maïs (Zea mays L.) est la plante la plus cultivée au monde. Pour valoriser le fort effet d’hétérosis pour les caractères liés à la biomasse, la diversité génétique du maïs est structurée en groupes hétérotiques et les variétés cultivées sont majoritairement des hybrides F1 entre lignées de groupes complémentaires. La valeur hybride se décompose comme la somme de l’Aptitude Générale à la Combinaison (AGC) de chacune des lignées parentales et de l’Aptitude Spécifique à la Combinaison (ASC) du couple. En Europe du Nord, le maïs est souvent utilisé en ensilage destiné à l'alimentation animale. L’objectif de sélection est d’améliorer la productivité et d'assurer une bonne digestibilité du maïs ensilage. Les objectifs de cette thèse étaient : (i) d’estimer l’importance de l’AGC et de l’ASC dans la variance génétique hybride pour les caractères de qualité de l’ensilage, (ii) d’identifier les locus (QTL) impliqués dans ces caractères et d’étudier leur colocalisation avec des QTL de productivité, (iii) d’évaluer l’intérêt de la sélection génomique pour la prédiction des performances hybrides et (iv) de comparer l’efficacité de deux dispositifs de calibration des prédictions basés sur un factoriel ou l’utilisation classique de testeurs du groupe complémentaire. Dans le cadre du projet SAM-MCR, 6 familles biparentales connectées ont été créés dans les groupes « corné » et « denté » à partir de 4 lignées fondatrices. Dans une première phase, 822 lignées cornées et 802 dentées ont été génotypées pour 20k SNP et croisées selon un factoriel incomplet pour produire 951 hybrides, phénotypés pour des caractères de qualité et de productivité (étudiés par H. Giraud pendant sa thèse). L’analyse des caractères de qualité a montré une prédominance de l’AGC par rapport à l’ASC ainsi qu’une corrélation négative entre les caractères de qualité et le rendement. De nombreux QTLs multi-alléliques ont été détectés, la plupart spécifiques d’un groupe et dont certains colocalisent avec des QTL de rendement. Par validation croisée, la qualité de prédictions basées sur les QTL détectés s’est avérée plus faible que celle obtenue par prédiction génomique. La prise en compte de l’ASC n‘a pas permis d’améliorer sensiblement la qualité de prédictions des modèles. Dans une seconde phase, 90 lignées ont été choisies par groupe : 30 sélectionnées sur la base de leurs prédictions génomiques pour la productivité et la valeur énergétique et 60 choisies aléatoirement parmi les 6 familles. Ces lignées ont été croisées selon un factoriel incomplet pour produire 360 nouveaux hybrides : 120 issus des lignées sélectionnées et 240 issus des lignées choisies au hasard. Les 90 lignées de chaque groupe ont aussi été croisées à deux lignées fondatrices du groupe complémentaire (testeurs). Les hybrides issus des lignées sélectionnées se sont avérés plus productifs mais de moins bonne qualité. Nous avons confirmé la bonne qualité des prédictions génomiques obtenus dans le factoriel initial sur les nouveaux hybrides évalués dans d’autres environnements et après sélection et observé une bonne corrélation entre les AGC estimées dans le factoriel et dans le dispositif testeurs. Des dispositifs factoriels et testeurs ont été simulés en faisant varier la part d’ASC, le nombre d’hybrides et la contribution de chaque lignée dans le jeu de calibration. A moyens expérimentaux égaux, le dispositif factoriel s’est avéré plus efficace en termes de capacité prédictive et de gain génétique cumulé que le dispositif testeur (jusqu’à +50%) pour un caractère présentant de l’ASC et équivalent pour un caractère purement additif. Les résultats de cette thèse ouvrent de nouvelles perspectives pour revisiter les schémas de sélection hybrides en remplaçant l’évaluation des lignées candidates, classiquement faite sur testeur, par l’évaluation directe d’hybrides issus d’un factoriel incomplet. La mise en œuvre de tels dispositifs nécessitera de réorganiser la logistique des programmes de sélection
Maize (Zea mays L.) is the most cultivated crop in the world. To exploit the strong heterosis for traits related to biomass, the genetic diversity of maize is structured into heterotic groups and cultivated varieties are mainly F1 hybrids obtained by crossing lines from complementary groups. The hybrid value can be decomposed as the sum of the General Combining Ability (GCA) of each parental line and the Specific Combining Ability (ASC) of the cross. In northern Europe, maize is often used as silage for animal feed and the breeding objective is to improve productivity while ensuring a good energetic value and digestibility of the silage. The objectives of this thesis were: (i) to estimate the importance of GCA and SCA in hybrid genetic variance for silage quality traits, (ii) to identify loci (QTL) involved in these traits and to study their colocalization with QTL for productivity traits, (iii) to evaluate the interest of genomic selection for the prediction of hybrid performances and (iv) to compare the prediction accuracies of two calibration designs either based on a factorial or on the conventional use of testers from the complementary group. As part of the SAM-MCR project, 6 biparental connected families were created in the "flint" and "dent" groups from 4 founder lines. In a first phase, 822 flint and 802 dent lines were genotyped for 20k SNPs and crossed according to an incomplete factorial to produce 951 hybrids which were phenotyped for quality traits and for productivity traits (studied by H. Giraud during her phD). Quality trait analysis showed a predominance of GCA over SCA and a negative correlation between digestibility traits and silage yield. Several multi-allelic QTLs were detected, most of them being specific to one group. Several colocalizations were found with yield QTL. Using cross-validation, we observed that the predictive ability of models based on detected QTLs was lower than that obtained by genomic predictions. Considering the SCA did not improve model predictive abilities for most of the traits. In a second phase, 90 lines were chosen per group: 30 were selected based on their genomic predictions for productivity and the energetic value and 60 were randomly sampled from the 6 families. These lines were crossed according to an incomplete factorial to produce 360 new hybrids: 120 from selected lines and 240 from randomly chosen lines. The 90 lines of each group were also crossed to two lines of the complementary group (testers). Hybrids from the selected lines were more productive but had a lower silage quality. We confirmed the good accuracy of the genomic predictions obtained in the initial factorial on the new hybrids evaluated in other environments and after selection. We also observed good correlations between GCA estimated in the factorial and in the testcross design. Different factorial and testcross designs were simulated by varying the proportion of dominance/SCA, the number of hybrids and the contribution of each line to the calibration set. Considering the same number of hybrids in the calibration set, the factorial was more efficient in terms of predictive ability and cumulative genetic gain (up to + 50%) than the testcross design for traits showing SCA and was similar for purely additive traits. The results of this thesis open new perspectives to revisit hybrid breeding schemes by replacing the evaluation of candidate lines, classically made on testcross, by the direct evaluation of hybrids resulting from an incomplete factorial. The implementation of such designs will require reorganizing the logistics of selection programs
APA, Harvard, Vancouver, ISO, and other styles
10

Tran, Van Hung. "New genetic longitudinal models for feed efficiency." Thesis, Toulouse, INPT, 2018. http://www.theses.fr/2018INPT0094.

Full text
Abstract:
Bien que des approches non génétiques et génétiques aient été mises en œuvre pour améliorer l’efficacité alimentaire des animaux au cours des dernières années, le coût des aliments constitue encore la plus grande partie des coûts de production de nombreux systèmes d’élevage. De plus,une efficacité alimentaire non optimale augmente l’impact environnemental de l’élevage par gaspillage d'aliments. Au cours des dernières décennies, les progrès dans les technologies à hautdébit pour la gestion des animaux, notamment le développement de distributeurs automatiques d’aliment, permettent d’obtenir de nombreuses mesures répétées au cours du temps (donnée longitudinales) de la consommation individuelle des animaux. L'objectif de cette thèse était de développer de nouveaux modèles génétiques pour mieux quantifier le potentiel génétique des animaux pour l'efficacité alimentaire en utilisant ce type de données. Les données de 2435 porcs Large White en croissance provenant d'une expérience de sélection divergente pour la consommation résiduelle ont été utilisées au cours de cette thèse. Dans cette population, les mâles étaient pesés chaque semaine alors que les femelles et les mâles castrés étaient pesés tous les mois entre 10 et 23 semaines d’âge. Dans une première étape, nous avons comparé différentes approches pour prédire les poids corporels hebdomadaires manquants de ces animaux afin d’améliorer l’évaluation de leur efficacité alimentaire. Pour la période testée, une interpolation quasi linéaire basée sur les semaines adjacentes est la meilleure approche pour traiter les poids corporels manquants dans notre ensemble de données. Dans un second temps, différents modèles longitudinaux tels que les modèles de régression aléatoire (RR), les modèles antédependants structuraux (SAD) et les modèles de type « character process » ont été comparés pour l’analyse de l’efficacité alimentaire. La comparaison a été réalisée en se basant sur des critères d’ajustement aux données (Log vraisemblance, Critère d'Information Bayésien), sur les estimations des composantes de variances (estimations de l'héritabilité, des variances génétiques et des corrélations génétiques entre semaines) et sur la capacité prédictive (coefficients de concordance de Vonesh) de chaque modèle. Les résultats ont montré que le modèle SAD est le plus parcimonieux pour l’indice de consommation (IC) et la consommation résiduelle, deux mesures d’efficacité alimentaire. Ce modèle fournit également des capacités prédictives similaires à celles des autres modèles. Un critère de sélection combinant les prédictions des valeurs génétiques hebdomadaires de chaque animal a été proposé pour des applications pratiques dec es modèles dans un objectif de sélection. En outre, nous avons évalué comment l'information génomique pouvait améliorer la précision des prédictions des valeurs génétiques des animaux pour le gain moyen quotidien et la consommation résiduelle, en appliquant des approches génomiques « single-step » aux modèles RR et SAD. Les résultats obtenus ont montré que les précisions étaient faibles et les biais de prédiction importants pour les deux caractères, et qu’ils n'étaient pas améliorés par l’apport de l’information génomique. Enfin, nous avons montré que la sélection divergente pour la consommation résiduelle avait un impact majeur sur les trajectoires de l’indice de consommation et de la consommation résiduelle pendant la croissance dans chaque lignée. En conclusion, cette thèse a montré que la sélection pour des trajectoires d'efficacité alimentaire est faisable avec les informations disponibles actuellement. Des études supplémentaires sont nécessaires pour mieux évaluer le potentiel de l'information génomique avec ces derniers modèles et pour valider les stratégies de sélection sur ces trajectoires d’efficacité alimentaire au cours du temps dans la pratique
Although non-genetic and genetic approaches heavily improved feed efficiency in the last decades, feed cost still contributes to a large proportion of pork production costs. In addition, thelimited effi-ciency of feed use not only increases the environmental impact due to the waste of feed. Over the last decades, advances in high-throughput technologies for animal management,including automat-ic self-feeders, created a proliferation of repeated data or longitudinal data. The objective of this thesis was to develop new genetic models to better quantify the genetic potentialof animals for feed efficiency using longitudinal data on body weight (BW), feed intake and body composition of the animals. Data from 2435 growing Large White pigs from a divergent selectionexperiment for resid-ual feed intake (RFI) were used. In this population, males were weighted every week whereas fe-males and castrated males were weighted every month at the beginning of the test (10 weeks of age) and more often towards the end of the test (23 weeks of age). In a first step, different approaches investigated how to predict missing weekly BW for intermediate stages. For the tested period, a quasi linear interpolation based on the adjacent weeks is the best approach to deal with missing BW in our dataset. In a second step, different longitudinal models, such as random regression (RR) mod-els, structured antedependence models (SAD) and character process models, in which the covari-ances between weeks are accounted for, were compared. The comparison focused on best-fit to the data criteria (Loglikelihood, Bayesian Information Criterion), on variance components estimations (heritability estimates, genetic variances and genetic correlations between weeks) and on predictive ability (Vonesh concordance coefficients). The results showed that SAD is the most parsimonious model for feed conversion ratio (FCR) and for RFI, two measures of feed efficiency. The SAD model also provided similarpredictive abilities as the other models. A selection criterion combining the weekly breeding values was proposed for practical applications to selection. In addition, we evaluated the potential of genomic information to improve the accuracy of breeding value predictions for aver-age daily gain and residual feed intake, applying single step genomic approaches to the RR and SAD models. In our dataset, prediction accuracies was low for both traits, and was not much improved by genomic information. Finally, we showed that divergent selection for RFI had a major impact on the FCR and RFI profile trajectories in each line. In conclusion, this thesis showed that selection for trajectories of feed efficiency is feasible with the current available information. Further work is needed to better evaluate the potential of genomic information with these models, and to validate strategies to select for these trajectories in practice
APA, Harvard, Vancouver, ISO, and other styles
11

Derrien, Thomas. "L'analyse comparée des génomes : applications à l'identification de nouveaux gènes canins." Phd thesis, Université Rennes 1, 2007. http://tel.archives-ouvertes.fr/tel-00656330.

Full text
Abstract:
Au cours de ces trois dernières années, le génome du chien a bénéficié d'avancées majeures à sa connaissance. Les projets de cartographie et de séquençage de son génome, motivés par le formidable potentiel qu'offre le chien en tant que modèle génétique, ont généré de grandes quantités de données à analyser. Dans ce contexte, mes travaux de thèse se sont d'abord focalisés sur la conception d'outils bioinformatiques d'intégration de plusieurs ressources afin d'évaluer et de comparer les informations issues des projets de cartographie et de séquence du génome du chien. Avec la disponibilité d'un nombre croissant de génomes séquencés, nous avons développé le programme AutoGRAPH pour formaliser la conservation de l'ordre des gènes orthologues entre les génomes mammifères, automatiser la construction de cartes de synténie entre ces génomes et, enfin, faciliter l'annotation du génome du chien. Un première application de notre méthode a permis de redéfinir la localisation d'une centaine de gènes préalablement assignés au chromosome canin non-assemblé ou "chromosome Unknown". Dans un second projet, nous avons combiné notre approche de conservation de l'ordre des gènes entre deux génomes avec des alignements de séquences ciblés afin d'identifier des nouvelles structures de gènes canins codant pour des protéines. À partir d'un ensemble de 412 gènes orthologues entre quatre génomes de référence (homme - chimpanzé - rat - souris) et présumés absents chez le chien, nous identifions 285 nouveaux gènes canins et/ou nouvelles relations d'orthologie avec les génomes de référence. Enfin, différents mécanismes évolutifs sont suggérés mettant en relation la nature des gènes, la présence de famille de gènes et la composition en séquences pour expliquer la perte de gènes chez le chien.
APA, Harvard, Vancouver, ISO, and other styles
12

Wicki, Marine. "Etude de plans de connexion entre populations génétiquement proches visant à accroître l'intérêt de la sélection génomique en petits ruminants." Electronic Thesis or Diss., Université de Toulouse (2023-....), 2024. https://theses.hal.science/tel-04866958.

Full text
Abstract:
De nombreuses études montrent que la précision des prédictions génomiques et ainsi l’efficacité des schémas de sélection, dépend de la taille et la composition de la population de référence considérée. Cette population de référence est l’ensemble des animaux pour lesquels on dispose d’information génomique et phénotypique. Plus la taille de cette population est importante, meilleure est la qualité des prédictions génomiques des candidats à la sélection. De même, plus la population de référence est apparentée aux candidats à la sélection, meilleures sont les prédictions génomiques de ces derniers. Dans le cas où la taille de la population de référence est limitante, comme on peut l’observer par exemple en ovins, il peut être intéressant de combiner les évaluations génomiques de plusieurs populations. Des études ont montré que cette combinaison est bénéfique lorsqu’elle implique des populations génétiquement proches. L’objectif de la thèse est de contribuer à la mise en place de programmes de sélection multi-raciales ou multi-population, dans le but d’accroître l’efficacité de la sélection génomique pour des races et populations génétiquement proches, particulièrement en petits ruminants. Pour ce faire, nous avons dans un premier temps, à partir de données réelles, étudié la structure (pedigree et génomique) de la race Lacaune. Cette étude a confirmé la subdivision de la race en deux sous-populations, de tailles équivalentes, et l’absence de connexions génétiques entre elles. Cette étude a cependant montré que les deux sous-populations sont toujours génétiquement proches l’une de l’autre. Sur ce même jeu de données, nous avons comparé les qualités de prédictions génomiques entre les évaluations individuelles de chaque sous-population et une évaluation combinée. Nous avons montré que l’évaluation combinée des deux sous-populations était toujours bénéfique mais les gains de précision sont faibles. Nous nous sommes également intéressés aux estimations des effets des SNPs en fonction des différentes populations de référence considérées. Les estimations des effets des SNPs se sont révélées très différentes entre les deux références individuelles. Les effets des SNPs sont plus proches entre les références individuelles et la référence combinée mais on observe tout de même une certaine différence que nous n’avons pas retrouvé dans les prédictions génomiques.La deuxième partie de cette thèse a consisté aux mêmes types de travaux mais réalisés sur des populations présentant un contexte opposé : les races Merino et Dohne Merino australiennes. Ces populations présentent des tailles très déséquilibrées, la race Merino étant la première race australienne tandis que la race Dohne Merino ne bénéficie pas encore d’une population de référence suffisante pour réaliser une évaluation génomique. L’analyse de la structure des populations a cependant montré un fort niveau de connexions génétiques entre les deux races qui sont beaucoup utilisées en croisement. Cette étude a finalement montré que l’évaluation génomique combinée était très avantageuse pour la race Dohne Merino et est ainsi prometteuse pour une possible transition vers la sélection génomique pour cette race. La dernière partie de cette thèse visait, à partir de simulations stochastiques, à étudier les conséquences de la divergence d’une population d’origine en deux sous-populations sur l’efficacité de la sélection génomique. Ces conséquences sont toujours comparées dans le cadre d’une évaluation individuelle vs combinée de ces deux sous-populations. Cette étude a montré que la subdivision de la population en deux sous-populations impactait négativement le gain génétique. Cette détérioration de gain génétique est d’autant plus importante que la séparation se fait de façon déséquilibrée (donc qu’une des deux sous-population est de faible taille) et que l’évaluation est séparée
Numerous studies have shown that the accuracy of genomic predictions, and thus the efficiency of breeding programs, depend on the size and design of the reference population considered. This reference population is the set of animals for which genomic and phenotypic information is available. The larger the reference population, the better the quality of genomic predictions for the candidates to selection. Similarly, the greater the relatedness between the reference population and the candidates, the better the genomic predictions of selection candidates. In cases where the size of the reference population is limiting, as can be observed in sheep for example, it can be interesting to combine genomic evaluations from several populations. Studies have shown that this combination is beneficial when it involves genetically close populations. The aim of this thesis is to contribute to the implementation of multi-racial or multi-population breeding programs, with the aim of increasing the efficiency of genomic selection for genetically close breeds and populations, particularly in small ruminants.To achieve this, we first used real data to study the pedigree and genomic structure of the Lacaune breed. This study confirmed the subdivision of the breed into two subpopulations of equivalent size, and the absence of genetic connections between them. The study did, however, show that the two sub-populations are still genetically close to each other. On the same dataset, we compared the quality of genomic predictions between the individual evaluations of each subpopulation and the combined evaluation of both populations. We showed that combining the evaluation was still beneficial, but the gains in accuracy were small. We also looked at SNP effect estimates according to the different reference populations considered. Estimates of the SNPs effects were very different between the two individual references. SNP effects were closer between the individual references and the combined reference, but there was still some difference, which we did not find in the genomic predictions.The second part of this thesis involved the same type of work, but carried out on populations presenting an opposite context: the Australian Merino and Dohne Merino breeds. The Merino breed is Australia's first breed, while the Dohne Merino breed does not yet have a sufficiently large reference population to perform genomic evaluation. However, the population structure analysis showed a high level of genetic connectedness between the two breeds, which are widely used in crossbreeding. In the end, this study showed that combined genomic evaluation was highly advantageous for the Dohne Merino breed, and is therefore promising for a possible transition to genomic selection for this breed.The final part of this thesis used stochastic simulations to study the consequences of the divergence of an original population into two sub-populations on the efficiency of genomic selection. These consequences are still compared within the framework of an individual vs. combined evaluation of these two sub-populations. We showed that the subdivision of the population into two subpopulations had a negative impact on genetic gain. This deterioration in genetic gain is all the greater when the separation is unbalanced (i.e. when one of the two sub-populations is small) and the evaluation is separate
APA, Harvard, Vancouver, ISO, and other styles
13

Ali, Baber. "Prédiction et compréhension des interactions génotypes x environnements par des approches d'intégration multi-omique chez le maïs." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASB060.

Full text
Abstract:
Les programmes de sélection du maïs s'appuient sur des réseaux d'essais pour évaluer la performance phénotypique (P) des hybrides dans diverses conditions de culture. Dans ces essais, les interactions entre le génotype et l'environnement (IGE) ont un effet substantiel sur la variabilité phénotypique qui peut parfois dépasser l'effet génétique principal (G). Il est donc important de mieux modéliser ces IGE pour garantir l'amélioration génétique du maïs.Les modèles classiques de prédiction génomique, même ceux modélisant les IGE, ne tiennent pas compte de la complexité du génome et de la manière dont les régions génomiques réagissent aux stimuli environnementaux. En supposant un modèle infinitésimal, ils agissent comme des boîtes noires s'appuyant sur des relations statistiques plutôt que biologiques. Les chercheurs ont suggéré que les annotations fonctionnelles des gènes et les données multi-omiques pourraient permettre de mieux expliquer la relation entre génotype et phénotype. Des études ont montré que la hiérarchisation des marqueurs génomiques sur la base d'information biologique ou fonctionnelle peut contribuer à améliorer les capacités prédictives des modèles. Des résultats similaires ont été rapportés dans des études reposant sur des données multi-omiques, telles que les transcrits et les protéines. Toutefois, la plupart de ces études portent sur un seul essai ou sur des expériences réalisées en un seul lieu. Leur capacité à modéliser les IGE pour des caractères quantitatifs dans un réseau d'essais étendu doit être davantage étudiée. Par conséquent, cette thèse vise à (i) évaluer le potentiel des annotations fonctionnelles pour améliorer les prédictions en donnant la priorité à certaines régions génomiques, (ii) étudier le potentiel des données multi-omiques pour prendre en compte les IGE tout en améliorant la prédiction des caractères complexes, et (iii) identifier les gènes qui sont associés aux caractères de productivité et qui répondent aux conditions environnementales pour mieux comprendre la biologie derrière les IGE.Notre étude repose sur un panel de 244 hybrides de maïs évalués pour leur productivité dans des essais menés en Europe et au Chili sous des régimes hydriques contrastés. En outre, les annotations fonctionnelles des gènes ont été obtenues à partir de bases de données publiques. Les mêmes génotypes ont également été évalués pour leurs caractéristiques écophysiologiques, et les profils transcriptomiques et protéomiques ont été mesurés dans des conditions hydriques contrastées sur une plateforme.Dans le chapitre 1, nous avons montré que les marqueurs situés à proximité des gènes de certaines catégories fonctionnelles peuvent améliorer les prédictions de caractères de plein champ ou de plateforme.Dans le chapitre 2, nous avons pu montrer que les données omiques pouvaient accroître la capacité de prédiction par rapport à la sélection génomique, en particulier pour les caractères phénotypés dans les mêmes conditions que celles dans lesquelles les données omiques ont été acquises. Nous avons également intégré des covariables environnementales et les informations multi-omiques dans un même modèle, ce qui, à notre connaissance, n'a encore jamais été testé dans la littérature.Dans le chapitre 3, l'étude d'association transcriptomique (TWAS) a montré que les données omiques mesurées dans des conditions de plateforme contrôlées peuvent aider à disséquer l'architecture génétique du rendement mesuré dans des conditions de plein champ. Nous avons également constaté que certains des transcrits significativement associés ont déjà été identifiés dans la littérature comme étant associés à la réponse au stress. En outre, nous avons observé que la TWAS est complémentaire de la génétique d'association car elle peut améliorer la résolution et la puissance de détection.Pour conclure, cette thèse indique que les annotations fonctionnelles et les données multi-omiques sont utiles pour comprendre et prédire les IGE
Maize breeding programs heavily rely on multi-environmental trials (MET) to evaluate the phenotypic (P) performance of hybrids under diverse field conditions. Within these trials, genotype by environment (GxE) interactions has substantial effect on phenotypic variability, and can sometimes exceed the main genetic effect (G). Therefore, predicting and understanding GxE interactions is of utmost importance to ensure genetic improvement of maize.Classical genomic prediction models, even the ones accounting for GxE component separately from G, do not consider the complexity of maize genome and how genomic regions respond differently to environmental stimuli. By assuming an infinitisemal model, they act as black boxes relying on statistical rather than biological relationships. Researchers have suggested that genome functional annotations and multi-omics information have potential to better explain the genotype phenotype relationship. Studies have shown that prioritizing genomic markers, i.e., SNPs, based on a prior biological or functional information can help improve predictive abilities of models. Similar results have also been reported in the studies accounting for multi-omics information, such as transcripts, proteins, and metabolites, in genomic prediction. However, most of these studies are either performed for a single experiment or a set of experiments within a single location. Their potential in capturing GxE interactions for complex quantitative traits in a large MET setting needs further validation.Therefore, this thesis aims to (i) evaluate the potential of genomic functional annotations to improve maize predictions by prioritizing those genomic regions that respond to environmental stimuli for a given trait, (ii) investigate the potential of multi-omics data to account for GxE while improving prediction of complex traits, and (iii) identify genes that are found to be associated with productivity traits and respond to environmental conditions to offer insights into the biology beyond GxE interactions.Our study uses a set of 244 maize hybrids evaluated for productivity traits in field trials carried out across Europe and Chile under contrasted watering regimes. Environmental covariates related to key developmental stages of plants in field were also obtained. In addition, gene ontology (GO) functional annotations for maize genome was obtained from publicly available databases. The same genotypes were also evaluated for ecophysiological traits, and transcriptomic and proteomic profiles were measured for contrasting watering regimes in controlled conditions on a platform.In Chapter 1, we illustrated that when the right GO terms are considered, biologically relevant SNPs can account for variance separately from the rest of the SNPs, ultimately improving predictions of both field productivity and platform ecophysiological traits.In Chapter 2, we were able to show that the omics data could increase predictive ability in comparison to genomic selection, in particular for the traits phenotyped in the controlled experiment in which the omics were measured. We also integrated ECs and multi-omics information within the same model, that according to our knowledge this was the first example in literature.In Chapter 3, transcriptome wide association study (TWAS) showed that omics measured in controlled platform conditions can help dissect the genetic architecture of grain yield measured in field MET. We also found that some of the significantly associated transcripts have already been reported in the literature to be associated with response to stress. Importantly, we observed that TWAS complements GWAS as it can improve resolution and detection power of association analysis.Overall, this thesis indicates that functional annotations and multi-omics are useful in understanding and predicting GxE interactions
APA, Harvard, Vancouver, ISO, and other styles
14

Ly, Delphine. "Prédictions génomiques des interactions Génotype x Environnement à l'aide d'indicateurs agro-climatiques chez le blé tendre (Triticum aestivum L.)." Thesis, Clermont-Ferrand 2, 2016. http://www.theses.fr/2016CLF22669/document.

Full text
Abstract:
Un des principaux enjeux de l’amélioration des plantes consiste aujourd’hui à faire face au changement climatique, en assurant un rendement élevé et plus stable dans des systèmes agricoles économes en intrants (eau, fertilisants) et respectueux de l’environnement. Les nouvelles variétés de blé devront non seulement être tolérantes aux stress hydriques et aux fortes températures, mais aussi continuer à être productives avec des apports limités en fertilisation, tout en maintenant une qualité du grain adaptés aux différents usages. De nouvelles méthodes de prédiction des réponses des blés à ces stress sont indispensables pour avancer dans cette direction. Dans ce travail, nous avons tout d’abord identifié les stress qui régissaient les interactions entre génotypes et les environnements (GxE) dans les essais considérés, puis développé un modèle génomique de l’adaptation à un stress environnemental (Factorial Regression genomic Best Linear Unbiased Prediction ou FR-gBLUP), en particulier pour le stress hydrique. En émettant l’hypothèse que plus des variétés de blés sont génétiquement proches, plus elles répondront de façon similaire à un stress environnemental donné, nous avons mesuré par validation croisée des gains de précision de prédiction par rapport à un modèle additif variant entre 3.5% et 15.4%. Des simulations complètent l’étude en démontrant que plus la part de variance expliquée par les réponses au stress considéré est importante, plus le modèle FR-gBLUP apporte un gain de précision. Pour prédire les réponses variétales à un stress particulier, les environnements doivent être finement caractérisés pour les stress limitant le développement des plantes. En nous intéressant plus particulièrement au stress azoté en France, nous avons établi des indicateurs de stress à partir d’un modèle de culture, et les avons comparés à des indicateurs classiques, tels que le type de conduite azotée ou l’azote disponible. Nous avons ainsi mis en évidence l’intérêt des modèles de culture pour caractériser les interactions GxE et pour prédire la réponse génomique au stress azoté, à condition que le signal d’interaction soit assez fort. Au-delà de l’application potentielle de ces méthodes pour la sélection ou la recommandation de variétés de blés plus adaptées ou plus résistantes au changement climatique, les résultats de ce travail démontrent aussi l’intérêt de la complémentarité des approches éco-physiologiques et génétiques
In a climate change context, assuring high and stable yield in more sustainable agricultural systems is a major challenge for plant breeding. We are aiming for future wheat varieties which will be heat and drought tolerant, and also productive in limited fertilization input environments. New prediction methods of the response to these stresses are needed to move forward. In this study, we first identified stresses that generated interactions between genotypes and environments (GxE) in our experimental trials and then developed a genomic model for adaptation to a particular environmental stress (Factorial Regression genomic Best Linear Unbiased Prediction ou FR-gBLUP), in our case drought. This model hypothesizes that the more individuals are genetically close, the more their response to a stress will resemble. We used cross-validations to measure prediction accuracy gains compared to an additive model and observed gains between 3.5% and 15.4%. Besides, simulation studies showed that the more the variance explained by the responses to the stress is important, the more the FR-gBLUP model will improve the additive model. Furthermore, fine characterization of the stresses limiting the plants’ growth is required to predict varietal responses to a particular stress. We focused on the particular case of nitrogen stress in France. By establishing crop model based stress indicators and comparing them to classical indicators, such as the management system or the available nitrogen, we pointed out the interest of crop model to characterize GxE interactions and to predict the genomic response to nitrogen stress, as long as the GxE interaction signal is strong enough. Beyond the potential applications of these methods for breeding or recommendation for varieties more adapted or tolerant to environmental stresses, this study also raises the interest of coupling eco-physiological and genetics approaches
APA, Harvard, Vancouver, ISO, and other styles
15

Rio, Simon. "Contributions to genomic selection and association mapping in structured and admixed populations : application to maize." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLS097.

Full text
Abstract:
L'essor des marqueurs moléculaires (SNPs) a révolutionné les méthodes de génétique quantitative en permettant l'identification de régions impliquées dans le déterminisme génétique des caractères (QTLs) via la génétique d'association (GWAS), ou encore la prédiction des performances d'individus sur la base de leur information génomique (GS). La stratification des populations en groupes génétiques est courante en sélection animale et végétale. Cette structure peut impacter les méthodes de GWAS et de GS via des différences de fréquence et d'effets des allèles des QTL, ainsi que par des différences de déséquilibre de liaison (LD) entre SNP et QTL selon les groupes.Pendant cette thèse, deux panels de diversité de maïs ont été utilisés, présentant des niveaux différents de structuration: le panel “Amaizing Dent” représentant les lignées dentées utilisées en Europe et le panel “Flint-Dent” incluant des lignées dentées, cornées européennes, ainsi que des lignées admixées entre ces deux groupes.En GS, l'impact de la structure génétique sur la qualité des prédictions a été évalué au sein du premier panel pour des caractères de productivité et de phénologie. Cette étude a mis en évidence l'intérêt d'une population d'entraînement (TS) dont la constitution en matière de groupes génétiques est similaire à celle de la population à prédire. Assembler les différents groupes au sein d'un TS multi-groupe apparaît comme une solution efficace pour prédire un large spectre de diversité génétique. Des indicateurs a priori de la précision des prédictions génomiques, basés sur le coefficient de détermination, ont également été évalués, mettant en évidence une efficacité variable selon le groupe et le caractère étudié.Une nouvelle méthodologie GWAS a ensuite été développée pour étudier l'hétérogénéité des effets capturés par les SNPs selon les groupes. L'intégration des individus admixés à l'analyse permet de séparer les effets des facteurs responsables de l'hétérogénéité des effets alléliques: différence génomique locale (liée au LD ou à une mutation spécifique d'un groupe) ou interactions épistatiques entre le QTL et le fonds génétique. Cette méthodologie a été appliquée au panel “Flint-Dent” pour la précocité de floraison. Des QTL ont été détéctés comme présentant des effets groupe-spécifiques interagissant ou non avec le fonds génétique. De nombreux QTL présentant un profil original ont pu être mis en évidence, incluant des locus connus tels que Vgt1, Vgt2 ou Vgt3. Une importante épistasie directionnelle a aussi été mise en évidence grâce aux individus admixés, confortant l'existence d'interactions épistatiques avec le fonds génétique pour ce caractère.Sachant l'existence de cette hétérogénéité d’effets alléliques, nous avons développé deux modèles de prédictions génomiques nommées Multi-group Admixed GBLUP (MAGBLUP). Ceux-ci modélisent des effets groupe-spécifiques aux QTLs et sont adaptés à la prédiction d'individus admixés. Le premier permet d'identifier la variance génétique additionnelle créée par l'admixture (variance de ségrégation), alors que le second permet d'évaluer le degré de conservation des effets alléliques entre groupes. Ces deux modèles ont montré un intérêt certain par rapport à des modèles standards pour prédire des caractères simulés, mais plus limité sur des caractères réels.Enfin, l'intérêt des individus admixés dans la constitution de TS multi-groupes a été évalué à l'aide du second panel. Si leur intérêt a clairement été mis en évidence pour des caractères simulés, des résultats plus variables ont été observés avec les caractères réels, pouvant s'expliquer par la présence d'interactions avec le fonds génétique.Les nouvelles méthodes et l'utilisation d'individus admixés ouvrent des pistes de recherches intéressantes pour les études de génétique quantitative en population structurée
The advent of molecular markers (SNPs) has revolutionized quantitative genetics methods by enabling the identification of regions involved in the genetic determinism of traits (QTLs) thanks to association studies (GWAS), or the prediction of the performance of individuals using genomic information (GS). The stratification of populations into genetic groups is common in animal and plant breeding. This structure can impact GWAS and GS methods through group differences in QTL allele frequencies and effects, as well as in linkage disequilibrium (LD) between SNP and QTL.During this thesis, two maize diversity panels were used, presenting different levels of structuration: the "Amaizing Dent" panel representing the diversity of dent lines used in Europe and the "Flint-Dent" panel including dent, flint and admixed lines between these two groups.In GS, the impact of genetic structure on genomic prediction accuracy was evaluated in the first panel for productivity and phenology traits. This study highlighted the interest of a training population (TS) whose constitution in terms of genetic groups is similar to that of the population to be predicted. Assembling the different groups within a multi-group TS appears as an effective solution to predict a broad spectrum of genetic diversity. A priori indicators of genomic prediction accuracy, based on the coefficient of determination, were also evaluated and highlighted a variable efficiency depending on the group and the trait.A new GWAS methodology was then developed to study the heterogeneity of the allele effects captured by SNPs depending on the group. The integration of admixed individuals to such analyses allows to disentangle the factors causing the heterogeneity of allele effects across groups: local genomic difference (related to LD or group-specific mutation) or epistatic interactions between the QTL and the genetic background. This methodology was applied to the "Flint-Dent" panel for flowering time. QTLs have been detected as presenting group-specific effects interacting or not with the genetic background. QTLs with an original profile have been highlighted, including known loci such as Vgt1, Vgt2 or Vgt3. Significant directional epistasis has also been demonstrated using admixed individuals and supported the existence of epistatic interactions with the genetic background for this trait.Based on the existence of such heterogeneity of allele effects, we have developed two genomic prediction models named Multi-group Admixed GBLUP (MAGBLUP). Both model group-specific QTL effects and are suited to the prediction of admixed individuals. The first allows the identification the additional genetic variance created by the admixture (segregation variance), while the second allows the evaluations of the degree of conservation of SNP allele effects across groups. These two models showed a certain interest compared to standard models to predict simulated traits, but it was more limited on real traits.Finally, the interest of admixed individuals in multi-group TS was evaluated using the second panel. Although their interest has been clearly demonstrated for simulated traits, more variable results have been observed with the real traits, which can be explained by the presence of interactions with the genetic background.The new methods and the use of admixed individuals open interesting lines of research for quantitative genetics studies in structured population
APA, Harvard, Vancouver, ISO, and other styles
16

Decaux, Olivier. "Recherche de marqueurs moléculaires prédictifs dans le myélome multiple." Nantes, 2009. https://archive.bu.univ-nantes.fr/pollux/show/show?id=a4d718fc-b7de-449c-9ae3-781dce46ab7b.

Full text
Abstract:
L'évolution des patients atteints de myélome est très hétérogène avec des survies allant de quelques mois à plus de 10 ans. Les analyses par hybridation in situ en fluorescence sur cellules interphasiques (FISH) ont permis de démontrer l'impact pronostique des anomalies génétiques dans le myélome. Les techniques de génomique (dites de « puces à ADN ») permettent une analyse globale au niveau de l'ADN ou de l'ARN. Les premières puces à ADN développées consistaient à analyser les profils d'expression génique et ont été utilisées avec succès en cancérologie. Notre équipe a utilisé ces techniques dans le myélome multiple. Notre objectif principal était de développer des marqueurs moléculaires prédictifs dans le myélome. Nos travaux nous ont permis : (1) de démontrer que l'hétérogénéité clinique et biologique du myélome était associée à une hétérogénéité moléculaire et de fournir une explication quant à la gravité de sous types biologiques de myélome. (2) d'identifier un groupe de 15 gènes dont l'expression est associée à la survie et de proposer un score prédictif de la survie. (3) de démontrer que l'inhibition de la voie mTOR via l'expression d'un gène de réponse au stress (REDD1) est un mécanisme potentiel de résistance à l'association bortezomib-dexamethasone. Les techniques de génomique sont arrivées à maturité et permettent maintenant l'étude des variations du nombre de copies d'ADN à l’échelle du génome et d'analyser les modifications post-transcriptionnelles. Ces techniques devraient permettre d'améliorer nos connaissances sur la physiopathologie du myélome multiple et d'identifier des marqueurs moléculaires prédictifs performants. L'enjeu est maintenant le transfert des résultats de recherche en pratique clinique quotidienne
Survival of patients with multiple myeloma is highly heterogeneous, from periods of a few months to more than 10 years. Interphase fluorescence in situ hybridization (FISH) analysis have demonstrated the prognostic impact of genetic abnormalities in myeloma. DNA chips provide a comprehensive analysis at the level of DNA or RNA. The first DNA chips aimed to analyze gene expression profiles and have been used successfully in cancer. We employed these techniques to study multiple myeloma. Our main objective was to develop predictive molecular markers in multiple myeloma. Our results (1) revealed that the clinical and biological heterogeneity of myeloma is associated with a molecular heterogeneity and provide explanations about severity of subtypes of myeloma. (2) identified a group of 15 genes whose expression is associated with survival and led us to propose a predictive score of survival. (3) revealed a possible novel mechanism of bortezomib resistance in myeloma patients mediated by REDD1 overexpression involving inhibition of mTOR activity. Genomics techniques are now mature and allow genome-wide DNA copy number abnormalities analyses as well as gene expression regulation. These tools should provide new insights into pathophysiology of multiple myeloma and lead to identification of new predictive markers. The challenge is now to transfer these results in clinical practice
APA, Harvard, Vancouver, ISO, and other styles
17

Ben, Sadoun Sarah. "Optimisation du schéma de sélection chez le blé tendre : apport des prédictions génomiques et des caractères corrélés." Thesis, Université Clermont Auvergne‎ (2017-2020), 2020. http://www.theses.fr/2020CLFAC014.

Full text
Abstract:
La sélection variétale consiste à créer de nouvelles variétés répondant aux exigences du marché pour plusieurs caractères d’intérêt agronomique. L’objectif de la thèse était d’étudier l’apport des prédictions génomiques pour optimiser les programmes de sélection chez le blé tendre. Dans un premier chapitre, nous avons testé des méthodes visant à améliorer la précision les prédictions génomiques d’un caractère cher à mesurer en utilisant un caractère corrélé moins cher à mesurer, sans augmenter le budget alloué au phénotypage. Nous avons utilisé un modèle de prédiction génomique multi-caractère. Nous avons développé un indice appelé CDmulti permettant d’optimiser le choix d’un sous-ensemble de lignées à phénotyper pour deux caractères corrélés. Nous avons montré que les prédictions génomiques multi-caractères étaient particulièrement intéressantes lorsque les lignées de la population de validation, ou au moins une partie d’entre elles, pouvaient être phénotypées pour la force boulangère, caractère corrélé à la note de panification et dont le phénotypage est moins coûteux. En effet, cette approche permettait de réduire le budget alloué au phénotypage sans diminuer la précision des prédictions de la qualité boulangère. Dans un deuxième chapitre, nous avons développé un pipeline de simulations stochastiques pour comparer des schémas de sélection produits in silico à partir du génotypage et du phénotypage d’une population de référence. Un cycle dure cinq ans, comprenant un an pour les croisements, un an pour la production d’haploïdes doublés, un an de multiplication, une étape de sélection qui peut être basée soit sur les valeurs phénotypiques (stratégie PS) soit sur les prédictions génomiques (stratégie GPS), et une dernière année de sélection phénotypique. Pour la stratégie GPS, nous avons la possibilité de faire les croisements au hasard parmi les meilleurs descendants du cycle précédent, ou d’optimiser les croisements grâce aux prédictions génomiques. Nous montrons que la stratégie GPS avec optimisation des croisements est systématiquement significativement supérieure aux autres pour tous les paramètres testés (héritabilité du caractère, budget, intensité de sélection relative à deux étapes clé). L’efficacité de la stratégie GPS sans optimisation de croisement est similaire à PS. En revanche, la perte de diversité génétique était plus rapide pour GPS avec ou sans prédiction de croisement. Des modules complémentaires seront ajoutés à cet outil d’aide à la décision pour lui permettre de simuler des schémas de sélection plus réalistes
Breeding consists in creating new varieties which combine qualities for several traits of agronomic interest to answer to the market demand. The objective of the phD was to propose strategies using genomic predictions to optimize bread wheat breeding programs in terms of genetic gain under economic constraint. In a first chapter, we tested methods aiming at improving genomic prediction accuracy of a trait that is expensive to measure using a correlated cheap trait, without increasing the budget allocated to phenotyping. We used a multi-trait genomic prediction models. We also developed an index called CDmulti to optimize the choice of a subset of lines to phenotype for two different correlated traits. We showed that multi-trait genomic predictions could be particularly interesting when lines of the validation set, or at least part of them, could be phenotyped for dough strength, which is correlated to bread-making quality and which is cheaper to phenotype. Indeed, this approach allowed to reduce the budget allocated to phenotyping without decreasing the genomic prediction accuracy of bread-making quality. In a second chapter, we developed a stochastic simulation pipeline to compare breeding scheme produce in silico, using genotyping and phenotyping of a reference population. One cycle lasts five years, including one year for crossing, one year for double haploids production, one year for seed multiplication, one year of selection based on either phenotypic value (PS strategy) or genomic predictions (GPS strategy), and one last year of phenotypic selection. For GPS strategy, we can mate the best lines of previous cycle at random or optimise mating using genomic predictions. We showed that GPS strategy with mating optimization is systematically significantly superior to other strategies for all tested parameters (trait heritability, budget, relative intensity of selection at two key steps). The efficiency of GPS strategy without mating optimization was similar to PS. However, the loss of genetic diversity was more intense for GPS strategies, with or without mating optimization. Some complementary modules will be added to this decision tool to simulate more realistic breeding schemes
APA, Harvard, Vancouver, ISO, and other styles
18

Darde, Thomas. "Identification et classification de composés reprotoxiques par des approches de toxicogénomique prédictive." Thesis, Rennes 1, 2017. http://www.theses.fr/2017REN1B022/document.

Full text
Abstract:
L’un des plus importants défis de la toxicologie est de pouvoir extrapoler les résultats issus des différentes phases de l’analyse du risque sanitaire à partir de systèmes expérimentaux vers les populations humaines. Dans ce contexte, les techniques globales dites "omiques" sont de plus en plus utilisées pour caractériser les différents états des systèmes biologiques. Ainsi, la toxicogénomique permet non seulement d’étudier les mécanismes d’action des composés, d’identifier des marqueurs d’exposition, mais aussi de générer des signatures moléculaires à potentiel prédictif. En effet, des composés ayant des signatures moléculaires semblables ont également de forts risques de présenter les mêmes effets toxicologiques. L’objectif de cette thèse est d’appliquer ce concept de manière systématique, en explorant les données publiées et disponibles dans les banques dédiées à la toxicogénomique via des modèles statistiques multivariés. Ces analyses ont pour objectif de permettre le regroupement et donc la classification des composés sur la base des gènes dont ils affectent l’expression. L’appartenance de produits toxiques bien caractérisés aux classes ainsi constituées permet alors d’émettre des hypothèses quant à la toxicité des autres composés. Un jeu de données quantitatives intégrant 18 études réalisées avec la même technologie de puce à ADN et chez une seule espèce a été assemblé. De ce jeu de données, 3022 signatures toxicogénomiques correspondant à 452 composés différents ont été obtenues. Des approches de classification non supervisées afin de définir des classes de traitements induisant des altérations transcriptionnelles proches ont été mises en place. 95 et 104 classes ont été obtenues en fonction des méthodes utilisées. Finalement, une attention toute particulière a été portée sur les potentiels nouveaux perturbateurs endocriniens et xénobiotiques reprotoxiques sur-représentés dans trois classes spécifiquement. 22 composés sont en cours de test sur une lignée cellulaire humaine exprimant les enzymes de la stéroïdogenèse (NCI-H295R) pour évaluer leur potentiel effet perturbateur endocrinien. L’ensemble de ce travail a ainsi permis de démontrer la pertinence de nos approches de toxicogénomique pour la prédiction des effets toxiques de composés testés dans d’autres organes et/ou chez d’autres espèces. Il se poursuit à l’heure actuelle par la mise en place d’une base de données, TOXsIgN, permettant l’hébergement et l’accès à l’ensemble de signatures de toxicogénomique générées dans ce projet. De même, mon travail a également permis la mise en place de plusieurs outils dédiés à la toxicologie prédictive et à la visualisation de données, tels que le navigateur de génomes comme le ReproGenomics Viewer (RGV)
The core aim of my thesis project is to develop predictive toxicology approaches based on the integration of massive toxicogenomics datasets using bioinformatics and biostatistics methodologies. Specific objectives include: (1) classification of chemicals based on toxicogenomics signatures, i.e. the set of genes whose expression is known to be positively or negatively altered after exposure to these compounds; (2) the association of the resulting classes with human disorders or deleterious phenotypes based on the well-known toxicants present in those classes; (3) the prediction of novel reprotoxicants and/or endocrine disruptors based on toxicogenomics signature similarities with known chemicals affecting testis development and function. The assembled toxicogenomics dataset contains 23,657 samples covering 7092 experimental conditions (one chemical, one dose, one exposure time, one tissue) for 541 chemicals in seven distinct tissues in the rat from 18 different studies. From this dataset, 3,022 experimental conditions corresponding to 452 distinct compounds are associated to a toxicogenomics signature containing more than ten genes showing an altered expression pattern after exposure. Using unsupervised classification methods, 95 chemical clusters were defined showing close toxicogenomics signatures. The phenotype association analysis using data extracted from de Comparative Toxicogenomics Database (CTD) allowed us to identify three clusters significantly enriched in known endocrine-disrupting chemicals. Currently, 22 compounds are being tested on a human cell line expressing the enzymes of steroidogenesis (NCI-H295R) to evaluate their potential endocrine disrupting effects. These researches allowed us to demonstrate the relevance of integrating massive toxicogenomics datasets to predict adverse effects of compounds tested in different organs. It is currently being pursued through the development of a novel repository, TOXsIgN. This resource provides a flexible environment to facilitate online submission, storage and retrieval of toxicogenomics signatures by the scientific community. Similarly, the current PhD project also yielded to the implementation of several tools dedicated to predictive toxicology and data visualization including the ReproGenomics Viewer (RGV)
APA, Harvard, Vancouver, ISO, and other styles
19

Sun, Roger. "Utilisation de méthodes radiomiques pour la prédiction des réponses à l’immunothérapie et combinaisons de radioimmunothérapie chez des patients atteints de cancers Radiomics to Assess Tumor Infiltrating CD8 T-Cells and Response to Anti-PD-1/PD-L1 Immunotherapy in Cancer Patients: An Imaging Biomarker Multi-Cohort Study Imagerie médicale computationnelle (radiomique) et potentiel en immuno-oncologie Radiomics to Predict Outcomes and Abscopal Response of Cancer Patients Treated with Immunotherapy Combined with Radiotherapy Using a Validated Signature of CD8 Cells." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASL023.

Full text
Abstract:
Depuis l’arrivée des inhibiteurs de points de contrôle immunitaire, l’immunothérapie a profondément modifié la prise en charge de nombreux cancers, permettant parfois des réponses tumorales prolongées chez des patients atteints de cancers aux stades très avancés. Cependant, malgré des progrès thérapeutiques constants et des associations de traitements combinant par exemple radiothérapie et immunothérapie, la majorité des patients traités ne présentent pas de bénéfices à ces traitements. Ceci explique l’importance de la recherche de biomarqueurs innovants de réponse à l’immunothérapie.L’application de l’intelligence artificielle en imagerie est une discipline récente et en pleine expansion. L’analyse informatique de l’image, appelée également radiomique, permet d’extraire des images médicales de l’information non exploitable à l’œil nu, potentiellement représentative de l’architecture des tissus sous-jacents et de leur composition biologique et cellulaire, et ainsi de développer des biomarqueurs grâce à l’apprentissage automatique (« machine learning »). Cette approche permettrait d’évaluer de façon non invasive la maladie tumorale dans sa globalité, avec la possibilité d’être répétée facilement dans le temps pour appréhender les modifications tumorales survenant au cours de l’histoire de la maladie et de la séquence thérapeutique.Dans le cadre de cette thèse, nous avons évalué si une approche radiomique permettait d’évaluer l’infiltration tumorale lymphocytaire, et pouvait être associée à la réponse de patients traités par immunothérapie. Dans un deuxième temps, nous avons évalué si cette signature permettait d’évaluer la réponse clinique de patients traités par radiothérapie et immunothérapie, et dans quelle mesure elle pouvait être utilisée pour évaluer l’hétérogénéité spatiale tumorale. Les défis spécifiques posés par les données d’imagerie de haute dimension dans le développement d’outils prédictifs applicables en clinique sont discutés dans cette thèse
With the advent of immune checkpoint inhibitors, immunotherapy has profoundly changed the therapeutic strategy of many cancers. However, despite constant therapeutic progress and combinations of treatments such as radiotherapy and immunotherapy, the majority of patients treated do not benefit from these treatments. This explains the importance of research into innovative biomarkers of response to immunotherapyComputational medical imaging, known as radiomics, analyzes and translates medical images into quantitative data with the assumption that imaging reflects not only tissue architecture, but also cellular and molecular composition. This allows an in-depth characterization of tumors, with the advantage of being non-invasive allowing evaluation of tumor and its microenvironment, spatial heterogeneity characterization and longitudinal assessment of disease evolution.Here, we evaluated whether a radiomic approach could be used to assess tumor infiltrating lymphocytes and whether it could be associated with the response of patients treated with immunotherapy. In a second step, we evaluated the association of this radiomic signature with clinical response of patients treated with radiotherapy and immunotherapy, and we assessed whether it could be used to assess tumor spatial heterogeneity.The specific challenges raised by high-dimensional imaging data in the development of clinically applicable predictive tools are discussed in this thesis
APA, Harvard, Vancouver, ISO, and other styles
20

Hallin, Johan Henning. "Élucider les facteurs génétiques à l'origine de la variabilité des populations par phénomique et génomique de masse." Thesis, Université Côte d'Azur (ComUE), 2018. http://www.theses.fr/2018AZUR4010/document.

Full text
Abstract:
La variabilité phénotypique existante au sein d’une population est d’une importance cruciale ; elle permet l’adaptation à de nouvelles conditions par la sélection naturelle de traits bénéfiques. La variabilité phénotypique est le résultat du polymorphisme génétique de chaque individu, couplé à l’influence de divers facteurs environnementaux. Ces travaux ont pour objectif d’élucider quels sont les facteurs génétiques responsables de la variabilité phénotypique de chaque individu afin de comprendre comment celle-ci évolue de génération en génération et peut s’accentuer au-delà des prédispositions parentales. Finalement, les résultats obtenus seront utilisés pour prédire un phénotype à partir d’un génotype inconnu. Nous avons utilisé des techniques de phénomique et de génomique de haut débit pour décomposer avec une précision inédite la variabilité phénotypique d’une large population de souches diploïdes de Saccharomyces cerevisiae. Le génotype exact de plus de 7000 souches uniques a ainsi été obtenu via le croisement et le séquençage de souches haploïdes distinctes. Nous avons mesuré la capacité de croissance de ces souches et identifié les composants génétiques influant sur ce trait. De plus, nous avons identifié des « loci de caractères quantitatifs » additifs et non-additifs, et étudié la fréquence du phénomène d’hétérosis et ses mécanismes. Enfin, en utilisant les données phénotypiques et génotypiques de la même population de levures, nous avons pu prédire les traits de chaque individu avec une presque parfaite exactitude. Ces travaux ont ainsi permis d’identifier avec précision les facteurs génétiques modulant la variation phénotypique d’une population diploïde, et de prédire un trait à partir du génotype et de l’ensemble des données phénotypiques. En plus de ce projet, nous travaillons aussi sur l’identification des bases génétiques à l’origine de la non-viabilité des gamètes, ainsi que sur la compréhension des caractères complexes chez des souches hybrides intra-espèce. De par l’étude de 9000 gamètes séquencés issus de six hybrides différents, nous avons pour objectif de caractériser leur profil de recombinaison et d’observer quelle est l’influence du fond génétique sur ce dernier. De plus, nous avons caractérisé la capacité de croissance de ces gamètes dans neuf conditions environnementales différentes et nous prévoyons de disséquer l’architecture génétique de ces traits dans différents fonds génétiques
The phenotypic variation between individuals in a population is of crucial importance. It allows populations to evolve to novel conditions by the natural selection of beneficial traits. Variation in traits can be caused by genetic or environmental factors. This work endeavors to study the genetic factors that underlie phenotypic variation in order to understand how variation can be created from one generation to the next; to know what genetic mechanisms are most prominent; to learn how variation can extend beyond the parents; and finally, to use this in order to predict phenotypes of unknown genetic constellations. We used large scale phenomics and genomics to give an unprecedented decomposition of the phenotypic variation in a large population of diploid Saccharomyces cerevisiae strains. Constructing phased outbred lines by large scale crosses of sequenced haploid strains allowed us to infer the genetic makeup of more than 7,000 colonies. We measured the growth of these strains and decomposed the phenotypic variation into its genetic components. In addition, we mapped additive and nonadditive quantitative trait loci, we investigated the occurrence of heterosis and its genetic basis, and using the same populations we used phenotypic and genetic data to predict traits with near perfect accuracy. By using the phased outbred line approach, we succeeded in giving a conclusive account of what genetic factors define phenotypic variation in a diploid population, and in accurately predicting phenotypes from genetic and phenotypic data. Beyond the phased outbred line project, I am currently investigating the genetic basis of gamete inviability and complex traits in intraspecies yeast hybrids. Using 9,000 sequenced gametes from six different hybrids we aim to characterize their recombination landscape and how the genetic background influences it. Furthermore, we have phenotyped these gametes in nine conditions and will dissect the genetic architecture of these traits across multiple genomic backgrounds
APA, Harvard, Vancouver, ISO, and other styles
21

Hallin, Johan Henning. "Élucider les facteurs génétiques à l'origine de la variabilité des populations par phénomique et génomique de masse." Electronic Thesis or Diss., Université Côte d'Azur (ComUE), 2018. http://www.theses.fr/2018AZUR4010.

Full text
Abstract:
La variabilité phénotypique existante au sein d’une population est d’une importance cruciale ; elle permet l’adaptation à de nouvelles conditions par la sélection naturelle de traits bénéfiques. La variabilité phénotypique est le résultat du polymorphisme génétique de chaque individu, couplé à l’influence de divers facteurs environnementaux. Ces travaux ont pour objectif d’élucider quels sont les facteurs génétiques responsables de la variabilité phénotypique de chaque individu afin de comprendre comment celle-ci évolue de génération en génération et peut s’accentuer au-delà des prédispositions parentales. Finalement, les résultats obtenus seront utilisés pour prédire un phénotype à partir d’un génotype inconnu. Nous avons utilisé des techniques de phénomique et de génomique de haut débit pour décomposer avec une précision inédite la variabilité phénotypique d’une large population de souches diploïdes de Saccharomyces cerevisiae. Le génotype exact de plus de 7000 souches uniques a ainsi été obtenu via le croisement et le séquençage de souches haploïdes distinctes. Nous avons mesuré la capacité de croissance de ces souches et identifié les composants génétiques influant sur ce trait. De plus, nous avons identifié des « loci de caractères quantitatifs » additifs et non-additifs, et étudié la fréquence du phénomène d’hétérosis et ses mécanismes. Enfin, en utilisant les données phénotypiques et génotypiques de la même population de levures, nous avons pu prédire les traits de chaque individu avec une presque parfaite exactitude. Ces travaux ont ainsi permis d’identifier avec précision les facteurs génétiques modulant la variation phénotypique d’une population diploïde, et de prédire un trait à partir du génotype et de l’ensemble des données phénotypiques. En plus de ce projet, nous travaillons aussi sur l’identification des bases génétiques à l’origine de la non-viabilité des gamètes, ainsi que sur la compréhension des caractères complexes chez des souches hybrides intra-espèce. De par l’étude de 9000 gamètes séquencés issus de six hybrides différents, nous avons pour objectif de caractériser leur profil de recombinaison et d’observer quelle est l’influence du fond génétique sur ce dernier. De plus, nous avons caractérisé la capacité de croissance de ces gamètes dans neuf conditions environnementales différentes et nous prévoyons de disséquer l’architecture génétique de ces traits dans différents fonds génétiques
The phenotypic variation between individuals in a population is of crucial importance. It allows populations to evolve to novel conditions by the natural selection of beneficial traits. Variation in traits can be caused by genetic or environmental factors. This work endeavors to study the genetic factors that underlie phenotypic variation in order to understand how variation can be created from one generation to the next; to know what genetic mechanisms are most prominent; to learn how variation can extend beyond the parents; and finally, to use this in order to predict phenotypes of unknown genetic constellations. We used large scale phenomics and genomics to give an unprecedented decomposition of the phenotypic variation in a large population of diploid Saccharomyces cerevisiae strains. Constructing phased outbred lines by large scale crosses of sequenced haploid strains allowed us to infer the genetic makeup of more than 7,000 colonies. We measured the growth of these strains and decomposed the phenotypic variation into its genetic components. In addition, we mapped additive and nonadditive quantitative trait loci, we investigated the occurrence of heterosis and its genetic basis, and using the same populations we used phenotypic and genetic data to predict traits with near perfect accuracy. By using the phased outbred line approach, we succeeded in giving a conclusive account of what genetic factors define phenotypic variation in a diploid population, and in accurately predicting phenotypes from genetic and phenotypic data. Beyond the phased outbred line project, I am currently investigating the genetic basis of gamete inviability and complex traits in intraspecies yeast hybrids. Using 9,000 sequenced gametes from six different hybrids we aim to characterize their recombination landscape and how the genetic background influences it. Furthermore, we have phenotyped these gametes in nine conditions and will dissect the genetic architecture of these traits across multiple genomic backgrounds
APA, Harvard, Vancouver, ISO, and other styles
22

Leonardis, Eleonora De. "Méthodes pour l'inférence en grande dimension avec des données corrélées : application à des données génomiques." Thesis, Paris, Ecole normale supérieure, 2015. http://www.theses.fr/2015ENSU0033/document.

Full text
Abstract:
La disponibilité de quantités énormes de données a changé le rôle de la physique par rapport aux autres disciplines. Dans cette thèse, je vais explorer les innovations introduites dans la biologie moléculaire grâce à des approches de physique statistique. Au cours des 20 dernières années, la taille des bases de données sur le génome a augmenté de façon exponentielle : l'exploitation des données brutes, dans le champ d'application de l'extraction d'informations, est donc devenu un sujet majeur dans la physique statistique. Après le succès dans la prédiction de la structure des protéines, des résultats étonnamment bons ont été finalement obtenus aussi pour l'ARN. Cependant, des études récentes ont révélé que, même si les bases de données sont de plus en plus grandes, l'inférence est souvent effectuée dans le régime de sous-échantillonnage et de nouveaux systèmes informatiques sont nécessaires afin de surmonter cette limitation intrinsèque des données réelles. Cette thèse va discuter des méthodes d'inférence et leur application à des prédictions de la structure de l'ARN. Nous allons comprendre certaines approches heuristiques qui ont été appliquées avec succès dans les dernières années, même si théoriquement mal comprises. La dernière partie du travail se concentrera sur le développement d'un outil pour l'inférence de modèles génératifs, en espérant qu'il ouvrira la voie à de nouvelles applications
The availability of huge amounts of data has changed the role of physics with respect to other disciplines. Within this dissertation I will explore the innovations introduced in molecular biology thanks to statistical physics approaches. In the last 20 years the size of genome databases has exponentially increased, therefore the exploitation of raw data, in the scope of extracting information, has become a major topic in statistical physics. After the success in protein structure prediction, surprising results have been finally achieved also in the related field of RNA structure characterisation. However, recent studies have revealed that, even if databases are growing, inference is often performed in the under sampling regime and new computational schemes are needed in order to overcome this intrinsic limitation of real data. This dissertation will discuss inference methods and their application to RNA structure prediction. We will discuss some heuristic approaches that have been successfully applied in the past years, even if poorly theoretically understood. The last part of the work will focus on the development of a tool for the inference of generative models, hoping it will pave the way towards novel applications
APA, Harvard, Vancouver, ISO, and other styles
23

Zgheib, Elias. "Bioinformatic and modelling approaches for a system-level understanding of oxidative stress toxicity." Thesis, Compiègne, 2018. http://www.theses.fr/2018COMP2464/document.

Full text
Abstract:
Avec les nouvelles avancées en biologie et toxicologie, on constate de plus en plus la complexité des mécanismes et le grand nombre de voies de toxicité. Les concepts de ‘biologie systémique’ (SB) et de ‘voies des effets indésirables’ (adverse outcome pathway, AOP) pourraient être des outils appropriés pour l’étude de la toxicologie à ces niveaux de complexité élevés. Le point central du travail de cette thèse est le développement d’un modèle de SB du rôle de la voie de signalisation Nrf2 dans le contrôle du stress oxydant. Pour la calibration de ce modèle avec des données expérimentales (exposition des cellules rénales RPTEC/TERT1 à différentes doses de bromate de potassium), plusieurs cycles de proposition/vérification d’hypothèses ont progressivement contribué à l’ajout de nouvelles réactions. Ces nouvelles hypothèses (par exemple : action directe du bromate de potassium sur le DCF, atténuation de la fluorescence du DCF avec le temps, etc.) devraient être confirmées par de futures expérimentations. Ce modèle de SB a été ensuite utilisé pour la quantification d’un AOP de l’insuffisance rénale chronique et comparé à deux autres approches: l’utilisation de modèles statistiques empiriques et celle d’un réseau Bayésien dynamique. Les calibrations des paramètres ont été effectuées par chaînes de Markov simulées MCMC avec le logiciel GNU MCSim avec une quantification des incertitudes associées aux prédictions. Même si la mise au point du modèle SB a été une tâche complexe, la compréhension de la biologie qu’offre ce modèle n’est pas accessible aux deux autres approches. Nous avons aussi évalué les interactions entre Nrf2 et deux autres voies de toxicité, AhR et ATF4, dans le cadre d’une analyse utilisant des données de toxico-génomique provenant de trois projets différents. Les résultats de cette dernière analyse suggèrent d’ajouter au modèle SB de Nrf2 la co-activation par AhR de plusieurs gènes (par exemple, HMOX1, SRXN1 et GCLM) ainsi que d’associer (au moins partiellement) à ce modèle la voie ATF4. Malgré leur complexité, les modèles SB constituent un investissement intéressant pour le développement de la toxicologie prédictive
New understanding of biology shows more and more that the mechanisms that underlie toxicity are complex and involve multiple biological processes and pathways. Adverse outcome pathways (AOPs) and systems biology (SB) can be appropriate tools for studying toxicology at this level of complexity. This PhD thesis focuses on the elaboration of a SB model of the role of the Nrf2 pathway in the control of oxidative stress. The model’s calibration with experimental data (obtained with RPTEC/TERT1 renal cells exposed to various doses of potassium bromate) comprised several rounds of hypotheses stating/verification, through which new reactions were progressively added to the model. Some of these new hypotheses (e.g., direct action of potassium bromate on DCF, bleaching of DCF with time, etc.) could be confirmed by future experiments. Considered in a wider framework, this SB model was then evaluated and compared to two other computational models (i.e., an empirical dose-response statistical model and a dynamic Bayesian model) for the quantification of a ‘chronic kidney disease’ AOP. All parameter calibrations were done by MCMC simulations with the GNU MCSim software with a quantification of uncertainties associated with predictions. Even though the SB model was indeed complex to conceive, it offers insight in biology that the other approaches could not afford. In addition, using multiple toxicogenomic databases; interactions and cross-talks of the Nrf2 pathway with two other toxicity pathways (i.e., AhR and ATF4) were examined. The results of this last analysis suggest adding new AhR contribution to the control of some of the Nrf2 genes in our SB model (e.g., HMOX1, SRXN1 and GCLM), and integrating in it description of the ATF4 pathway (partially at least). Despites their complexity, precise SB models are precious investments for future developments in predictive toxicology
APA, Harvard, Vancouver, ISO, and other styles
24

Bocs, Stéphanie. "(Ré)annotation de génomes procaryotes complets - Exploration de groupes de gènes chez les bactéries." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2004. http://tel.archives-ouvertes.fr/tel-00008296.

Full text
Abstract:
La stratégie experte semi-automatique de prédiction de Séquences CoDantes (CDS) d'un chromosome procaryote est fondée sur le modèle statistique des chaînes de Markov. Elle est constituée des stratégies AMIMat pour l'apprentissage de l'hétérogénéité de composition des CDS d'un chromosome et AMIGene pour la reconnaissance et le filtrage des CDS les plus probables. AMIMat permet de construire k matrices de transition à partir de k classes de gènes définies selon l'usage des codons synonymes. La précision d' AMIGene dépend de la qualité des matrices et d'autres paramètres validés automatiquement par rapport à des annotations de référence. Autour de ces stratégies, un processus de réannotation de génome complet a été développé, en interaction avec notre base multigénome PkGDB, qui facilite l'homogénéisation des annotations des banques. Ce processus de (ré)annotation est utilisé dans de nombreux projets : Bacillus, Neisseria, Acinetobacter, Entérobactéries.
APA, Harvard, Vancouver, ISO, and other styles
25

Bories, Pierre. "Identification de biomarqueurs de réponse à l'azacitidine dans les leucémies aigues myéloïdes du sujet âgé." Thesis, Strasbourg, 2018. http://www.theses.fr/2018STRAJ086/document.

Full text
Abstract:
Les leucémies aiguës myéloïdes (LAM) du sujet âgé sont les plus fréquentes des leucémies aiguës. Bien que de physiopathologie hétérogène, elles partagent un pronostic défavorable. L’azacitidine est devenue un des traitements de référence pour les patients jugés inéligibles pour une chimiothérapie intensive mais les critères de sélection des patients entre ces deux approches sont controversés. L’identification de biomarqueur prédictif de réponse à l’azacitidine doit permettre de rationnaliser ce choix thérapeutique. Les facteurs pronostiques classiques d’une cohorte de 334 patients atteints de LAM manquent de précision pour guider la meilleure stratégie pour un patient donné. A partir du séquençage de 224 patients traités par azacitidine, nous montrons un impact défavorable des mutations de TP53 sur la survie globale, quel que soit leur caractérisation fonctionnelle. Le séquençage des exomes de 49 patients selon leur réponse à l’azacitidine (26 répondeurs et 23 non répondeurs), suivi du re-séquençage ciblé de 4 polymorphismes chez 175 patients a montré un impact positif du polymorphisme rs7622799 de MECOM sur la survie globale sous azacitidine
Elderly patients with acute myeloid leukemias (AML) represent the most frequent acute leukemias. Although they differ in their pathophysiology, they all share an adverse prognosis. Azacitidine has become one of the reference low-intensity frontline therapy for patients deemed unfit for intensive chemotherapy. Patients selection between these 2 options remains controversial. Predictive biomarkers of response to azacitidine should allowed to rationalize this decision making. Classical prognosis factors of a cohort of 334 newly diagnosed AML lack of precision to determine the optimum strategy for any individual patient. By sequencing of a 224-patients series of azacitidine-treated AML patients, we demonstrate an adverse impact of TP53 mutation on overall survival, irrespective of the functional characterization of p53 mutants. Exome sequencing of 49 patients with extreme phenotype as defined by their response under azacitidine (26 responders versus 23 non-responders), followed by targeted sequencing of 4 common polymorphisms in a validation set of 175 patients, showed a positif impact of MECOM rs7622799 on overall survival
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography