To see the other types of publications on this topic, follow the link: Biostatistique.

Dissertations / Theses on the topic 'Biostatistique'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Biostatistique.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Salmi, Louis-Rachid. "Contribution a l'étude épidémiologique et biostatistique des accidents." Paris 7, 1990. http://www.theses.fr/1990PA077090.

Full text
Abstract:
Ce document regroupe deux travaux publiés, portant sur des aspects peu ou mal étudiés de l'épidémiologie des accidents. Ces deux articles sont d'abord replacés dans le contexte de mes travaux sur, d'une part, le rôle de l'environnement physique dans la genèse des accidents et, d'autre part, la promotion des méthodes épidémiologiques et biostatistiques dans l'étude des accidents. Une brève revue de la littérature récente permet également de situer les travaux présentés dans le contexte de la recherche actuelle sur les deux thèmes spécifiques abordés par ces travaux, les accidents de l'enfant dans les fermes et l'évaluation des soins aux traumatisés. Le premier article rapporte les résultats d'une étude épidémiologique des décès accidentels d'enfants dans les fermes de deux Etats américains. Cette étude a tout d'abord permis de décrire les caractéristiques épidémiologiques et les circonstances de ces événements. Elle a également permis de soulever des hypothèses nouvelles sur le rôle de l'environnement et sur l'interaction possible entre l'environnement et l'absence de supervision parentale dans les accidents de l'enfant dans les fermes. Le deuxième article présente une discussion critique de la mesure traditionnelle d'évaluation de la qualité des soins aux traumatisés, le taux de décès évitables, et propose d'intégrer une approche épidémiologique et biostatistique à ce domaine, par l'utilisation de paramètres classiques de l'évaluation des technologies médicales. Les problèmes méthodologiques liés au taux de décès évitables sont définis et sont illustrés par une simulation à partir de données publiées. Une discussion des implications des travaux présentés sur la recherche épidémiologique sur les accidents conclut le document<br>This thesis on the epidemiology of injuries includes two published reports on topics that either have received little attention, or have been poorly studied. The first part of the thesis relates the two articles to my research on: 1) the rote of the environment in the occurrence of injuries; and, 2) the promotion of epidemiological and biostatistical methods for the study of injuries. A brief literature review then puts the papers in perspective with other research on the topics addressed by the papers, namely pediatric farm injuries, and trauma care evaluation. The first article reports on an epidemiological study of fatal farm injuries among young children in Wisconsin and Illinois. This study described epidemiological characteristics and circumstances of fatal farm injuries; it also suggested new hypotheses on the rote of the environment and on the interaction between environmental factors and lack of parental supervision in the occurrence of pediatric farm injuries. The second article focusses on the appropriateness of the traditional measure of the impact of trauma care on survival, the preventable death rate. Methodological flaws in the preventable death rate are defined and illustrated with published and hypothetical data. The paper also includes a demonstration that an epidemiological and biostatistical approach, based on classical parameters of evaluation of medical technology, could be appropriately used in place of the preventable death rate. The thesis concludes with a discussion of the implications of the two papers for epidemiological research on injuries
APA, Harvard, Vancouver, ISO, and other styles
2

Hassan, Mouhannad. "Estimation dans les modèles elliptiques avec une application à la biostatistique." Montpellier 2, 2005. http://www.theses.fr/2005MON20048.

Full text
APA, Harvard, Vancouver, ISO, and other styles
3

Bauer, Rebecca. "Contributions statistiques à l’étude des cinétiques du vivant : application à la perfusion et au paludisme." Thesis, Sorbonne Paris Cité, 2015. http://www.theses.fr/2015USPCB141/document.

Full text
Abstract:
Notre travail constitue une contribution au développement de méthodes statistiques pouvant aider à la compréhension de deux phénomènes biologiques quantifiables au travers de données provenant d’examens médicaux. Le premier de ces deux phénomènes biologiques est la microcirculation dans le système de circulation sanguine générale, le deuxième est la sensibilité de souches de parasite, liés au paludisme, pour une molécule thérapeutique. L’objectif est d’extraire des informations, à partir des observations, pour aider les praticiens à interpréter de manière plus objective les données issues d’examens médicaux. Le dispositif médical qui existe aujourd’hui pour visualiser la microcirculation est composé d’un outil d’imagerie dynamique et d’une injection de produit de contraste. Les données recueillies sont des séries spacio-temporelles d’images volumiques. Pour un volume donné, et une unité de l’image, nous avons accès à des observations dépendant des temps de l’examen médical. Une telle série de nombre est couramment appelée rehaussements tissulaires. Le premier objectif de cette thèse fut de modéliser une série de rehaussements tissulaires à l’aide d’un modèle de convolution non paramétrique. Le produit de convolution dépend d’une constante inconnue, d’une fonction de survie inconnue et du rehaussement tissulaire observée dans l’artère afférente au voxel étudié. Nous avons modélisé le produit entre, la constante et la fonction de survie, à l’aide d’un mélange de lois Gamma à poids positifs. L’estimation des paramètres des lois Gamma ainsi que des poids positifs est réalisée à l’aide d’un algorithme itératif que nous avons développé qui visent à minimiser le critère des moindres carrés associé. Cet algorithme est basé sur un test de positivité et de négativité qui avait été développé par Yannick Baraud, Sylvie Huet et Béatrice Laurent. Un des moyens de surveiller la résistance des souches de parasite aux molécules thérapeutiques est d’étudier l’activité ex-vivo du parasite pour différentes concentrations de molécule. Pour un patient et une molécule thérapeutique donnée, l’activité du parasite est mesurée à l’aide de tests isotopiques, les observations associées à ses mesures sont généralement appelées effets et elles dépendent des concentrations de la molécule testée. La mesure de référence pour la surveillance est la concentration de molécule permettant d’inhiber 50% de l’activité du parasite. L’hypothèse généralement établie est qu’un patient est infecté par une souche détectable de parasite. Certains biologistes émettent l’hypothèse que des patients sont infectés par plus d’une souche de parasite. Nous avons modélisé les effets d’une molécule thérapeutique pour un échantillon de sang contenant deux souches de parasites de sensibilité différentes à l’aide d’un modèle de régression non-linéaire admettant quatre paramètres et mis en place un algorithme d’estimation des paramètres. Dans un deuxième temps nous nous sommes intéressés à établir un critère de sélection permettant d’établir, à partir des données observées, si un patient est infecté par une souche détectable de parasite ou deux souches de parasites ayant une sensibilité différente pour la molécule thérapeutique<br>Our work is a contribution to the development of statistical methods to assist in the understanding of two biological quantifiable phenomena through data from medical examinations. The first of these two biological phenomena is microcirculation in the general bloodstream system, the second is the sensitivity of parasite strains associated with malaria, for a therapeutic molecule. The goal is to collect information, extract from observations, to help physician to interpret more objectively/accurately the data collected from medical examinations. The medical device that exists today to display microcirculation is composed of a dynamic range imaging tool and injection of a contrast agent. The data collected are space-time series of volume images. For a given volume, and a unit of the image, we have access to observations dependant of medical examination times. Such a series of number is commonly known as « tissue enhancements ». The first objective of this thesis was to model a series of tissue enhancements using a non-parametric convolution model. The convolution product depends on an unknown constant, an unknown survival function and tissue enhancement observed in the artery afferent to the studied voxel. We have modeled the product between the constant and survival function, using a mixture of Gamma survival function with positive weight. The estimate of the parameters of Gamma and positive weight is performed using an iterative algorithm that we developed that aim to minimize the criterion of least squares associated. This algorithm is based on a non negativity test and non positivity that had been developed by Yannick Baraud, Sylvie Huet and Béatrice Laurent. One way to monitor the resistance of the parasite strains to the therapeutic molecules is to study the ex-vivo activity of the parasite for different concentrations of molecules. For a patient and a given therapeutic molecule, the activity of the parasite is measured using isotopic tests, observations related to these measures are generally reffered to as effects and are dependant of the concentrations of the tested molecule. The reference measurement for monitoring is the molecule concentration enabling to inhibit 50 % of the activity of the parasite. The assumption is generally established that a patient is infected with a detectable strain of parasite. Some biologists are making assumptions that patients are infected with more than one strain of parasite. We have modeled the effects of a therapeutic molecule in a sample of blood containing two different sensitivity of parasite strains using a nonlinear regression model assuming four parameters and set up a parameter estimation algorithm. In a second step we have been interested in developing a selection criteria for establishing, from observed data, if a patient is infected with a detectable strain of parasite or two parasite strains that have different sensitivity to the therapeutic molecule
APA, Harvard, Vancouver, ISO, and other styles
4

Flecher, Cédric. "Conception d’un générateur de temps : développements méthodologiques pour des distributions asymétriques multivariées, application à l’étude de la sensibilité des cultures à la variabilité du climat et à ses modifications." Montpellier SupAgro, 2009. http://www.theses.fr/2009NSAM0039.

Full text
Abstract:
Des chroniques climatiques journalières et locales sont nécessaires pour un grand nombre d'applications ; c'est en particulier le cas en agronomie à l'échelle de la parcelle. Les archives de mesures climatiques sont souvent de durée insuffisante pour l'ensemble des variables requises pour ces applications (précipitations, températures maximale et minimale, rayonnement, vent). Par conséquent il est intéressant de disposer d'un outil capable de simuler des chroniques semblables à celles d'origine : un générateur de temps. Le générateur proposé modélise les cinq variables climatiques par un mélange de distributions asymétriques multivariées : des distributions closed skew-normal sont ajustées conditionnellement à des états du temps. Une méthode d'ajustement reposant sur des moments pondérés a été conçue et appliquée à une paramétrisation simplifiée de ces distributions. Les chroniques climatiques simulées ont été utilisées comme entrée du modèle de culture STICS. Le couplage des deux modèles est apte à produire des variables agronomiques représentatives. Elles sont utilisées pour la définition d'indices permettant de prospecter et quantifier des dimensions de la sensibilité des cultures de céréales au climat. Une transformation des paramètres du générateur est présentée et intègre des modifications climatiques générées par des modèles de circulation globale à plus grande échelle. Le couplage avec le modèle de culture donne une image de la modification d'indices agronomiques dans ce contexte. Ils sont analysés en termes d'impacts sur la sensibilité. On montre, par exemple, que l'évolution des pratiques culturales permettrait de modifier les risques liés au déficit hydrique
APA, Harvard, Vancouver, ISO, and other styles
5

Kousignian, Isabelle. "Modélisation biostatistique de données longitudinales : applications à des marqueurs immunologiques de l'infection à VIH." Paris 6, 2003. http://www.theses.fr/2003PA066173.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Dusseault-Bélanger, Francis. "L'analyse en composantes principales comme outil biostatistique : une routine pour étudier une structure de biomarqueurs." Mémoire, Université de Sherbrooke, 2013. http://hdl.handle.net/11143/6581.

Full text
Abstract:
En statistiques, l'analyse en composantes principales (ACP) est une technique couramment utilisée afin de détecter la présence de processus gérant une base de données, c'est-à-dire des principaux axes de variation des données. Toutefois, on se contente trop souvent d'exécuter l'algorithme et d'interpréter directement les résultats sans analyses postérieures concernant la stabilité ou la généralisation des résultats. Pourtant, comme toute mesure statistique prélevée sur un échantillon, l'ACP peut présenter des résultats spécifiques à l'échantillon et difficilement rendre compte de la population étudiée. Il est donc important de développer des analyses complémentaires nous permettant d'évaluer la stabilité des résultats de l'ACP et de déterminer si, oui ou non, les résultats tirés de l'échantillon sont dignes de confiance. On construira et mettra cette nouvelle routine à l'épreuve en étudiant deux sujets distincts tant par leur nature que par leur complexité. On étudie en un premier temps le syndrome métabolique, syndrome considéré comme un facteur important dans le développement du diabète et des maladies cardiovasculaires. Ensuite, on étudie un phénomène beaucoup plus complexe et surtout moins bien défini que le syndrome métabolique, le processus physiologique du vieillissement.
APA, Harvard, Vancouver, ISO, and other styles
7

LE, CORFEC EMMANUELLE. "Modelisation de la progression des marqueurs biologiques de l'infection a vih : approches biostatistique et biomathematique." Paris 6, 1998. http://www.theses.fr/1998PA066205.

Full text
Abstract:
Les progres accomplis dans le domaine de la pathogenese de l'infection a vih sont tres lies aux avancees dans le domaine des techniques de mesure de marqueurs viraux et immunologiques. La possibilite de collecter ces mesures, en particulier nombre de lymphocytes t cd4+ et mesures d'arn vih-1 plasmatique, a suscite le developpement de methodes statistiques d'analyse de donnees longitudinales pour etudier la progression des marqueurs, et la mise au point de modeles mathematiques d'interaction entre le vih et le systeme immunitaire afin d'avancer dans la comprehension des mecanismes mis en jeu ou de quantifier la cinetique du virus. Notre travail s'inscrit dans cette double approche. La premiere partie est une approche statistique visant a quantifier l'impact de donnees manquantes dues a un suivi interrompu sur le resultat de l'analyse d'un essai, dans le cadre des essais cliniques vih ou le critere principal est une mesure resumee de la charge virale plasmatique. Nous avons montre que, du point de vue de la taille du test, les meilleures methodes d'analyse sont un modele a effets mixtes incluant un changement de pente apres 2 semaines de traitement, et dans une moindre mesure, l'aire sous la courbe en reportant la derniere mesure connue. La deuxieme partie est une approche biomathematique : nous avons developpe un modele stochastique de la primo-infection du vih, afin de predire la dynamique du virus aux stades precoces de l'infection, ou peu de donnees sont disponibles sur la progression des marqueurs. La variabilite liee aux mecanismes d'infection des lymphocytes t cd4+ est modelisee par un processus de diffusion. Le modele a permis de predire la distribution du temps entre l'infection et la detection possible du virus dans le plasma de patients infectes, par des techniques de quantification de l'arn vih-1 par amplification des acides nucleiques (naa). Une application est l'evaluation du benefice de l'utilisation potentielle de tests naa dans le cadre des dons de sang : en france, le benefice maximal attendu par rapport au test des anticorps serait inferieur a trois dons infectes par an. L'utilisation d'un modele stochastique est particulierement importante dans des situations ou le virus est en faible concentration, et devra etre envisagee egalement pour l'etude de la dynamique du virus sous traitement antiretroviral a long terme.
APA, Harvard, Vancouver, ISO, and other styles
8

Molinari, Nicolas. "Optimisation des noeuds en régression spline : application aux biostatistiques." Montpellier 1, 2000. http://www.theses.fr/2000MON1T018.

Full text
APA, Harvard, Vancouver, ISO, and other styles
9

De, Souza Barros Goncalves Celso André. "Appropriation et authenticité : une didactique des expériences d'apprentissage d'étudiants engages "jeu sérieux" en Epidémiologie et Biostatistique." Phd thesis, Université de Grenoble, 2013. http://tel.archives-ouvertes.fr/tel-00949137.

Full text
Abstract:
Cette thèse s'intéresse à la relation sujet-objet - l'expérience d'apprentissage vécu par des étudiants universitaires dans le cadre du jeu sérieux Laboratorium of Epidemiology (LOE). Elle porte essentiellement sur la modélisation de phénomènes d'apprentissage - Appropriation et Authenticité - et se veut multidisciplinaire en rassemblant Psychologie de l'Education, Didactique des Mathématiques et Environnements Informatiques pour l'Apprentissage Humain. Le terrain d'expérimentation de cette thèse se place dans le cadre d'un module de Biostatistique dans lequel le jeu sérieux LOE a été implémenté de manière écologique et pérenne. La problématique de recherche porte sur les phénomènes d'appropriation et d'authenticité qui sont formalisés et illustrés, en s'appuyant sur la Théorie des Situations Didactiques (TSD) de Brousseau. Des traces d'activité, des interactions verbales et des entretiens directs ont été analysés au cours de trois années d'utilisation du jeu LOE. Ce travail a permis la construction de concepts tels que " l'appropriation de rôle " par des étudiants dans le contexte d'un jeu sérieux, " l'appropriation de problèmes " par les étudiants que ce soit à travers leurs interactions individuelles avec l'objet (le jeu) ou dans la recherche collaborative de solution aux problèmes, et enfin " la perception de l'authenticité " du jeu. Ainsi, cette thèse montre comment appropriation et authenticité découlent de l'interaction individu-objet. L'appropriation est un élément de l'expérience d'apprentissage à partir duquel l'individu fait sien un objet d'apprentissage dans un processus actif de développement transformationnel dans lequel l'individu reconstruit l'objet qu'il s'approprie à sa manière. Dans le modèle proposé, le processus s'établit par des catégories non nécessairement consécutives : accepter, tester, faire des choix, anticiper et maîtriser. La perception de l'authenticité d'un jeu sérieux par un individu est favorisée par des attributs de l'environnement informatique en raison de l'impact qu'ils produisent chez l'individu. L'authenticité d'un environnement informatique est définie comme un compromis entre trois dimensions élémentaires : réalisme, cohérence interne et pertinence didactique. Une meilleure compréhension de ces phénomènes à la base du processus d'apprentissage contribuera aux études futures sur la qualité de l'enseignement et sur la conception de nouveaux outils, en particulier ceux basés sur le jeu de rôle et l'immersion.
APA, Harvard, Vancouver, ISO, and other styles
10

Harnet, Jean-Claude. "Etude céphalométrique des processus ptérygoïdes de l'homme adulte et de l'enfant." Strasbourg 1, 1994. http://www.theses.fr/1994STR1D008.

Full text
APA, Harvard, Vancouver, ISO, and other styles
11

Houédé, Nadine. "Recherche de stratégie biostatistique dans les essais cliniques de phase I/II d'association comprenant un agent non cytotoxique." Montpellier 1, 2008. http://www.theses.fr/2008MON1T007.

Full text
Abstract:
La détermination de la dose maximale tolérée est le premier objectif des phases I. Pour les agents cytotoxiques, de nombreuses stratégies ont été proposées, dont la méthode standard et des approches fondées sur la modélisation. Même si ces dernières ont montré de meilleures propriétés, elles restent encore peu utilisées en clinique. Pour déterminer la meilleure combinaison en association thérapeutique, la modélisation permet d'utiliser les connaissances acquises sur les profils de toxicité des médicaments en monothérapie, ainsi que les hypothèses émises sur leur synergie en combinaison. Actuellement, de nombreuses molécules sont développées en association, afin de potentialiser l'action d'un cytotoxique par une thérapie ciblée. Pour déterminer la combinaison optimale de doses pour ces associations, nous proposons une stratégie originale basée sur : trois variables d'évaluation, la toxicité associée à chacun des agents et l'efficacité ; des scores d'utilité pour chaque combinaison d'événements définis selon la méthode DELPHI (un outil permettant d'obtenir un consensus au sein d'un groupe d'experts) ; et une grille à deux dimensions de combinaison de doses possibles. Les relations dose-toxicité et dose-efficacité sont estimées par un modèle généralisé flexible d'Aranda-Ordaz. Une copula gaussienne est utilisée pour estimer la distribution jointe des trois variables d'évaluation. Un algorithme de décision permet d'escalader ou de désescalader sur l'ensemble de la grille, selon la valeur maximale estimée de la fonction d'utilité. Des simulations sous différents scénarii, à partir d'un exemple d'essai clinique, ont permis de valider cette stratégie.
APA, Harvard, Vancouver, ISO, and other styles
12

Allard, Catherine. "Le modèle linéaire à effets mixtes pour analyser des données génétiques provenant de familles." Mémoire, Université de Sherbrooke, 2015. http://hdl.handle.net/11143/6753.

Full text
Abstract:
Nous désirons savoir quelles sont les variations génétiques qui sont associées à une tension artérielle élevée. Pour ce faire, nous avons des données provenant de plusieurs familles, c’est-à-dire qu’il y a des personnes de la même famille qui se retrouvent dans cet échantillon. Dans cette base de données, il y a de l’information sur quelques caractéristiques démographique (âge, sexe, fumeur/non fumeur), il y a aussi la pression diastolique et systolique ainsi qu’un grand nombre de variations génétiques distribuées sur tout le génome. Pour pouvoir analyser des observations qui ne sont pas indépendantes, nous devons utiliser un modèle qui diffère un peu de la régression classique. En effet, nous ne pouvons pas utiliser la régression classique, car notre échantillon ne respecte pas toutes les hypothèses du modèle. Le modèle que nous allons utiliser prend en compte la covariance entre les individus de même famille. Nous allons donc présenter la théorie du modèle linéaire à effets mixtes simple ainsi que sa généralisation pour des données génétiques provenant de familles. Nous allons terminer par une application de ce modèle généralisé à notre base de données sur la tension artérielle pour déterminer quelles parties du génome (quelles variations génétiques) expliquent le mieux la tension artérielle de cet échantillon.
APA, Harvard, Vancouver, ISO, and other styles
13

BLOCH, LE BOITE JULIETTE. "Modelisation de mesures repetees de titres obtenues par la methode des dilutions : application au suivi des viremies vih (doctorat : sante publique, option biostatistique)." Paris 11, 1998. http://www.theses.fr/1998PA11T037.

Full text
APA, Harvard, Vancouver, ISO, and other styles
14

Cougoul, Arnaud. "Analyse statistique de réseaux d'associations entre espèces microbiennes à partir de données métagénomiques." Thesis, Université Clermont Auvergne‎ (2017-2020), 2019. http://www.theses.fr/2019CLFAC103.

Full text
Abstract:
Le séquençage haut débit révèle une nouvelle écologie des microorganismes. Ils sont présents partout et leurs fonctions sont primordiales pour leurs écosystèmes hôtes, organismes ou environnements. La métagénomique permet notamment d'estimer la composition et l'abondance des espèces microbiennes d'un ensemble d'échantillons de même type de communautés microbiennes. Lors d'études cherchant à comprendre la diversité et la structure de telles communautés, des approches réseaux permettent d'identifier des associations statistiques entre microbes, en faisant l'hypothèse que ces associations statistiques reflètent les interactions biologiques. Dans ce contexte, le sujet de ma thèse était de mieux cerner le potentiel des approches réseaux dans la détection d'associations entre OTUs au sein de données métagénomiques et de développer les outils nécessaires pour améliorer l'analyse des jeux de données. Dans un premier temps, j'ai étudié les pratiques et les outils d'analyse utilisables pour inférer des réseaux d'associations au sein de métagénomes. Compte-tenu des propriétés des données métagénomiques, j'ai déterminé leur efficacité et leurs limites. Ces travaux m'ont permis de déterminer des pistes pour améliorer l'étude des associations microbiennes. Sur la base des connaissances accumulées, j'ai développé un package d'analyse des associations entre OTUs (nommé MAGMA) visant à inférer les associations pertinentes au sein de métagénomes. MAGMA prend en compte les spécificités des données métagénomiques et offre la possibilité de prendre en compte l'effet d'un facteur structurant sur la distribution des OTUs avant de rechercher les associations entre microbes. Par le biais de participations dans différents projets de métagénomique, j'ai confirmé la pertinence de l'outil développé et identifié des pistes d'améliorations permettant de faire face aux problématiques biologiques actuelles<br>High throughput sequencing reveals a new ecology of microorganisms. They are everywhere and their functions are essential for their host ecosystems, organisms or environments. Metagenomics makes it possible to estimate the composition and abundance of microbial species from a set of samples of the same type of microbial communities. In the studies that seek to understand the diversity and structure of such communities, network approaches can identify statistical associations between microbes, assuming that these statistical associations reflect biological interactions. In this context, the subject of my thesis was to better understand the potential of network approaches in the detection of associations between OTUs within metagenomic data and to develop the necessary tools to improve the analysis of datasets. As a first step, I studied the practices and analysis tools that can be used to infer association networks within metagenomes. Given the properties of metagenomic data, I determined their effectiveness and their limits. This work allowed me to identify ways to improve the study of microbial associations. Based on the accumulated knowledge, I developed an association analysis package between OTUs (named MAGMA) to infer relevant associations within metagenomes. MAGMA takes into account the specificities of metagenomic data and offers the possibility to take into account the effect of a structuring factor on the distribution of OTUs before looking for associations between microbes. Through participations in different metagenomics projects, I confirmed the relevance of the tool developed and identified ways of improving the current biological issues
APA, Harvard, Vancouver, ISO, and other styles
15

Bhajun, Ricky. "Une approche réseau pour l’inférence du rôle des microARN dans la corégulation des processus biologiques." Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAS045/document.

Full text
Abstract:
L'interférence par l'ARN est un processus selon lequel un petit ARN non codant se lie à un ARN messager cible dans la cellule pour moduler son expression. Ce mécanisme a été conservé au cours de l'évolution : il est retrouvé aussi bien chez les animaux que chez les végétaux. Nous savons aujourd'hui que le rôle de l'interférence par l'ARN est fondamental, dans le développement embryonnaire comme dans la progression tumorale. Les microARN (miARN) sont des ARN non codant endogènes dont l'une des particularités est leur capacité à réguler tout un ensemble de gènes par interférence avec les ARN messagers. Il est ainsi prédit qu'un seul miARN serait capable de réguler plusieurs centaines de gènes différents. La thèse a consisté en l'analyse de la corégulation médiée par les miARN grâce à l'inférence de réseau basée sur le partage de gènes cibles. La corégulation est un phénomène où plusieurs miARN différents interviennent sur les mêmes familles de gènes et donc sur les mêmes processus biologiques. Le travail a plus spécifiquement consisté en la mise en place d'un réseau de miARN, en son analyse topologique mais également en son interprétation biologique. Le but final était de proposer de nouvelles hypothèses biologiques à tester afin de mieux comprendre la corégulation des processus biologiques par les miARN. Au travers de ces travaux, deux groupes de miARN ont pu être mis en évidence, dont l'un impliqué dans la régulation de la signalisation par les petites GTPases – hypothèse par la suite validée par plusieurs expériences in vitro. Dans un second temps, une communauté de miARN impliquée dans le maintien de la pluripotence des cellules souches a pu également être mise en évidence. Pour compléter ces analyses, une étude systémique de la topologie des réseaux de miARN a été menée afin de mieux comprendre leur intégration dans les réseaux biologiques et leur rôle dans le devenir cellulaire<br>RNA interference is a process in which a small non-coding RNA will bind to a specific messenger RNA and regulate its expression. This evolutionary conserved mechanism is found in all superior eukaryotes from plants to mammals. Nowadays, we know that RNA interference is a major regulatory process involved in developmental biology and tumor progression. MicroRNAs (miRNAs) are endogenous (coded in and produced by the cell) non-coding RNAs which are able to regulate a whole set of genes, typically hundreds of genes. This doctoral thesis consisted in the analysis of the miRNA mediated coregulation through a network approach based on target sharing. Coregulation is the process where many different miRNAs will regulate the same set of genes and thus the same biological process. In particular, the work consisted in the inference of a miRNA network, in its topological analysis and also its biological interpretation. Indeed, the final aim of the work was to generate new biological hypothesis. As such, two different groups of miRNAs were first retrieved. One of them was predicted to be involved in the small GTPase signaling and was further validated in vitro. Moreover, a miRNA community involved in the maintenance of stem cells pluripotency was also discovered. Finally, a systemic analysis of the target-based miRNAs network was conducted to better understand their integration with biologic networks and their role in cell fate
APA, Harvard, Vancouver, ISO, and other styles
16

Lorino, Tristan. "Modèles statistiques pour des données de survie corrélées." Phd thesis, Institut national agronomique paris-grignon - INA P-G, 2002. http://tel.archives-ouvertes.fr/tel-00003672.

Full text
Abstract:
Les méthodes et modèles statistiques destinés aux données de survie furent, dans leur grande majorité, développés sous l'hypothèse implicite d'indépendance statistique des observations individuelles. Bien que l'imposition d'une telle hypothèse soit raisonnable pour un grand nombre d'applications, il s'avère évident que dans bon nombre d'autres -- et non des moins courantes --, cette hypothèse est violée. Par exemple, en science vétérinaire, de telles données corrélées apparaissent lorsque les observations individuelles sont regroupées au sein d'élevages.<br />Nous étudions les deux principales classes de modèles pour données de survie corrélées : les modèles de fragilité (ou conditionnels) et les modèles marginaux. Nous nous proposons une large comparaison de ces deux approches, d'une part au travers d'une étude de données vétérinaires, d'autre part au moyen de simulations.<br />Notre objectif est d'évaluer la sensibilité de tels modèles vis-à-vis de la structure des jeux de données qu'ils sont appelés à traiter -- et plus particulièrement vis-à-vis de la taille des groupes.
APA, Harvard, Vancouver, ISO, and other styles
17

Plante, Mylène. "Identification de la mutation responsable de la mucolipidose de type II dans la région du Saguenay-Lac-St-Jean." Thèse, Université Laval, 2007. http://constellation.uqac.ca/428/1/25017312.pdf.

Full text
Abstract:
Afin d'identifier la mutation responsable de la mucolipidose de type II dans la région du Saguenay-Lac-St-Jean (Québec, Canada), un groupe de 27 porteurs obligatoires a été recruté. L'ADN de ces individus a été comparé à celui de 50 sujets provenant d'une autre population. Le gène de la N-acétylglucosamine-l-phosphotransférase (GNPTAB) a été ciblé comme candidat suite à la revue de la littérature. Ensuite, pour vérifier la provenance de la mutation et savoir si l'effet fondateur pouvait expliquer son incidence auprès de cette même population, l'étude généalogique de tous les sujets a été effectuée. Ainsi, les ascendances des individus porteurs obligatoires et d'une cohorte témoin ont été reconstituées. En conclusion, ce projet a permis d'identifier la mutation responsable de la MLII au SLSJ et les études généalogiques suggèrent que sa prévalence au SLSJ résulte d'un effet fondateur. Trois noyaux ancestraux originaires de la France sont plus susceptibles d'être à l'origine de cette mutation.
APA, Harvard, Vancouver, ISO, and other styles
18

Anno, Yannick-Noël. "Etablissement d'une architecture bioinformatique et biostatistique d'intégration et d'analyse des données génomiques, épigénétiques et phylogénétiques du génome humain : application aux sites de fixation du facteur de transcription hStaf/ZNF143." Strasbourg, 2010. https://publication-theses.unistra.fr/public/theses_doctorat/2010/ANNO_Yannick-Noel_2010.pdf.

Full text
Abstract:
Le facteur STAF est une protéine deux régions distinctes d’activation de la transcription, selon la machinerie de transcription mobilisée. Une étude récente faisant état d'un millier de sites potentiels au sein des promoteurs de gènes protéiques et dont 400 furent validés expérimentalement laisse supposer que le nombre de sites à l'échelle du génome soit encore plus nombreux, forçant à développer d'autres méthodes de caractérisation à même de questionner le génome entier et de forts volumes de données. Ce problème adresse un challenge d'envergure supérieure : faire émerger de la connaissance à partir d'une région génomique. Afin de savoir quelle connaissance est pertinente, il est indispensable d'évaluer en quoi celle-ci s'écarte des valeurs attendues du génome et donc de connaitre ces valeurs. Dans cette optique nous avons développé l'architecture GeCo, solution soutenue par une base de données automatisée et son portail web, et dont la puissance repose sur son aptitude à déterminer les valeurs statistiques des gènes et du génome complet. Caractérisé par un ensemble de descripteurs (séquence, épigénétique, phylogénétique), le contexte qui en émerge est utilisé pour replacer tout questionnement génomique dans son environnement global, de manière rapide et fiable. Au delà du contexte génomique, c'est une philosophie de développement basée sur de solides outils statistiques que nous avons développé. Son message est que produire des résultats ne suffit plus et qu'il est impératif de les remettre dans leur contexte. Cette architecture permit de mettre en évidence plusieurs milliers de sites de STAF et est d’ores et déjà connectée aux autres projets du laboratoire<br>STAF factor is a protein with two distinct regions for activation of transcription using two transcription machineries. A recent study reporting a thousand potential sites within the promoters of genes and proteins of which 400 were validated experimentally suggests that the number of sites across the genome may be even higher, forcing them to develop other characterization methods to question the whole genome and high volumes of data. This issue addresses a major challenge: the emergence of knowledge from a genomic region. To determine which knowledge is relevant, it is essential to assess how it deviates from the expected values of the genome and therefore to know these values. In this context we developed the architecture GeCo, a solution supported by a computerized database and its web portal, and whose power lies in its ability to determine the statistical values of genes and genome. Characterized by a set of descriptors (sequence, epigenetic, phylogenetic) the emerging context is used to quickly and reliably replace any genomic questioning inside its overall environment. Beyond the genomic context, it is a coding philosophy based on reliable statistical tools that we developed. Its message is that producing results is no longer sufficient and it is imperative to put in back in its context. This architecture allowed revealing thousands of STAF binding sites and is already connected to other projects in the laboratory
APA, Harvard, Vancouver, ISO, and other styles
19

Cenac-Millet, Ingrid. "Proposition d'outils statistiques pour améliorer, par la tomodensitométrie, les stratégies diagnostiques et thérapeutiques. Application aux douleurs abdominales aiguës : application aux douleurs abdominales aiguës." Thesis, Montpellier, 2015. http://www.theses.fr/2015MONTT012.

Full text
Abstract:
La douleur abdominale aiguë (DAA) est un problème de santé publique du fait de sa fréquence, du large éventail de pathologies causales et de son enjeu thérapeutique avec une nécessité d'opérer rapidement les patients à risque et de ne pas opérer la plupart des patients. Le retard ou l'insuffisance diagnostique d'une urgence abdominale, qu'elle soit non traumatique (en particulier en cas de strangulation, d'ischémie digestive ou de péritonite) ou traumatique, entrainera une augmentation de la morbi-mortalité. Il est donc primordial que la prise en charge diagnostique et thérapeutique repose sur de l'Evidence-Based Médecine, intégrant une expertise clinique avec les meilleurs examens para-cliniques dont les performances ont été validées par les recherches scientifiques. A ce jour, c'est la tomodensitométrie (TDM) qui s'est imposée comme l'examen complémentaire de référence en cas d'incertitude diagnostique, pour l'exploration d'une DAA. Or, les études publiées sur l'apport du scanner dans les DAA ont un certain nombre de limites : elles ne s'intéressent souvent qu'à une seule pathologie donnée et ne correspondent donc pas à la situation clinique de pathologies non identifiées, elles intègrent rarement des objectifs sur l'impact thérapeutique et présentent, pour la plupart, des faibles niveaux de preuve (niveau I ou II) sur l'échelle à 5 niveaux de la classification des études diagnostiques. Quel que soit le niveau de l'étude, des outils statistiques avancés peuvent être utilisés pour diminuer les biais d'interprétation, pour prendre en compte le degré d'incertitude diagnostique clinique, pour tenir compte de la faible prévalence de certaines pathologies urgentes et pour faciliter le transfert et la généralisation des résultats obtenus à la pratique clinique. L'objectif de cette thèse est donc de présenter des outils statistiques, en analysant les forces et limites des résultats obtenus, afin d'étayer les perspectives d'intégration dans une stratégie de prise en charge clinique. Certains de ces outils statistiques sont déjà connus et largement utilisés en imagerie, d'autres sont développés essentiellement dans les études thérapeutiques et enfin, certains sont totalement innovants.Ainsi, la première partie de cette thèse est consacrée à une mise au point sur la méthodologie de la recherche en imagerie, en exposant ses caractéristiques, ses faiblesses et ses perspectives d'évolution. La deuxième partie est constituée d'une production scientifique de 5 articles, 4 d'entre eux publiés, focalisée sur les urgences abdominales traumatiques et non traumatiques, illustrant à l'aide du développement des analyses statistiques, l'apport du scanner pour améliorer certaines stratégies diagnostiques et thérapeutiques. De cette façon, les méthodes de concordance diagnostique, de régression logistique multivariée, de construction de score diagnostique et de méta-analyse bivariée avec effets aléatoires sont explicitées. Nous avons dans le dernier article proposé une méthode d'analyse statistique innovante basée sur une notion de distance permettant d'intégrer l'incertitude diagnostique représentée par les multiples hypothèses diagnostiques face à une douleur abdominale. Cette approche permet ainsi de mesurer la valeur ajoutée de la TDM à la fois en termes d'exactitude diagnostique et de confiance diagnostique, en se rapprochant de la pratique clinique quotidienne. A l'avenir, ces outils statistiques pourraient être plus largement utilisés dans la recherche diagnostique afin d'améliorer la pertinence scientifique et l'impact clinique, à l'origine d'une meilleure prise en charge des patients, et d'une meilleure utilisation des ressources économiques<br>Acute abdominal pain (AAP) is a public health problem, given its frequency, the numerous specific causes and the therapeutic impact, with patients at risk requiring urgent surgical care while most patients do not require surgery. Delayed diagnosis or misdiagnosis of an abdominal emergency, whether of non traumatic (such as bowel strangulation, or bowel ischemia, or peritonitis) or traumatic origin, will lead to increased morbidity and mortality. It is thus crucial that diagnostic and therapeutic management relies on Evidence-based Medicine, integrating clinical expertise and paraclinical tests that have been validated through scientific research. To date, computed tomography (CT) has become the reference examination to investigate AAP when diagnosis is uncertain. However, published studies evaluating the value of CT in AAP, have some limits: they often focus on a specific disease, and consequently do not meet the unsorted pathologies encountered in clinical practice, they sparsely include objectives on therapeutic impact, and most show low levels of evidence (level I or II) on the five level diagnostic studies scale. Whatever the study's level, advanced statistical methods can be used to reduce interpretation bias, take into account the clinical diagnostic uncertainty or the low prevalence of some urgent diseases, and to facilitate the transfer and generalisation of results into daily clinical practice.The aim of this work is to present statistical tools, by analysing the results' strengths and limits, in order to illustrate the perspective of integration within a clinical management strategy. Some of these statistical tools are known and largely used in imaging studies, others are essentially developed in therapeutic studies, and some are completely innovative.Thus, the first part of this thesis reports on a review of the methodological aspect of research in the field of medical imaging, showing its characteristics, its weaknesses and its development perspective.The second part is composed of 5 scientific articles - with 4 already published - and focus on traumatic and non traumatic abdominal emergencies, illustrating the value of CT in improving some diagnostic and therapeutic strategies, while detailing the statistical analyses. Hence, statistical methods for diagnostic agreement, multivariate logistic regression, diagnostic scoring-system building and bivariate random-effects meta-analysis are developed. In the last article, we propose a new statistical analysis method, based on a distance concept, allowing integrating the diagnostic uncertainty resulting from multiple diagnosis hypotheses in front of an AAP. This approach allows for investigating the added value of CT both in terms of diagnostic accuracy and diagnostic confidence, while getting close to daily clinical practice.In the future, these statistical tools could be implemented into diagnostic research in order to improve the scientific relevance and clinical impact, allowing for better patients' management, and better economic resource usage
APA, Harvard, Vancouver, ISO, and other styles
20

Abuelqumsan, Mustafa. "Assessment of supervised classification methods for the analysis of RNA-seq data." Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0582/document.

Full text
Abstract:
Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du niveau d’expression des gènes selon les organes et circonstances, sous-tendent la différentiation cellulaire et la réponse aux changements d’environnement. Comme les maladies affectent souvent l’expression génique, les profils transcriptomiques peuvent servir des fins médicales (diagnostic, pronostic). Différentes méthodes d’apprentissage artificiel ont été proposées pour classer des individus sur base de données multidimensionnelles (par exemple, niveau d’expression de tous les gènes dans des d’échantillons). Pendant ma thèse, j’ai évalué des méthodes de « machine learning » afin d’optimiser la précision de la classification d’échantillons sur base de profils transcriptomiques de type RNA-seq<br>Since a decade, “Next Generation Sequencing” (NGS) technologies enabled to characterize genomic sequences at an unprecedented pace. Many studies focused of human genetic diversity and on transcriptome (the part of genome transcribed into ribonucleic acid). Indeed, different tissues of our body express different genes at different moments, enabling cell differentiation and functional response to environmental changes. Since many diseases affect gene expression, transcriptome profiles can be used for medical purposes (diagnostic and prognostic). A wide variety of advanced statistical and machine learning methods have been proposed to address the general problem of classifying individuals according to multiple variables (e.g. transcription level of thousands of genes in hundreds of samples). During my thesis, I led a comparative assessment of machine learning methods and their parameters, to optimize the accuracy of sample classification based on RNA-seq transcriptome profiles
APA, Harvard, Vancouver, ISO, and other styles
21

Wang, Xiaoqing. "Improving the anaerobic digestion process through omics approaches : inhibition mechanisms and mitigation strategies." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASB006.

Full text
Abstract:
L'augmentation du volume mondial des déchets organiques produits constitue à la fois un défi environnemental et une opportunité pour la production d'énergie renouvelable. La digestion anaérobie (DA) est une méthode efficace de gestion des déchets organiques qui réduit efficacement leur volume tout en les convertissant en énergie propre sous forme de biogaz. Cependant, l'une des difficultés opérationnelles de la DA réside dans le maintien de la stabilité du procédé, en raison de la vulnérabilité des communautés microbiennes impliquées, qui se montrent très sensibles aux variations des paramètres opérationnels. Il est donc impératif de comprendre les facteurs contribuant à l'instabilité du processus, tout en proposant des stratégies pour renforcer cette stabilité, en mettant l'accent sur la compréhension de la réponse des communautés microbiennes. Le développement des techniques omiques à haut débit, en particulier la métabolomique, a grandement facilité l'étude des processus métaboliques microbiens, offrant de nouvelles opportunités pour une compréhension approfondie du fonctionnement des communautés microbiennes de la DA. Cette thèse est centrée sur la stabilité de la DA, explorant les effets de divers inhibiteurs et l'impact bénéfique de différents matériaux support à l'aide d'approches omiques couplées à la biostatistique. Dans une première partie du travail, l'applicabilité de la métabolomique pour étudier la DA a été démontrée en explorant les effets de différents sels d'ammonium sur la DA. Le cadre analytique développé pour l'analyse des données métabolomiques, qui prend en compte l'évolution temporelle, a révélé des variations subtiles dans la dynamique des métabolites influencées par les anions des sels d'ammonium. Une deuxième partie du travail a examiné la généralité de l'impact bénéfique de la zéolite pour réduire l'inhibition de la DA. La zéolite a efficacement atténué l'inhibition causée par l'érythromycine et le chlorure de sodium tout en améliorant les performances de la DA dans des conditions non inhibées. L'analyse microbiologique par métabarcoding 16S couplée à l'analyse en composantes communes a révélé que la zéolite favorisait des populations de bactéries et d'archées spécifiques, indépendamment de la présence ou du type d'inhibiteur. Les populations microbiennes étroitement associées à l'effet de la zéolite ont été identifiées. La dernière partie du travail a exploré les effets de différents matériaux support, notamment le charbon actif, la magnétite, la mousse de nickel et la zéolite, sur l'atténuation de l'inhibition par le chlorure de sodium, un inhibiteur courant à l'échelle industrielle. Les digesteurs supplémentés en matériaux support ont présenté une accumulation moindre en acides gras volatils après l'inhibition et un rendement de méthane plus élevé, la mousse de nickel et la magnétite montrant l'effet le plus important. L'analyse en composantes communes a révélé des différences dans la dynamique microbiologique et métabolique entre plusieurs matériaux support, identifiant des groupes microbiens caractéristiques et des métabolites corrélés spécifiquement à chaque matériau<br>The escalating global volume of organic waste presents both an environmental challenge and an opportunity for renewable energy generation. Anaerobic digestion (AD) serves as an efficient waste management method that not only effectively reduces organic waste volume but also converts it into clean energy in the form of biogas. Nevertheless, AD encounters challenges in maintaining process stability due to the vulnerability of the involved anaerobic microbial communities, which are highly sensitive to changes in operational parameters and digestive conditions. Consequently, it is imperative to understand the factors contributing to instability and propose strategies to enhance process stability, with a primary focus on understanding the response of microbial communities in this context. The development of high-throughput omics techniques, particularly metabolomics, has greatly facilitated the investigation of microbial metabolic processes, offering new opportunities to comprehensively understand the AD microbiota. This thesis is centered on the stability of AD, delving into understanding the inhibitory effects of various inhibitors and the mitigating role of different support materials using omics approaches coupled with biostatistics. In the first study, the applicability of metabolomics in AD was demonstrated by exploring the impacts of different anions originating from ammonium salts. The analytical framework developed for metabolomics data analysis, which took time evolution into account, revealed subtle variations in metabolite dynamics influenced by anions. The second study proposed the generic and beneficial impact of zeolite on AD. Zeolite effectively alleviated inhibition caused by erythromycin and sodium chloride while also enhancing AD performance under non-inhibited conditions. Microbial analysis and common components analysis uncovered that zeolite promoted specific bacterial and archaeal populations, regardless of the presence or type of inhibitor. Microbial populations closely associated with the zeolite effect were identified. The final study explored the effects of various support materials, including activated carbon, magnetite, nickel foam, and zeolite, on mitigating sodium chloride inhibition, which is a common issue in industrial AD. The digesters added with support materials exhibited lower VFAs accumulation and higher methane production ratio, with nickel foam and magnetite demonstrating a superior effect. Common components analysis disclosed differences in microbial and metabolite dynamics between several support materials, identifying characteristic microbial groups and metabolites correlated to each specific material
APA, Harvard, Vancouver, ISO, and other styles
22

Canouil, Mickaël. "Développement et application de méthodologies statistiques pour études multi-omiques dans le diabète de type 2 : au-delà de l'ère des études d'association pangénomiques." Thesis, Lille 2, 2017. http://www.theses.fr/2017LIL2S017/document.

Full text
Abstract:
Les études d'association pangénomiques (GWAS) ont permis l'identification de plusieurs dizaines de gènes et de polymorphismes nucléotidiques (SNPs) contribuant au risque de diabète de type 2.Plus généralement, les GWAS ont permis d'identifier des milliers de SNPs contribuant à des maladies complexes chez l'Homme.Cependant, la caractérisation fonctionnelle et les mécanismes biologiques impliquant ces SNPs et ces gènes restent en grande partie à explorer.En effet, les conséquences de ces polymorphismes sont complexes et peu connues. Une conséquence directe est l'altération de la protéine codée par un gène, voire une extinction complète de la transcription du gène (p.ex. via l’introduction d’un codon stop dans la séquence).Par ailleurs, ces polymorphismes peuvent avoir un rôle de régulation dans l'expression des gènes, par exemple, en perturbant la liaison de facteurs de transcription et d'enzymes impliqués dans la méthylation de l'ADN.Malgré des associations fortes des SNPS identifiés, ils ne peuvent expliquer la totalité de l'héritabilité du diabète de type 2, suggérant par le fait même des mécanismes d'interactions entre les différentes couches que représentent la génomique, la transcriptomique et l'épigénomique.Le changement de paradigme en statistique génétique et la disponibilité de données transcriptomiques et épigénomiques sont responsables de l'évolution du domaine, passant des analyses d'associations à des analyses transversales de type multi-omique, et permettant de fournir des éléments de réponse sur l’aspect fonctionnel des SNPs ou des gènes impliqués, et dans certains cas, permettant d'évaluer le lien causal de ces variants sur la pathologie.Les développements et applications méthodologiques proposés dans cette thèse sont variés, allant d’une approche similaire aux GWAS, mettant à profit les données longitudinales disponibles dans certaines cohortes (p.ex. D.E.S.I.R.), au moyen d'un modèle joint; de la caractérisation fonctionnelle de gènes candidats, identifiés par GWAS, dans la sécrétion d'insuline par une étude transcriptomique multi tissu et dans un modèle cellulaire; de l'identification d'un nouveau gène candidat (PDGFA) impliqué dans la dérégulation de la voie de l'insuline dans le diabète de type 2 via des mécanismes épigénétiques et transcriptomiques; et enfin de la caractérisation de l'effet sur le transcriptome de deux substituts du bisphénol A dans un modèle d’adipocyte primaire.L'augmentation des connaissances des processus biologiques dans lesquels sont impliqués les SNPs et gènes identifiés par GWAS pourrait permettre l'élaboration de stratégies diagnostiques plus efficaces, ainsi que l'identification de cibles thérapeutiques pour le traitement du diabète de type 2 et des complications associées (p.ex. insulinorésistance, NAFLD, cancer, etc.). Plus généralement, ces études multi-omiques ouvrent la voie à l'approche émergente que représente la médecine de précision, permettant le traitement et la prévention des pathologies tout en prenant en compte ce qui fait la spécificité d'un individu, à savoir son génome et son environnement, tous deux interagissant sur son transcriptome et son épigénome<br>Genome-wide association studies (GWAS) have resulted in the identification of several dozen of genes and single nucleotide polymorphisms (SNPs) contributing to type 2 diabetes.More generally, GWAS have identified thousands of SNPs contributing to complex diseases in humans.However, the functional characterization and biological mechanisms involving these SNPs and genes remain largely to be explored. Indeed, the consequences of these polymorphisms are complex and little known.One direct consequence of the SNPs is the alteration of the protein encoded by a gene, or even a complete transcriptional gene silencing (e.g. codon stop in the sequence). Furthermore, these polymorphisms may have a regulatory role in gene expression, for example, by interfering with the binding of transcription factors and enzymes involved in DNA methylation.Despite the strong associations of identified SNPs, they cannot explain the full heritability of type 2 diabetes, suggesting interactions mechanisms between the different layers of -omics, such as genomics, transcriptomics and Epigenomics.The shift of paradigm in statistical genetics and the availability of transcriptomic and epigenomic data are responsible for the evolution of the discipline, moving from association studies to multi-omics, and providing insights on the functional aspect of the SNPs or genes involved, and in some cases allowing to evaluate the causal link of these variants on the pathology.The methodological developments and their applications proposed in this thesis are various, ranging from a similar approach to GWAS, leveraging the longitudinal data available in some cohorts (e.g. D.E.S.I.R.), using an joint model approach; the functional characterisation of candidate genes in insulin secretion by a multi tissue transcriptomic study and transcriptomic study in a cell model; the identification of a new candidate gene (PDGFA) involved in the deregulation of the insulin\\\'s pathway in type 2 diabetes through epigenetic and transcriptomic mechanisms; and finally, the characterisation of the effect on the transcriptome of two substitutes of bisphenol A in a primary adipocyte model.The increase of knowledge in biological processes involving SNPs and genes identified by GWAS could enable the development of more effective diagnostic strategies, and the identification of therapeutic targets for the treatment of type 2 diabetes and associated complications (e.g., insulin resistance, NAFLD, cancer, etc.).More generally, these multi-omics studies pave the way for the emerging approach of precision medicine, allowing the treatment and prevention of pathologies while taking into account what makes the specificity of an individual, namely his genome and his environment, both interacting on his transcriptome and his epigenome
APA, Harvard, Vancouver, ISO, and other styles
23

Bascoul, Mollevi Caroline. "Développement d'outils biostatistiques pour l'analyse de biopuces en cancérologie." Montpellier 1, 2006. http://www.theses.fr/2006MON1T013.

Full text
Abstract:
Les biopuces représentent une des technologies émergeant en génomique depuis ces dix dernières années promettant de nouvelles avancées dans le diagnostic moléculaire et la recherche biomédicale en général. L'analyse de données issues des biopuces pose encore de nombreux problèmes et le développement de nouvelles méthodes statistiques robustes est nécessaire. L'orientation essentielle de cette thèse est de proposer une procédure d'analyse utilisant les méthodes liées à l'évaluation diagnostique pour déterminer les gènes impliqués dans les mécanismes à étudier. Des indices tels que l'aire totale ou partielle sous la courbe ROC permettront d'identifier des gènes capables soit de discriminer globalement les deux populations, soit de détecter plus spécifiquement l'une d'entre elles. Dans un premier temps, une étude précise des différents indices liés aux courbes ROC ainsi que des procédures d'estimation des variances a été réalisée. Ensuite, nous avons développé un nouvel estimateur de l'aire partielle basé sur la méthode non-paramétrique du noyau. Une étude de simulation a montré la supériorité de celui-ci sur l'estimateur empirique classique quand les distributions des résultats des tests sont issues de distributions mélangées. Enfin, l'application et l'utilisation de la méthodologie développée ont été mises en oeuvre sur les données du programme REG/P, dont l'objectif principal était d'identifier des gènes marqueurs ou effecteurs de la chimiorésistance dans les cancers colorectaux. Une signature prédictive de la réponse au schéma Folfiri a pu être déterminée et une étude de validation sur une cohorte de patients indépendants est actuellement initiée.
APA, Harvard, Vancouver, ISO, and other styles
24

Le, Priol Christophe. "Variance de l'expression des microARN et des ARN messagers dans le cancer." Thesis, Université Grenoble Alpes (ComUE), 2019. http://www.theses.fr/2019GREAS023.

Full text
Abstract:
La majorité des études sur l’expression des gènes cherchent à identifier des gènes présentant des différences de moyenne d’expression entre plusieurs populations d’échantillons. Dans ce cadre, la variance est considérée comme un paramètre à contrôler. Cependant, à l’instar d’une différence de moyenne, une différence de variance d’expression de gènes entre populations d’échantillons peut avoir un sens biologique et physiologique.Les microARN (miARN) sont d’importants régulateurs de l’expression des gènes. Le nombre important de leurs cibles et leur mode d’action confèrent aux miARN un rôle tampon. L’objectif de ma thèse est d’étudier la variance d’expression des miARN et des ARN messagers (ARNm), en particulier ceux ciblés par des miARN, durant la cancérogénèse. Nous espérons que cette approche permettra d’identifier des gènes qui ne peuvent pas être détectés par l’analyse classique de différence de moyenne d’expression et qui pourraient servir de biomarqueurs potentiels ou de cibles thérapeutiques. En outre, en combinant l’expression de miARN et d’ARNm et en analysant leur variance à une échelle systémique, nous espérons pouvoir mieux caractériser le rôle tampon des miARN.Plusieur méthodes incluant des tests statistiques d’égalité de variance et des modèles basés sur la distribution binomiale négative ont été évaluées. Les performances de ces méthodes ont été étudiées en détails à l’aide de jeux de données simulées. Par la suite, elles ont été appliquées aux jeux de données The Cancer Genome Atlas dans le but d’identifier des gènes ayant une différence de variance d’expression entre échantillons sains et tumoraux. De nombreux miARN et ARNm présentant une augmentation de leur variance d’expression dans les tumeurs ont été détectés. Pour la plupart des cancers, certaines fonctions biologiques importantes telles que le catabolisme ou l’autophagie sont sur-représentées parmi ces ARNm. Ainsi, analyser des gènes différentiellement variants semble être une approche pertinente pour avoir une meilleure compréhension de la progression tumorale et devrait être prise en compte dans le cadre de la recherche de nouveaux biomarqueurs et cibles thérapeutiques potentiels<br>The majority of gene expression studies focus on looking for genes whose mean expression is different when comparing two or more populations of samples. In this context, the variance is treated as a parameter to be controlled. However, similarly to a difference of mean, a difference of variance in gene expression between sample populations may also be biologically and physiologically relevant.MicroRNAs (miRNAs) are key gene expression regulators. The large number of their targets and the fine tuning of their regulation confer to miRNAs a buffering role. The objective of my thesis is to study the variance in expression of miRNAs and messenger RNAs (ARNm), especially those targeted by miRNAs, in particular during cancerogenesis. We hope that this approach can identify genes which cannot be identified by the tradional differential expression analysis and yet serve as potential biomarkers or therapeutic targets. Furthermore, by combining both miRNA and mRNA expression and analyzing their variance at a system level, we aim at better characterize the buffering role of miRNAs.Several methods including statistical tests of equality of variance and models based on the negative binomial distribution were evaluated. The performances of these methods were thoroughly tested on simulated datasets. Then, they were applied to The Cancer Genome Atlas datasets in order to identify genes with a differential expression variance when comparing normal and tumor samples. Many miRNAs and mRNAs with an increase of expression variance in tumors were detected. Interestingly, among these mRNAs, some key biological functions such as catabolism or autophagy are over-represented in most cancers. Thus, analyzing genes having a differential expression variance is relevant to gain knowledge in tumor progression and opens a new space for the discovery of new potential biomarkers and therapeutic avenues
APA, Harvard, Vancouver, ISO, and other styles
25

Jarne, Munoz Ana. "Modeling the effect of exogenous Interleukin 7 in HIV patients under antiretroviral therapy with low immune reconstitution." Thesis, Bordeaux, 2015. http://www.theses.fr/2015BORD0410/document.

Full text
Abstract:
Des progrès majeurs dans l'espérance et la qualité de vie ont étéenregistrés dans la lutte contre le VIH et le SIDA avec l'introduction des traitementsantirétroviraux combinés. De nos jours, cette thérapie réduit nettementla charge virale après quelques semaines de traitement chez la plupart des patients.Ceci conduit généralement à une reconstitution satisfaisante du nombrede cellules CD4+, mais ce n'est pas toujours le cas. Cette thèse est focaliséesur les patients ayant une réponse immunitaire insuffisante malgré une chargevirale indétectable, après au moins 6 mois de thérapie antirétrovirale combinée.A ce moment, l'Interleukine 7 (une cytokine secrétée par la moelle épinièreet le thymus) est une thérapie prometteuse pour restaurer le système immunitairedans une telle situation. Pendant ce travail de thèse, nous avons contribuéà l'analyse des études INSPIRE 2 &amp; 3, ou 107 patients présentant une faibleréponse immunitaire ont reçu des cycles (3 injections) répétés de r-hIL-7 (Inter-leukine 7 recombinée humaine).Nous avons utilisé des modèles dynamiques basés sur des systèmes d'équationsdifférentielles pour analyser l'effet de la r-hIL-7 exogène sur les cellules CD4+lors des trois études INSPIRE. Un modèle mathématique, avec un modèle àeffets mixtes appliqué sur les paramètres biologiques et un \modèle pour les observations"forment la structure de notre travail. Une estimation par maximumde vraisemblance basée sur une méthode de type Newton est combinée avec uneestimation du maximum a posteriori dans un contexte semi-Bayésien<br>Fight against HIV and AIDS has shown major improvements inlife expectancy and quality of life of HIV-infected people since the introductionof the cART. Today, viral load dramatically decreases a few weeks after startingantiretroviral therapy, and it becomes undetectable after 6 months for most ofpatients. This usually leads to an adequate reconstitution of CD4+T cells pool,but this is not necessarily always true. This thesis is focalised on these \lowimmunological responder" patients, who have not reached acceptable levels ofCD4+ T cells count despite undetectable viral load 6 months after having startedthe cART therapy.Today, Interleukin 7 (a cytokine naturally secreted in the bone marrow andthe thymus) is considered as one of the rare potential solution to boost the immunesystem in this situation. During this thesis work, we have collaborated toanalyze data from the INSPIRE 2 &amp; 3 trials, where repeated cycles (3 subcutaneousinjections) of recombinant human Interleukin 7 have been administeredto a total of 107 of these \low responder patients".We have used dynamical models based on systems of ordinary differentialequations to study the ffect of the exogenous Interleukin 7 on CD4+ T cellsthrough the three INSPIRE studies. A mathematical model together with amixed effects model applied on the biological parameters of the ODE systemand a \model for the observations" make up the structure of our work. Amaximum likelihood approach based on an adaptation of a Newton-like methodis combined with a maximum a posteriori estimation in a semi-Bayesian context
APA, Harvard, Vancouver, ISO, and other styles
26

Fève, Frédérique. "Economie et statistique du don de cellules souches hématopoïétiques : contributions à la gestion des registres de donneurs volontaires." Toulouse 3, 2006. http://www.theses.fr/2006TOU30148.

Full text
APA, Harvard, Vancouver, ISO, and other styles
27

Morvan, Marie. "Modèles de régression pour données fonctionnelles hétérogènes : application à la modélisation de données de spectrométrie dans le moyen infrarouge." Thesis, Rennes 1, 2019. http://www.theses.fr/2019REN1S097.

Full text
Abstract:
Dans de nombreux domaines d’application, les données récoltées correspondent à des courbes. Ce travail se concentre sur l’analyse de courbes de spectrométrie, constituées de plusieurs centaines de variables ordonnées, correspondant chacune à une valeur d’absorbance associée aux nombres d’ondes mesurés. Dans ce contexte, une méthode de traitement statistique automatique est développée, avec pour objectif la construction d’un modèle de prédiction prenant en compte l’hétérogénéité des données observées. Plus particulièrement, un modèle de diagnostic d’une maladie métabolique est établi à partir de courbes mesurées sur des individus provenant d’une population constituée de profils de patients différents. La procédure développée permet de sélectionner l’information pertinente sous forme de portions de courbes discriminantes, puis de construire de façon simultanée une partition des données et un modèle de prédiction parcimonieux grâce à un mélange de régressions pénalisées adapté aux données fonctionnelles. Ces données étant complexes, tout comme le cas d’application étudié, une méthode permettant une meilleure compréhension et une meilleure visualisation des interactions entre les portions de courbes a par ailleurs été développée. Cette méthode se base sur l’étude de la structure des matrices de covariance, avec pour but de faire ressortir des blocs de dépendances entre intervalles de variables. Un cas d’application médicale est utilisé pour présenter la méthode et les résultats, et permet l’utilisation d’outils de visualisation spécifiques<br>In many application fields, data corresponds to curves. This work focuses on the analysis of spectrometric curves, composed of hundreds of ordered variables that corresponds to the absorbance values measured for each wavenumber. In this context, an automatic statistical procedure is developped, that aims at building a prediction model taking into account the heterogeneity of the observed data. More precisely, a diagnosis tool is built in order to predict a metabolic disease from spectrometric curves measured on a population composed of patients with differents profile. The procedure allows to select portions of curves relevant for the prediction and to build a partition of the data and a sparse predictive model simultaneously, using a mixture of penalized regressions suitable for functional data. In order to study the complexity of the data and of the application case, a method to better understand and display the interactions between variables is built. This method is based on the study of the covariance matrix structure, and aims to highlight the dependencies between blocks of variables. A medical example is used to present the method and results, and allows the use of specific visualization tools
APA, Harvard, Vancouver, ISO, and other styles
28

Chafai, Djalil. "Contributions à l'étude de modèles biologiques, d'inégalités fonctionnelles, et de matrices aléatoires." Habilitation à diriger des recherches, Université Paul Sabatier - Toulouse III, 2008. http://tel.archives-ouvertes.fr/tel-00346998.

Full text
Abstract:
Les travaux présentés concernent trois thématiques autonomes :<br /><br />(1) Modèles biologiques et statistique : modèles compartimentaux, pharmacocinétique et pharmacodynamie de population, estimateurs pour problèmes inverses stochastiques, modèles non-linéaires à effets mixtes, modèles de mélanges, algorithmes de type EM et ICF, modèles graphiques de covariance, modélisation en cancérologie, processus ponctuels, particules, files d'attentes, renormalisation de processus markoviens inhomogènes et formules de Feynman-Kac<br /><br />(2) Inégalités fonctionnelles : inégalités de type Sobolev, concentration de la mesure, isopérimétrie rôle de la convexité dans les inégalités entropiques, tensorisation, noyau de la chaleur, groupe d'Heisenberg et dynamiques hypoelliptiques, files d'attentes, mélanges de lois<br /> <br />(3) Matrices aléatoires : spectre des matrices markoviennes aléatoires, graphes à poids aléatoires, théorèmes de type Wigner, Marchenko-Pastur, et Girko-Bai, convergence des valeurs propres extrémales, déformations de rang un.<br /><br />Le concept le plus récurrent ici est celui de dynamique markovienne. Dans la première partie, ce sont les modèles à compartiments de la pharmacologie qui sont liés à de telles dynamiques. La seconde partie traite d'inégalités fonctionnelles associées à la vitesse et à la géométrie de dynamiques markoviennes. Enfin, la troisième partie traite de dynamiques markoviennes aléatoires. Ces trois parties ne se réduisent pas à l'étude de facettes de problèmes markoviens. Leur contenu balaye un spectre à la fois théorique et appliqué, et met en oeuvre des techniques et des concepts variés issus de l'analyse, des probabilités, et de la statistique.
APA, Harvard, Vancouver, ISO, and other styles
29

Sallah, Kankoe. "Diffusion spatio-temporelle des épidémies : approche comparée des modélisations mathématiques et biostatistiques, cibles d'intervention et mobilité humaine." Thesis, Aix-Marseille, 2017. http://www.theses.fr/2017AIXM0607.

Full text
Abstract:
Dans la première partie de cette thèse, nous avons mis en place un métamodèle de transmission du paludisme basé sur la modélisation compartimentale susceptible-infecté-résistant (SIR) et prenant en compte les flux de mobilité humaine entre différents villages du Centre Sénégal. Les stratégies d’intervention géographiquement ciblées, s’étaient avérées efficaces pour réduire l’incidence du paludisme aussi bien dans les zones d’intervention qu’à l’extérieur de ces zones. Cependant, des actions combinées ciblant à la fois le vecteur et l’hôte, coordonnées à large échelle sont nécessaires dans les régions et pays visant l’élimination du paludisme à court/moyen terme.Dans la deuxième partie nous avons évalué différentes méthodes d’estimation de la mobilité humaine en l’absence de données individuelles. Ces méthodes incluaient la traçabilité spatio-temporelle des téléphones mobiles ainsi que les modèles mathématiques de gravité et de radiation. Le transport de l’agent pathogène dans l’espace géographique, par la mobilité d’un sujet infecté est un déterminant majeur de la vitesse de propagation d’une épidémie. Nous avons introduit le modèle d’impédance qui minimise l’erreur quadratique moyen sur les estimations de mobilité, en particulier dans les contextes où les ensembles de population sont caractérisés par leurs tailles hétérogènes.Nous avons enfin élargi le cadre des hypothèses sous-jacentes à la calibration des modèles de gravité de la mobilité humaine. L’hypothèse d’une distribution avec excès de zéros a fourni un meilleur ajustement et une meilleure prédictibilité, comparée aux hypothèses classiques n’assumant pas un excès de zéros : Poisson, Quasipoisson<br>In the first part of this thesis, we have developed a malaria transmission metamodel based on the susceptible-infected-resistant compartmental modeling framework (SIR) and taking into consideration human mobility flows between different villages in the Center of Senegal. Geographically targeted intervention strategies had been shown to be effective in reducing the incidence of malaria both within and outside of intervention areas. However, combined interventions targeting both vector and host, coordinated on a large scale are needed in regions and countries aiming to achieve malaria elimination in the short/medium term.In the second part we have evaluated different methods of estimating human mobility in the absence of real data. These methods included spatio-temporal traceability of mobile phones, mathematical models of gravity and radiation. The transport of the pathogen through the geographical space via the mobility of an infected subject is a major determinant of the spread of an epidemic. We introduced the impedance model that minimized the mean square error on mobility estimates, especially in contexts where population sets are characterized by their heterogeneous sizes.Finally, we have expanded the framework of assumptions underlying the calibration of the gravity models of human mobility. The hypothesis of a zero inflated distribution provided a better fit and a better predictability, compared to the classical approach not assuming an excess of zeros: Poisson, Quasipoisson
APA, Harvard, Vancouver, ISO, and other styles
30

Bayat, Makoei Sahar. "Étude de l’accès à la transplantation rénale en Lorraine par méthodes biostatistiques conventionnelles et par fouille de données." Thesis, Nancy 1, 2008. http://www.theses.fr/2008NAN10049/document.

Full text
Abstract:
La transplantation est considérée comme la technique de suppléance de la fonction rénale la plus performante et la plus efficiente. Nous avons étudié l’accès à la transplantation rénale au sein du réseau NEPHROLOR en Lorraine. La totalité des insuffisants rénaux chroniques terminaux bénéficiant d’un traitement de suppléance entre le 1/07/1997 et le 30/06/2003 et résidant en Lorraine (1725 patients) ont été inclus. Notre étude a mis en évidence la prédominance des facteurs médicaux dans l’accès à la liste et à la greffe au sein de NEPHROLOR. Toutefois, les patients pris en charge par le centre où les transplantations étaient réalisées avaient plus de chance d’être inscrit sur la liste. Cette étude a aussi montré le bénéfice de transplantation rénale en terme de survie y compris chez les patients âgés de plus de 60 ans. Par ailleurs, la survie des patients était significativement associée aux variables utilisées par les néphrologues pour l’accès à la liste. Tout ceci valide le processus de sélection des candidats potentiels à la greffe rénale au sein de NEPHROLOR. Cependant, il existe un potentiel d’amélioration de l’accès à la liste d’attente de transplantation rénale, puisque les néphrologues des centres ne pratiquant pas la transplantation pourraient élargir leur sélection de candidats potentiels à la greffe rénale. L’utilisation d’un algorithme décisionnel représentant la probabilité d’inscription sur la liste, en fonction des caractéristiques de base du patient, au moment de l’enregistrement initial du patient dans le système d’information du réseau NEPHROLOR pourrait dynamiser et optimiser le processus d’inscription sur la liste et améliorer l’accès à la greffe rénale<br>Among renal replacement therapy techniques, transplantation is associated with longer survival and lower long-term cost. We studied access to renal transplantation in NEPHROLOR network of care in the French administrative region Lorraine. All incident patients beginning renal replacement therapy in NEPHROLOR between July 1, 1997 and June 30, 2003 (1725 patients) were included in the study. In Lorraine, access to renal transplant waiting list and to transplantation after registration on the list was primarily associated with medical determinants. Nevertheless, patients followed up in the nephrology department performing transplantation were more likely to be placed on the waiting list. After taking into account comorbidities, transplantation was associated with longer survival even among elderly patients (&gt; 60 years). Moreover, patients’ survival was associated with medical determinants of access to renal transplant waiting list. These facts validate the current care process of registration on the waiting list in Lorraine. However, access to the waiting list in the NEPHROLOR network can be improved by encouraging nephrology facilities without transplantation to extend the selection criteria of transplant candidates. Data mining algorithms can represent the probability of being registered on the list based on the patient’s characteristics. Using such an algorithm at the first registration of patient in NEPHROLOR information system could optimize the renal transplant registration process and improve access to renal transplantation in NEPHROLOR
APA, Harvard, Vancouver, ISO, and other styles
31

Bayat, Makoei Sahar Frimat Luc. "Étude de l'accès à la transplantation rénale en Lorraine par méthodes biostatistiques conventionnelles et par fouille de données." S. l. : Nancy 1, 2008. http://www.scd.uhp-nancy.fr/docnum/SCD_T_2008_0049_BAYAT.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
32

Hupé, Philippe. "Akgorithmes biostatistiques pour les données omiques en oncologie - Application à l'étude du nombre de copies d'ADN à partir des expériences de microarray." Phd thesis, AgroParisTech, 2008. http://pastel.archives-ouvertes.fr/pastel-00004333.

Full text
Abstract:
Le cancer est une cause principale de décès et d'importants eorts doivent être réalisés pour vaincre la maladie. La technologie des microarrays est un puissant outil de recherche en oncologie pour comprendre les mécanismes de la progression tumorale qui est due à une perturbation de la régulation des gènes. Par conséquent, l'étude de leur niveau d'expression dans les tumeurs offre une perspective pour comprendre les mécanismes biologiques de la maladie et identier de nouveaux facteurs pronostiques et prédictifs qui aideront le clinicien à choisir la thérapie de chaque patients. Par ailleurs, les tumeurs présentent un changement du nombre de copies d'ADN dont la quantication est aussi possible par microarray. L'utilisation des données de microarray nécessite un traitement statistique approprié permettant de transformer les données brutes en données interprétables biologiquement et cliniquement. Ainsi, nous avons développé des méthodes statistiques qui visent à normaliser et extraire l'information biologique issue des microarrays dédiés à l'étude du nombre de copies d'ADN des tumeurs. Nos méthodes ont permis la caractérisation des tumeurs de haut-risque métastatique dans le mélanome uvéal. Par ailleurs, un des enjeux de l'analyse biostatistique des données de microarrays consiste en l'analyse intégrée de différents types de prols moléculaires. Ainsi, une méthode statistique qui combine les données d'expression de gènes et du nombre de copie d'ADN obtenues par microarrays a été développée dans un contexte de classication supervisée. Les propriétés statistiques de la méthode ont été étudiées et ses performances estimées sur des données simulées et réelles.
APA, Harvard, Vancouver, ISO, and other styles
33

Hupe, Philippe. "Algorithmes biostatistiques pour les données omiques en oncologie : application à l'étude du nombre de copies d'ADN à partir des expériences de microarray." Paris, AgroParisTech, 2008. http://www.theses.fr/2008AGPT0069.

Full text
Abstract:
Le cancer est une cause principale de décès et d'importants eorts doivent être réalisés pour vaincre la maladie. La technologie des microarrays est un puissant outil de recherche en oncologie pour comprendre les mécanismes de la progression tumorale qui est due à une perturbation de la régulation des gènes. Par conséquent, l'étude de leur niveau d'expression dans les tumeurs offre une perspective pour comprendre les mécanismes biologiques de la maladie et identier de nouveaux facteurs pronostiques et prédictifs qui aideront le clinicien à choisir la thérapie de chaque patients. Par ailleurs, les tumeurs présentent un changement du nombre de copies d'ADN dont la quantication est aussi possible par microarray. L'utilisation des données de microarray nécessite un traitement statistique approprié permettant de transformer les données brutes en données interprétables biologiquement et cliniquement. Ainsi, nous avons développé des méthodes statistiques qui visent à normaliser et extraire l'information biologique issue des microarrays dédiés à l'étude du nombre de copies d'ADN des tumeurs. Nos méthodes ont permis la caractérisation des tumeurs de haut-risque métastatique dans le mélanome uvéal. Par ailleurs, un des enjeux de l'analyse biostatistique des données de microarrays consiste en l'analyse intégrée de différents types de prols moléculaires. Ainsi, une méthode statistique qui combine les données d'expression de gènes et du nombre de copie d'ADN obtenues par microarrays a été développée dans un contexte de classication supervisée. Les propriétés statistiques de la méthode ont été étudiées et ses performances estimées sur des données simulées et réelles.
APA, Harvard, Vancouver, ISO, and other styles
34

Collart, Philippe. "Impact à court terme de la pollution atmosphérique sur la santé en Wallonie :utilité d’une approche multivariable." Doctoral thesis, Universite Libre de Bruxelles, 2017. http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/253702.

Full text
Abstract:
De nombreuses études ont mis en évidence les effets à court terme entre la pollution atmosphérique et l’état de santé. Les principaux polluants de l’air sont les particules en suspension, le dioxyde d’azote, l’ozone et le dioxyde de soufre. Ils sont produits essentiellement par le trafic routier et les industries. La température est également associée à la santé cardiovasculaire ou respiratoire et elle peut aussi avoir un effet modificateur sur l’association entre la pollution atmosphérique et événements sanitaires. Les effets à court terme de la pollution atmosphérique peuvent être immédiats, décalés ou cumulés. Le décalage entre exposition et effet sanitaire peut être d’un à plusieurs jours. En général, on observe des effets immédiats pour les maladies cardiovasculaires et des effets légèrement décalés pour les maladies respiratoires. Les maladies cardiovasculaires sont la première cause de mortalité dans les pays industrialisés. Les facteurs de risque de ces maladies sont liés à la fois à l’environnement, aux comportements et aux caractéristiques génétiques des individus. Une association entre pollution atmosphérique, principalement les particules en suspension et le NO2, et morbi-mortalité a été mise en évidence pour les maladies cardiovasculaires suivantes :les accidents vasculaires cérébraux (AVC), les troubles du rythme et l’infarctus du myocarde (IDM). Le but de cette thèse est d’évaluer l’impact à court terme de la pollution atmosphérique sur la santé cardiovasculaire ainsi que sur la mortalité non traumatique en Wallonie et en Belgique tout en vérifiant si des effets immédiats, décalés ou cumulés peuvent être observés en fonction des sensibilités différentielles des sujets exposés.<br>Doctorat en Santé Publique<br>info:eu-repo/semantics/nonPublished
APA, Harvard, Vancouver, ISO, and other styles
35

Vigliotti, Chloé. "Etude de l'impact d'un changement de régime alimentaire sur le microbiome intestinal de Podarcis sicula." Thesis, Paris, Muséum national d'histoire naturelle, 2017. http://www.theses.fr/2017MNHN0011/document.

Full text
Abstract:
Nous avons collecté et comparé les microbiotes et les microbiomes intestinaux de plusieurs dizaines de lézards de l’espèce Podarcis sicula, vivant dans des populations continentales et insulaires croates. L’une de ces populations présentait la particularité d’avoir subi un changement de régime alimentaire récent, une transition d’un régime insectivore vers un régime omnivore (à 80% herbivores) sur une période de 46 ans. Les analyses de diversité menées sur la région V4 de l’ARN ribosomique 16S de ces communautés microbiennes ont révélé que la diversité spécifique (diversité alpha) des microbiotes de lézards omnivores (enrichis en archées méthanogènes) excède celle des microbiotes de lézards insectivores. Les communautés microbiennes des lézards apparaissent en outre faiblement structurées : 5 entérotypes peuvent être identifiés au niveau du phylum, et 3 phyla majoraires (les Bactéroidètes, les Firmicutes et les Protéobactéries) sont présents dans cette espèce. Cependant, ni le régime alimentaire, l’origine spatiale ou temporelle, et le sexe des lézards ne se traduisent par des différences significatives et majeures dans les microbiotes. Des analyses linéaires discriminantes avec effet de la taille des OTUs et des reads des microbiomes fonctionnellement annotés indiquent plutôt que le changement de régime alimentaire de Podarcis sicula est associé à des changements ciblés dans l’abondance de certains composants du microbiote et du microbiome de ces lézards, nous conduisant à formuler l’hypothèse de changements ciblés des communautés microbiennes dans cet holobionte non-modèle, par opposition à des transformations plus radicales. Sur un plan plus théorique, cette thèse propose également des modèles de réseaux (réseaux de similarité de reads et graphes bipartis) susceptibles d’aider à approfondir les analyses des microbiomes<br>We collected and compared intestinal microbiota and microbiomes from several Podarcis sicula lizards, which live in Croatian continental and insular populations. One of these populations has recently changed its diet over an 46 years timespan, switching from an insectivorous diet to an omnivorous one (up to 80% herbivorous). Diversity analyses of these microbial communities, based on the V4 region of their 16S rRNA, showed that the microbiota taxonomic diversity (or alpha diversity) is higher in omnivorous lizards (enrichment in methanogenic archaea) than in insectivorous ones. Besides, microbial communities seem weakly structured: 5 enterotypes are detected at the phylum level, and 3 major phyla (Bacteroidetes, Firmicutes and Proteobacteria) are present. However, neither diet, spatial or temporal origin, nor lizard gender correlate with significant differences in microbiota. Linear discriminant analyses with size effect, based on OTUs and functionally annotated reads from the microbiomes, suggest that Podarcis sicula diet change is associated to targeted changes of the abundance of some enzymes in the microbiomes. Such a result leads us to propose a hypothesis of targeted changes in the microbial communities of this non-model holobiont, instead of more radical transformations. On a more theoretical level, this thesis also proposes network models (Reads similarity networks and bipartite graphs) that can help improving microbiome analyses
APA, Harvard, Vancouver, ISO, and other styles
36

Jobard, Elodie. "Identification of Systemic Markers of Cancer from NMR Metabolomic Investigation of Human Biofluids." Thesis, Lyon, École normale supérieure, 2014. http://www.theses.fr/2014ENSL0878.

Full text
Abstract:
La métabolomique propose une approche basée sur l’étude d’une réponse métabolique globale et dynamique d’un organisme à des stimuli biologiques ou à des mutations génétiques et ainsi constitue un outil de recherche translationnel à fort potentiel en oncologie. Nous avons appliqué l’approche métabonomique par RMN à haut champ à l’analyse d’échantillons sanguins issus d’études cliniques coordonnées par le Centre Léon Bérard et pour la cohorte prospective E3N (Etude Epidémiologique auprès de femmes de la MGEN) dans le but d’identifier de marqueurs systémiques du cancer à partir de fluides biologiques humains. Tout d’abord, l’analyse statistique des profils métaboliques de sérums de patientes atteintes d’un cancer du sein a permis de mettre en évidence une signature métabolique discriminant les patients ayant un cancer localisé des patientes métastatiques et de révéler des biomarqueurs associés à la sévérité de ce cancer. D’autre part, cette approche permet des investigations sur les effets de la chimiothérapie. Ainsi, lors de l’étude de sérums de patients atteints d’un cancer du rein métastatique traités par une chimiothérapie expérimentale, une signature métabolique caractéristique de la modification plus rapide du métabolisme de l’hôte a été mise en évidence pour ce traitement en comparaison à deux thérapies conventionnelles. Enfin, l’analyse de plasmas sanguins issus de la cohorte E3N s’intéresse à l’identification de biomarqueurs associés à la survenue du cancer du sein et de son étiologie. Après identification et quantification des sources de variations systématiques impactant les profils métaboliques obtenus, une analyse stratifiée de la cohorte « cas prospectifs »-contrôles est présentée dans cette thèse<br>Metabolomics offers an approach based on the study of a comprehensive and dynamic metabolic response of an organism to biological stimuli or genetic mutations and thus constitutes a tool for translational research with a strong potential in oncology. We applied the metabonomic approach by high field NMR for the analysis of blood samples from clinical studies coordinated by the Centre Léon Bérard and for the prospective E3N cohort ( Etude Epidémiologique auprès de femmes de la MGEN ) in order to identify systemic cancer markers from human biological fluids . First, the statistical analysis of metabolic serum profiles from patients with breast cancer has highlighted a metabolic signature discriminating patients with localized cancer and metastatic patients and reveal biomarkers associated with severity of this cancer. Furthermore , this approach allows investigations on the effects of chemotherapy. Thus, during the study of sera from patients with metastatic renal cell carcinoma treated with experimental chemotherapy, a characteristic metabolic signature of faster modification of the host metabolism has been demonstrated for this treatment in comparison to two standard therapies. Finally, analysis of blood plasma from the E3N cohort interests the identification of biomarkers associated with the development of breast cancer and its etiology . After identification and quantification of sources of systematic variations affecting the metabolic profiles obtained, a stratified analysis of the "prospective case "- controls cohort is presented in this thesis
APA, Harvard, Vancouver, ISO, and other styles
37

Drulhe, Samuel. "Identification de réseaux de régulation génique à partir de données d'expression : une approche basée sur les modèles affines par morceaux." Phd thesis, Université Joseph Fourier (Grenoble), 2008. http://tel.archives-ouvertes.fr/tel-00380505.

Full text
Abstract:
Les progrès récents des techniques expérimentales biologiques ont conduit à la production d'une énorme quantité de données sur le comportement dynamique des réseaux de régulation génique (RRG). Nous présentons une approche pour l'identification des modèles affines-par-morceaux (APM) de RRGs à partir de données expérimentales. Ces modèles reposent sur l'hypothèse que la régulation survient au niveau de la synthèse et de la dégradation des produits de l'expression des gènes : les paramètres cinétiques sont supposés être constants jusqu'à ce que la concentration d'une protéine régulatrice franchisse un seuil de transition.<br /><br />La méthode que nous présentons se concentrent sur le problème de la détection des transitions entre les différents modes dynamiques à partir des données d'expression génique et sur la reconstruction des seuils de transition associés avec les interactions régulatrices. En particulier, notre méthode prend en considération les contraintes géométriques spécifiques aux modèles APM de RRGs. Une telle méthode d'identification est conçue pour des systèmes à erreur sur la sortie où les observations sont des séries temporelles de mesures bruitées de niveaux de concentration à l'intérieur d'une cellule.<br /><br />Les données sont d'abord classées en modes dans lesquels le comportement dynamique est considéré comme étant complètement décrit par une équation différentielle linéaire. À partir de la classification résultante, une technique de reconnaissance de forme est utilisée pour reconstruire toutes les combinaisons de seuils de transition qui sont cohérentes avec les données mesurées. Pour chaque combinaison de seuils, il est alors possible de fournir un réseau de régulation et les paramètres dynamiques de chaque mode.<br /><br />Les performances de notre approche ont été analysées en utilisant des données artificielles simulées pour un modèle simplifié de la réponse à un manque de carbone pour le bactérie Escherichia coli. En particulier, nous avons évalué l'influence du niveau du bruit et du pas d'échantillonnage sur les systèmes identifiés. Nos résultats montrent que la méthode, en association avec des séries temporelles de mesures suffisamment précises, lesquelles peuvent être obtenues avec des systèmes à gène rapporteur, permettent une identification quantitative de modèles APM de RRGs.
APA, Harvard, Vancouver, ISO, and other styles
38

Béraud, Guillaume. "Modelling infectious agent transmission using social mixing data." Thesis, Lille 2, 2015. http://www.theses.fr/2015LIL2S040/document.

Full text
Abstract:
L'évaluation économique de nouveaux vaccins exige de modéliser la transmission infectieuse au sein de la population, et donc des hypothèses sur la structure et la répartition des contacts. Les matrices de contact obtenues à partir d’enquête de population ont été déterminées pour 8 pays européens. Mais aucune donnée de ce type n'existe à ce jour pour la France. L’étude ComesF (Contact Matrix Estimation – France) vise à combler cette lacune.MéthodologieL'enquête s’est effectuée sur 3 périodes (Février-Mars, Avril, Mai-Avril) avec 278 participants communs à la première et dernière période. Les participants devaient rapporter tous leurs contacts au cours de 2 jours consécutifs dans un journal, avec l'âge, le sexe, l'endroit, la fréquence, le type et la durée du contact.En combinant des enquêtes sérologiques de 2009 et 2013 et les données de couverture vaccinales, nous avons modélisé la séroprévalence de la rougeole, des oreillons et de la rubéole; puis extrapolé la susceptibilité selon l’âge par département à l'année d'intérêt (2016) ; enfin le potentiel épidémique et l'incidence relative selon l’âge d'une future épidémie ont été estimés.Nous avons analysé l'influence de conditions météorologiques sur les variations temporelles des matrices de contact. La population de l'étude a été analysée selon le jour et la météorologie pour estimer le nombre moyen de contacts et le potentiel de transmission estimée avec le R0. Nous avons effectué une revue systématique de la littérature sur les différences selon le genre pour la grippe, la rougeole, les oreillons et la rubéole, puis exploré l'impact du genre sur les matrices de contact et la modélisation des maladies infectieuses.Résultats2033 participants ont rapporté 38881 contacts (médiane pondérée [premier quartile-troisième quartile] : 8 [5–14] par jour) et 54378 contacts avec les contacts professionnels supplémentaires (9 [5–17]). Contrairement à l'âge, le genre, la taille du foyer, les vacances scolaires, le week-end et l'activité professionnelle, la période de l'année influait peu le nombre de contacts ou les schémas de contact. Les schémas de contact étaient influencés par l'âge indépendamment du lieu de contact, et par le genre, les femmes ayant 8 % plus de contacts que les hommes. La plupart des contacts avaient lieu à la maison et à l'école, mais l'ajout des contacts professionnels modifiait la structure des schémas de contact. Les vacances scolaires et les week-ends réduisaient le nombre de contacts, et le R0 de 33 % et de 28 %, respectivement. Le risque pour les Oreillons et la Rubéole concerne surtout le Sud Est et le Centre de la France, alors que le risque pour la rougeole est plus dispersé. Le risque varie avec le genre pour la Rougeole et la Rubéole. Outre les bébés &lt; 1 an, l’épidémie toucherait surtout les adolescents et les jeunes adultes.Les conditions météorologiques influençaient les schémas de contact différemment entre les jours de semaine ou les weekends. La correction pour analyse répétée limitait le nombre de résultats significatif, mais la tendance pour un effet de la météorologie variant entre les jours de semaine et le week-end restait.Les différences de genre dans le schéma de contact pourraient expliquer en partie les différences de genre dans l'épidémiologie des maladies infectieuses. L'utilisation de données spécifiques par genre avait un impact significatif sur le résultat de la modélisation du risque d’une épidémie.Les matrices de contact françaises partageaient de nombreux points communs avec les autres matrices européennes, notamment avec un impact substantiel des fermetures d’école en cas d’épidémie sur la progression de l’épidémie. Le risque d'une nouvelle épidémie de rougeole persiste, mais prédomine pour les oreillons. L'effet des conditions climatiques sur les schémas de contact était modeste, voire négligeable. L’utilisation des données spécifiques par genre est à considérer en modélisation<br>The economic evaluation of new vaccines requires the modeling of infectious disease transmission within a population, which in turn requires some assumption of specific mixing patterns. Matrixes generated from social contact studies were determined for 8 European countries. To date, no such data exist for France. The ComesF study (Contact Matrix Estimation – France) aimed to fill this gap.MethodologyThe survey was carried out over 3 different periods (Feb-Mar, Apr, Apr-May) with 278 participants common to the first and the last periods. Participants had to list all their contacts for 2 consecutive days in a diary, with the age, sex, location, frequency, type and duration of the contact, from which we estimated French contact matrixes.Combining cross-sectional serological surveys from 2009 and 2013 and vaccine coverage information, we have determined an optimal model for the serology of measles, mumps and rubella for the year of the data collection; age-dependent susceptibility by department was then derived to the year of interest (2016), and effective reproduction number and age-dependent relative incidence of a potential outbreak were estimated using the French contact matrixes.We analysed the influence of meteorological conditions on the temporal variations in mixing patterns. The population of the study was split according to the day and the weather at the time when the diary was filled in. The mean number of contacts and the potential for transmission summarized with R0 were calculated for type and location of contact under different weather conditions.We conducted a systematic review on gender differences in infection focusing on influenza, measles, mumps and rubella. Finally, we provided an exploration of the impact of gender on mixing patterns, and eventually the potential implication for modelling.ResultsThe 2033 participants reported 38 881 contacts (weighted median [first quartile-third quartile]: 8[5–14] per day), and 54 378 contacts with supplementary professional contacts (9[5–17]). Contrary to age, gender, household size, holidays, weekend and occupation, the period of the year had little influence on the number of contacts or the mixing patterns. Contact patterns were highly assortative with age, irrespective of the location of the contact, and gender, with women having 8% more contacts than men. Although most contacts occurred at home and school, the inclusion of professional contacts modified the structure of the mixing patterns. Holidays and weekends reduced the number of contacts dramatically, and as proxies for school closure, reduced R0 by 33% and 28%, respectively.The risk for Mumps and Rubella mainly concerned southeastern and south central France, while the risk for measles was more scattered over the country. Risk differed with gender for Measles and Rubella. Besides infants under 1, the highest share of participation would concern teenagers and young adults.The weather had a differential effect on social mixing according to the type of day, notably weekdays and weekend. But correction for repeated analysis made some results no more significant, although the trend for a differential effect between weekdays and weekend remained.Gender differences in social mixing might explain some gender differences in infectious disease epidemiology. Using gender-specific susceptibility and gender-specific contact matrixes had a significant impact on the result of the modeling. Despite the differences, French contact matrixes shared many aspects with those of other European countries. Notably, school closures were likely to have a substantial impact on the spread of close contact infections in France. While the risk of a new Measles outbreak persists, it predominates for Mumps. The effect of weather on social mixing was mild, if not negligible. Gender differences in modelling should be emphasized
APA, Harvard, Vancouver, ISO, and other styles
39

Roussel, Marion. "Vers une meilleure compréhension des facteurs ayant un impact sur le déclenchement et la diffusion d'une maladie infectieuse : exemple de la grippe saisonnière en France." Thesis, Lyon 1, 2015. http://www.theses.fr/2015LYO10251.

Full text
Abstract:
La gestion des maladies infectieuses est l'un des enjeux majeurs de santé publique, et d'autant plus important dans le contexte actuel de changements globaux (urbanisation, flux migratoires, changement climatique). Pour des maladies à dynamique cyclique comme beaucoup d'infections virales respiratoires (généralement communautaires et hivernales), une gestion adaptée requiert deux éléments fondamentaux : un réseau de surveillance dynamique de médecins de ville et hospitaliers permettant un suivi en temps réel de l'épidémie et une bonne compréhension des facteurs affectant sa diffusion dans le temps et dans l'espace. L'épidémie de grippe saisonnière sévissant en France est un système exemplaire d'infection respiratoire ayant un coût sociétal important. Les données (cliniques et virologiques) accumulées durant ces dernières années par le Réseau des GROG (Groupes Régionaux d'Observation de la Grippe) offrent une opportunité de mieux comprendre le déclenchement et la diffusion des épidémies, d'une part et de mettre en place une méthodologie transversale pouvant être rapidement transposée à d'autres infections respiratoires (émergentes) d'autre part. Mon travail de thèse a consisté dans un premier temps à évaluer l'impact de facteurs climatiques sur la propagation des épidémies de grippe et dans un second temps à estimer l'impact de facteurs de risque de la grippe (flux de mobilité de personnes, facteurs démographiques et climatiques) sur les déclenchements épidémiques. Les résultats obtenus suggèrent un impact significatif de la température et de l'humidité à la fois sur la diffusion globale et sur la variabilité intra-annuelle des déclenchements d'épidémies de grippe en France. Concernant la variabilité régionale des déclenchements épidémiques, elle serait expliquée en partie par des différences de taille de population et de proportions de jeunes (0-19 ans) ainsi que par des flux de mobilité. Ce travail a permis de confirmer et de quantifier, à l'aide de modèles mathématiques, l'impact de différents facteurs de risque de la grippe saisonnière en France. Ces conclusions offrent des opportunités intéressantes pour l'amélioration des mesures de prévention et de contrôle de la grippe en tenant en compte des facteurs mis en évidence<br>Infectious disease management is one of the major public health issues, and it becomes even more important in the current context of global changes (urbanization, migration flows, climate change). For periodic dynamic diseases like many respiratory viral infections (generally communal and in winter), a suitable management requires two fundamental elements : a dynamic sentinel surveillance network of general practitioners and hospital doctors allowing real-time monitoring of the epidemic; and a good understanding of factors affecting its spread in time and space. Seasonal influenza epidemic spreading in France is an exemplary system of respiratory infection having a significant social cost. Data (clinical and virological) accumulated during last years by the Réseau des GROG (Regional Influenza Surveillance Group) sentinel network offer an opportunity to better understand the onset and spread of epidemics, on the one hand and to set up a transverse methodology that can be rapidly transposed to other (emerging) respiratory infections on the other hand. My PhD work consisted firstly to assess the impact of climatic factors on the spread of influenza epidemics and secondly to estimate the impact of influenza risk factors (mobility flows, demographic and climatic factors) on epidemic onsets. Results suggest a significant impact of temperature and humidity both on the overall spread and on the intra-annual variability of epidemic onsets of influenza epidemics in France. Concerning regional variability of epidemic onsets, it might be explained partially by differences in population sizes and in young proportions (0-19 years old) as well as by mobility flows. This work confirmed and quantified, using mathematical models, the impact of various risk factors of seasonal influenza in France. These findings offer interesting opportunities to improve influenza preventing and controlling measures by taking into account the highlighted factors
APA, Harvard, Vancouver, ISO, and other styles
40

Béal, Jonas. "De la modélisation mécanistique des voies de signalisation dans le cancer à l’interprétation des modèles et de leurs apports : applications cliniques et évaluation statistique." Electronic Thesis or Diss., Université Paris sciences et lettres, 2020. https://theses.hal.science/tel-03188676.

Full text
Abstract:
Au delà de ses mécanismes génétiques, le cancer peut être compris comme une maladie de réseaux qui résulte souvent de l’interaction entre différentes perturbations dans un réseau de régulation cellulaire. La dynamique de ces réseaux et des voies de signalisation associées est complexe et requiert des approches intégrées. Une d’entre elles est la conception de modèles dits mécanistiques qui traduisent mathématiquement la connaissance biologique des réseaux afin de pouvoir simuler le fonctionnement moléculaire des cancers informatiquement. Ces modèles ne traduisent cependant que les mécanismes généraux à l’oeuvre dans certains cancers en particulier.Cette thèse propose en premier lieu de définir des modèles mécanistiques personnalisés de cancer. Un modèle générique est d’abord défini dans un formalisme logique (ou Booléen), avant d’utiliser les données omiques (mutations, ARN, protéines) de patients ou de lignées cellulaires afin de rendre le modèle spécifique à chacun. Ces modèles personnalisés peuvent ensuite être confrontés aux données cliniques de patients pour vérifier leur validité. Le cas de la réponse clinique aux traitements est exploré en particulier dans ce travail. La représentation explicite des mécanismes moléculaires par ces modèles permet en effet de simuler l’effet de différents traitements suivant leur mode d’action et de vérifier si la sensibilité d’un patient à un traitement est bien prédite par le modèle personnalisé correspondant. Un exemple concernant la réponse aux inhibiteurs de BRAF dans les mélanomes et cancers colorectaux est ainsi proposé.La confrontation des modèles mécanistiques de cancer, ceux présentés dans cette thèse et d’autres, aux données cliniques incite par ailleurs à évaluer rigoureusement leurs éventuels bénéfices dans la cadre d’une utilisation médicale. La quantification et l’interprétation de la valeur pronostique des biomarqueurs issus de certains modèles méchanistiques est brièvement présentée avant de se focaliser sur le cas particulier des modèles capables de sélectionner le meilleur traitement pour chaque patient en fonction des ses caractéristiques moléculaires. Un cadre théorique est proposé pour étendre les méthodes d’inférence causale à l’évaluation de tels algorithmes de médecine de précision. Une illustration est fournie à l’aide de données simulées et de xénogreffes dérivées de patients.L’ensemble des méthodes et applications décrites tracent donc un chemin, de la conception de modèles mécanistiques de cancer à leur évaluation grâce à des modèles statistiques émulant des essais cliniques, proposant ainsi un cadre pour la mise en oeuvre de la médecine de précision en oncologie<br>Beyond its genetic mechanisms, cancer can be understood as a network disease that often results from the interactions between different perturbations in a cellular regulatory network. The dynamics of these networks and associated signaling pathways are complex and require integrated approaches. One approach is to design mechanistic models that translate the biological knowledge of networks in mathematical terms to simulate computationally the molecular features of cancers. However, these models only reflect the general mechanisms at work in cancers.This thesis proposes to define personalized mechanistic models of cancer. A generic model is first defined in a logical (or Boolean) formalism, before using omics data (mutations, RNA, proteins) from patients or cell lines in order to make the model specific to each one profile. These personalized models can then be compared with the clinical data of patients in order to validate them. The response to treatment is investigated in particular in this thesis. The explicit representation of the molecular mechanisms by these models allows to simulate the effect of different treatments according to their targets and to verify if the sensitivity of a patient to a drug is well predicted by the corresponding personalized model. An example concerning the response to BRAF inhibitors in melanomas and colorectal cancers is thus presented.The comparison of mechanistic models of cancer, those presented in this thesis and others, with clinical data also encourages a rigorous evaluation of their possible benefits in the context of medical use. The quantification and interpretation of the prognostic value of outputs of some mechanistic models is briefly presented before focusing on the particular case of models able to recommend the best treatment for each patient according to his molecular profile. A theoretical framework is defined to extend causal inference methods to the evaluation of such precision medicine algorithms. An illustration is provided using simulated data and patient derived xenografts.All the methods and applications put forward a possible path from the design of mechanistic models of cancer to their evaluation using statistical models emulating clinical trials. As such, this thesis provides one framework for the implementation of precision medicine in oncology
APA, Harvard, Vancouver, ISO, and other styles
41

Biton, Anne. "Analyse en composantes indépendantes du transcriptome de cancers." Thesis, Paris 11, 2011. http://www.theses.fr/2011PA11T028.

Full text
Abstract:
L'analyse de données d'expression montre qu'il est avantageux d'analyser les processus biologiques en termes de modules plutôt que simplement considérer les gènes un par un. Dans ce projet nous avons conduit une analyse non supervisée des données d'expression de gènes de plusieurs cohortes de tumeurs urothéliales en appliquant la méthode d'Analyse en Composantes Indépendantes. Plusieurs études ont démontré les meilleures performances de l'ACI par rapport à l'ACP et les méthodes de clustering, pour obtenir une décomposition plus réaliste des données d'expression en patterns d'expression pertinents et associés avec le phénotype d'intérêt.Les tumeurs urothéliales apparaissent et évoluent selon deux voies distinctes dont la probabilité de progression en cancer musculo-invasif diffère radicalement. Excepté la mutation de FGFR3 dans le groupe le moins agressif, les processus moléculaires sous-jacents n'ont pas été complètement identifiés. Le principal objectif de cette thèse était dédié aux interprétations biologiques des différentes composantes indépendantes pour aider à confirmer et étendre la liste des processus biologiques connus pour être impliqués dans le cancer de vessie.Chaque composante indépendante est caractérisée par une liste de projections de gènes et de contributions pondérées d'échantillons tumoraux . En combinant expertise biologique et comparaison des listes de gènes à des voies existantes et en étudiant conjointement l'association des composantes aux annotations cliniques et moléculaires, nous avons pu différencier les CIscausées par des facteurs techniques, tels que le prélèvement chirurgical de celles ayant des interprétations biologiques pertinentes. De plus, parmi les signaux pertinents biologiquement, cette analyse nous a permis de différencier les signaux provenant du stroma, comme la réponse immunitaire médiée par les lymphocytesB&amp;T, de ceux produits par les tumeurs elles-mêmes, comme les signaux reliés à la prolifération ou à la différenciation. La classification des tumeurs selon leurs contributions à certaines CIs a pu être étroitement associée à des annotations anatomo-cliniques, et a mis en évidence de nouveaux sous-types de tumeur spotentiels, qui suggèrent l'existence de voies de progression supplémentaires dans le cancer de vessie. De façon similaire, l'étude des contributions de groupes de tumeurs basés sur des annotations cliniques ou moléculaires a montré différents niveaux de contamination par le stroma entre les tumeurs mutées et nonmutées pour FGFR3. La reproductibilité des composantes a été étudiée en utilisant des graphes de corrélation. La majeure partie des CIs interprétées a été validée sur trois jeux de données indépendants, et plusieurs d'entre elles ont aussi détectées dans un jeu de données de lignées cellulaires.Une deuxième étude sur le rétinoblastome a montré que nous pouvions tirer partie de l'ACI dans des contextes variés. Le rétinoblastome est initié par la perte des deux alléles du gène suppresseur de tumeur RB1. D'autres évènements génomiques non identifiés sont nécessaires à la progression de la maladie. Nous avons observé une association entre âge des patients et altérations génomiques. Les patients jeunes présentant moins d'altérations que les patients âgés, ces derniers présentant des gains du 1q et des pertes du 16q. Cette séparation des tumeurs selon l'âge est également observée sur les données d'expression, notamment en appliquant l'ACI dont l'une des composantes discrimine les patients selon leur âge. Ces résultats suggèrent l'existence de deux voies de progression dans le rétinoblastome. L'analyse des données à haut débit fournit de nombreuses listes de gènes. Afin de les interpréter, une possibilité est d'extraire les dernières publications groupées par sujets prédéfinis (fonction, localisation,...)<br>Practice of gene expression data analysis shows that it is advantageous to analyze biologicalprocesses in terms of modules rather than simply consider gene one by one. In this project, we conducted anunsupervised analysis of the gene expression data of several cohorts of urothelial tumors, applying theIndependent Component Analysis method. Several studies demonstrated the outperformance of ICA overPCA and clustering-based methods in obtaining a more realistic decomposition of the expression data intoconsistent patterns of coexpressed genes associated with the studied phenotypes[1, 2, 3, 4].Urothelial tumors arise and evolve through two distinct pathways which radically differ on their probabilityof progression to muscle invasion. Except the mutation of FGFR3 in the less aggressive group, theunderlying molecular processes have not been completely identified. The first and main objective of the PhDthesis was dedicated to the biological interpretation of the different independent components to help toconfirm and extend the list of biological processes known to be involved in bladder cancer.Each independent component (IC) is characterized by a list of gene projections on the one hand and weightedcontributions of tumor samples on the other hand. By combining biological expertise and comparison of theassociated list of genes to known pathways, and jointly studying the association of the components tomolecular and clinical annotations, we have been able to differentiate components that were caused bytechnical factors, such as surgical sampling, from those having consistent biological interpretationin terms of tumor biology. Moreover, among the biologically meaningful signals, this analysis allowed us todifferentiate the signals from stroma of the tumor, like immune response mediated by B- and T-lymphocytes,from the signals produced by the tumors themselves, like signals related to proliferation, or differentiation.The clustering of the tumor samples according to their contributions on some ICs can be closely associated toanatomo-clinical annotations, and highlighted new potential subtypes of tumors which suggest existence ofadditional pathways of bladder cancer progression. Similarly, the study of the contributions of preestablishedgroups of tumors based on clinical or molecular criteria showed different levels of stromacontamination between FGFR3 non-mutated and mutated tumors. The reproducibility of the components wasinvestigated using correlation graphs. The major part of the interpreted ICs was validated on threeindependent bladder cancer datasets, and several of them were also identified in an urothelial cancer celllines data set.A second study about retinoblastoma gave us the occasion to show that we can take advantage ofICA in various contexts. Retinoblastoma is initiated by the loss of both alleles of the RB1 tumor suppressorgene. Although necessary for initiation, other genomic events, that remain to be identified, are needed for theprogression of the disease [5]. We observed, as it was previously described [6], an association between age ofthe patients and levels of genomic aberrations, the younger patients having fewer alterations than the olderpatients, which generally present gain of 1q and loss of 16q. We showed that this tendency of the tumors tobe clustered into two groups of age can also be observed on the expression data by applying ICA whose oneof the component was highly correlated to the age of the patients. These results suggest the existence of twopathways of progression in retinoblastoma.The analysis of high throughput data provides many lists of genes. To interpret them, a possibility isto study the latest related publications grouped by pre-defined group of topics (function, cellular location...).To that aim, in a third study, we introduced a web-based Java application tool named GeneValorization whichgives a clear and handful overview of the bibliography corresponding to one particular gene list [7]
APA, Harvard, Vancouver, ISO, and other styles
42

Viallefont, Valérie. "Analyses bayesiennes du choix de modèles en épidémiologie : sélection de variables et modélisation de l'hétérogénéité pour des évènements." Paris 11, 2000. http://www.theses.fr/2000PA11T023.

Full text
Abstract:
Cette thèse se décompose en deux parties qui traitent la question du choix modèles dans deux problématiques différentes. Dans la première partie, on s'intéresse, pour les modèles de régression logis multivariée, à différentes stratégies de sélection de variables associées à l'apparition d'une maladie. Les méthodes les plus fréquemment mises en œuvre à l'heure actuelle consistent à sélectionner certaines variables dans un modèle final unique, modèle dans lequel sont ensuite estimés les paramètres et leur variance. Différents critères de sélection existent et la plupart d'entre eux reposent sur une comparaison du degré de signification de tests à une valeur seuil. On s'intéresse aux performances auc performances de ces approches par rapport à celles d'une méthode bayésienne dans laquelle on considère tout un ensemble de modèles. A chaque modèle est associé sa probabilité a posteriori. Cette approche permet d'estimer la probabilité de l'existence d'une association entre chaque variable et l'apparition de la maladie, et de calculer des estimations globale des paramètres. Deux schémas de simulations sont envisagés pour cette comparaison : l'un évoque un cas d'école où l'on s'intéresse à un facteur de risque en présence d'un unique facteur de confusion potentiel, l'autre caractérise une enquête épidémiologique avec un grand nombre de facteurs de risque possibles. Les critères de comparaison portent sur le biais moyen dans l'estimation des coefficients, les pourcentages d’erreurs de première et seconde espèces ou leur équivalent bayésien, et l'expression du degré d'incertitude. La méthode bayésienne fournit notamment une appréciation plus explicite de l'incertitude sur les conclusions. Dans la deuxième partie, on s'intéresse au cas où des données relatives à des événements rares présentent une trop forte hétérogénéité pour être modélisées par une seule distribution de Poisson. On fait alors l'hypothèse qu'elles sont issues de mélange de distributions de Poisson. On propose d'estimer conjointement, dans un modèle hiérarchique bayésien, le nombre de composantes du mélange et les proportions et paramètres de chacune, par les méthodes de Monte Carlo par Chaîne de Markov (MCMC). L'estimation du nombre de composantes nécessite que la dimension de l'espace des paramètres puisse varier : pour ceci on utilise le principe du "Saut Reversible". On illustre la difficulté de trouver une loi a priori faiblement informative pour les paramètres de Poisson en étudiant la sensibilité des résultats au choix de cette loi a priori et de ses paramètres. On propose différentes transformations lors du changement de dimension de l'espace des paramètres et on s'intéresse à leur influence sur les performances de l'algorithme, notamment son caractère mélangeant. Enfin on écrit deux modèles, de prise en compte de covariables, dont l'effet est soit homogène soit hétérogène sur les composantes du mélange. Les comparaisons sont menées sur des jeux de données simulés, et le modèle est finalement illustré sur des données réelles de nature épidémiologique concernant des cas de cancers digestifs en France, puis des données d'accidents de la route<br>This dissertation has two separated parts. In the first part, we compare different strategies for variable selection in a multi­variate logistic regression model. Covariate and confounder selection in case-control studies is often carried out using either a two-step method or a stepwise variable selection method. Inference is then carried out conditionally on the selected model, but this ignores the madel uncertainty implicit in the variable selection process, and so underestimates uncertainty about relative risks. It is well known, and showed again in our study, that the ρ-values computed after variable selection can greatly overstate the strength of conclusions. We propose Bayesian Model Averaging as a formal way of taking account of madel uncertainty in a logistic regression context. The BMA methods, that allows to take into account several models, each being associated with its posterior probability, yields an easily interpreted summary, the posterior probability that a variable is a risk factor, and its estimate averaged over the set of models. We conduct two comparative simulations studies : the first one has a simple design including only one risk factor and one confounder, the second one mimics a epidemiological cohort study dataset, with a large number of potential risk factors. Our criteria are the mean bias, the rate of type I and type II errors, and the assessment of uncertainty in the results, which is bath more accurate and explicit under the BMA analysis. The methods are applied and compared in the context of a previously published case-control study of cervical cancer. The choice of the prior distributions are discussed. In the second part, we focus on the modelling of rare events via a Poisson distribution, that sometimes reveals substantial over-dispersion, indicating that sorme un­ explained discontinuity arises in the data. We suggest to madel this over-dispersion by a Poisson mixture. In a hierarchical Bayesian model, the posterior distributions of he unknown quantities in the mixture (number of components, weights, and Poisson parameters) can be estimated by MCMC algorithms, including reversible jump algothms which allows to vary the dimension of the mixture. We focus on the difficulty of finding a weakly informative prior for the Poisson parameters : different priors are detailed and compared. Then, the performances of different maves created for changing dimension are investigated. The model is extended by the introduction of covariates, with homogeneous or heterogeneous effect. Simulated data sets are designed for the different comparisons, and the model is finally illustrated in two different contexts : an ecological analysis of digestive cancer mortality along the coasts of France, and a dataset concerning counts of accidents in road-junctions
APA, Harvard, Vancouver, ISO, and other styles
43

Lévy, Elise. "Maladies neurodégénératives et stress oxydant." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASB028.

Full text
Abstract:
La maladie d’Alzheimer et les maladies à prions sont des maladies neurodégénératives incurables associées à la transconformation d’un polypeptide : respectivement, le peptide Aß et la protéine prion (PrP). Ces polypeptides mépliés forment alors différents agrégats dans le cerveau, qui conduisent à la mort neuronale. Chez un individu sain, la PrP a une fonction neuroprotectrice, mais chez les malades, la toxicité de certains agrégats pathologiques passe par cette protéine. De plus, les deux pathologies sont associées à un stress oxydant précoce et toxique, qui peut favoriser et être favorisé par l’agrégation de protéines, sans que les agrégats impliqués dans ce cercle vicieux ne soient précisément identifiés.Pour étudier le stress oxydant dans ces maladies, j’ai développé des modèles cellulaires innovants pour suivre en temps réel des marqueurs d’oxydation, et des outils bioinformatiques d’analyse des résultats. Mes travaux montrent que l’unique expression de la forme saine d’Aß ou de PrP protège les cellules d’un oxydant exogène. Pour autant, l’ajout au milieu de culture des mêmes cellules d’Aß et de PrP recombinant favorise l’apparition d’un stress oxydant, uniquement pour les cellules exprimant la PrP normale. Cet effet est visible pour Aß sous forme de fibres amyloïdes, et pour PrP sous forme de monomère, d’oligomères et potentiellement de fibres amyloïdes. Ces travaux valident donc le rôle central de la PrP normale dans la physiologie et la pathologie. Mes résultats pourraient suggérer un rôle des glutathion péroxydases dans la médiation de l’effet protecteur de la PrP normale, et une activation des NADPH oxydases via la PrP en présence d’agrégats pathologiques<br>Alzheimer's disease and prion diseases are incurable neurodegenerative diseases associated with the transconformation of a polypeptide: the Aß peptide and the prion protein (PrP) respectively. These misfolded polypeptides then form different aggregates in the brain, leading to neuronal death. In a healthy individual, PrP has a neuroprotective function, but in patients suffering from Alzheimer or prion diseases, the toxicity of some pathological aggregates is mediated by this protein. Moreover, both pathologies are associated with an early chronic oxidative stress, that is toxic. It can promote and be promoted by protein aggregation, without the aggregates involved in this vicious circle being precisely identified.To study oxidative stress in these diseases, I developed innovative cellular models to monitor oxidation markers in real time, and bioinformatic tools to analyze the results. My work shows that the unique expression of the healthy form of Aß or PrP protects cells from an exogenous oxidant. However, the addition to the culture medium of the same cells of recombinant Aß and PrP promotes the appearance of oxidative stress, only for cells expressing normal PrP. This effect is visible for A in the form of amyloid fibrils, and for PrP in the form of monomer, oligomers and potentially amyloid fibrils. This work thus validates the central role of normal PrP in physiology and pathology. My results could suggest a role of glutathione peroxidases in mediating the protective effect of normal PrP, and an activation of NADPH oxidases via PrP in the presence of pathological aggregates
APA, Harvard, Vancouver, ISO, and other styles
44

Bodinier, Maxime. "Caractérisation longitudinale des réponses immunitaires des patients en soins critiques." Electronic Thesis or Diss., Lyon 1, 2023. http://www.theses.fr/2023LYO10170.

Full text
Abstract:
Cette thèse s'attaque à une problématique clé chez les patients en soins critiques : la complexité et l'hétérogénéité de la réponse immunitaire. Il a été montré que ces patients étaient sujets à des complications, notamment la survenue d’infections nosocomiales, une durée de séjour à l'hôpital augmentée et le décès. C'est dans ce contexte où des liens entre la réponse immunitaire et les mauvais pronostics ont été établis que se situe ce travail de thèse. Dans le but d'améliorer la caractérisation des dynamiques du système immunitaire dans ces situations critiques, la notion d'endotype – une sous-catégorie de patients définie par un ensemble distinct de caractéristiques biologiques – est un concept central de ce travail et une attention méthodologique particulière y a été apporté.La première partie de la thèse s'est concentrée sur l'identification d'une technique appropriée pour regrouper les patients selon les trajectoires de leur réponse immunitaire. La méthode KmL, identifiée grâce à des simulations, a permis de caractériser des endotypes longitudinaux du marqueur HLA-DR monocytaire chez des patients septiques, et de lier ces évolutions à des mauvais pronostics. Ensuite, l'étude a été élargie pour examiner plusieurs marqueurs immunitaires et caractériser plus exhaustivement le système immunitaire non seulement chez les patients admis en soins critiques pour sepsis, mais aussi pour traumatisme grave et chirurgie majeure. Deux endotypes longitudinaux distincts ont été identifiés, dont l'un présentant des caractéristiques pro-inflammatoires et immunosuppressives persistantes, était associé à un pronostic défavorable. Enfin, le travail a également montré le potentiel des mesures d'ARNm dans le sang pour le suivi des altérations du système immunitaire. Un modèle diagnostique a été développé pour identifier ces endotypes longitudinaux à partir d'un seul prélèvement sanguin mesuré à la fin de la première semaine, offrant un outil rapide pour évaluer l'état immunitaire des patients et guider les stratégies thérapeutiques. Ces découvertes soulignent l'importance de la caractérisation des endotypes dans le traitement des patients en soins intensifs. Des travaux futurs viseront à valider ces résultats à plus grande échelle et à évaluer l'efficacité de l’endotypage à travers des essais cliniques randomisés, pour potentiellement améliorer le pronostic des patients en soins intensifs<br>This thesis addresses a key issue in critically ill patients: the complexity and heterogeneity of the immune response. It has been shown that these patients are subject to complications, including the occurrence of nosocomial infections, increased hospital stay, and death. It is in this context, where links have been established between the immune response and poor prognoses, that this thesis work is situated. In order to improve the characterization of the dynamics of the immune system in these critical situations, the concept of endotype – a subcategory of patients defined by a distinct set of biological characteristics – is a central theme of this work and particular methodological attention has been paid to it.The first part of the thesis focused on identifying an appropriate technique for grouping patients according to the trajectories of their immune response. The KmL method, identified through simulations, made it possible to characterize longitudinal endotypes of the monocytic HLA-DR marker in septic patients, and to link these evolutions to poor prognoses. Subsequently, the study was extended to examine several immune markers and to characterize the immune system not only more exhaustively in patients admitted to intensive care for sepsis, but also for severe trauma and major surgery. Two distinct longitudinal endotypes were identified, one of which, displaying persistent pro-inflammatory and immunosuppressive characteristics, was associated with an unfavorable prognosis. Finally, the work also demonstrated the potential of mRNA measurements in blood for monitoring alterations in the immune system. A diagnostic model was developed to identify these longitudinal endotypes from a single blood sample taken at the end of the first week, offering a rapid tool to assess the immune status of patients and guide therapeutic strategies.These findings highlight the importance of characterizing endotypes in the treatment of intensive care patients. Future work will aim to validate these results on a larger scale and to evaluate the effectiveness of endotyping through randomized clinical trials, potentially improving the prognosis of intensive care patients
APA, Harvard, Vancouver, ISO, and other styles
45

Etourneau, Lucas. "Contrôle du FDR et imputation de valeurs manquantes pour l'analyse de données de protéomiques par spectrométrie de masse." Electronic Thesis or Diss., Université Grenoble Alpes, 2024. http://www.theses.fr/2024GRALS001.

Full text
Abstract:
La protéomique consiste en la caractérisation du protéome d’un échantillon biologique, c’est-à-dire l’ensemble des protéines qu’il contient, et ce de la manière la plus exhaustive possible. Par l’identification et la quantification de fragments de protéines analysables en spectrométrie de masse (appelés peptides), la protéomique donne accès au niveau d’expression des gènes à un instant donné, ce qui est une information capitale pour améliorer la compréhension des mécanismes moléculaires en jeu au sein du vivant. Ces expériences produisent de grandes quantités de données, souvent complexes à interpréter et sujettes à certains biais. Elles requièrent des méthodes de traitement fiables et qui assurent un certain contrôle qualité, afin de garantir la pertinence des conclusions biologiques qui en résultent.Les travaux de cette thèse portent sur l'amélioration de ces traitements de données, et plus particulièrement sur les deux points majeurs suivants:Le premier est le contrôle du taux de fausses découvertes (abrégé en FDR pour “False Discovery Rate”), durant les étapes d’identification (1) des peptides, et (2) de biomarqueurs quantitativement différentiels entre une condition biologique testée et son contrôle négatif. Nos contributions portent sur l'établissement de liens entre les méthodes empiriques propres à la protéomique, et d’autres méthodes théoriquement bien établies. Cela nous permet notamment de donner des directions à suivre pour l’amélioration des méthodes de contrôle du FDR lors de l'identification de peptides.Le second point porte sur la gestion des valeurs manquantes, souvent nombreuses et de nature complexe, les rendant impossible à ignorer. En particulier, nous avons développé un nouvel algorithme d’imputation de valeurs manquantes qui tire parti des spécificités des données de protéomique. Notre algorithme a été testé et comparé à d’autres méthodes sur plusieurs jeux de données et selon des métriques variées, et obtient globalement les meilleures performances. De plus, il s’agit du premier algorithme permettant d’imputer en suivant le paradigme en vogue de la “multi-omique”: il peut en effet s’appuyer, lorsque cela est pertinent, sur des informations de type transcriptomique, qui quantifie le niveau d’expression des ARN messagers présents dans l’échantillon, pour imputer de manière plus fiable. Finalement, Pirat est implémenté dans un paquet logiciel disponible gratuitement, ce qui rend facilement utilisable pour la communauté protéomique<br>Proteomics involves characterizing the proteome of a biological sample, that is, the set of proteins it contains, and doing so as exhaustively as possible. By identifying and quantifying protein fragments that are analyzable by mass spectrometry (known as peptides), proteomics provides access to the level of gene expression at a given moment. This is crucial information for improving the understanding of molecular mechanisms at play within living organisms. These experiments produce large amounts of data, often complex to interpret and subject to various biases. They require reliable data processing methods that ensure a certain level of quality control, as to guarantee the relevance of the resulting biological conclusions.The work of this thesis focuses on improving this data processing, and specifically on the following two major points:The first is controlling for the false discovery rate (FDR), when either identifying (1) peptides or (2) quantitatively differential biomarkers between a tested biological condition and its negative control. Our contributions focus on establishing links between the empirical methods stemmed for proteomic practice and other theoretically supported methods. This notably allows us to provide directions for the improvement of FDR control methods used for peptide identification.The second point focuses on managing missing values, which are often numerous and complex in nature, making them impossible to ignore. Specifically, we have developed a new algorithm for imputing them that leverages the specificities of proteomics data. Our algorithm has been tested and compared to other methods on multiple datasets and according to various metrics, and it generally achieves the best performance. Moreover, it is the first algorithm that allows imputation following the trending paradigm of "multi-omics": if it is relevant to the experiment, it can impute more reliably by relying on transcriptomic information, which quantifies the level of messenger RNA expression present in the sample. Finally, Pirat is implemented in a freely available software package, making it easy to use for the proteomic community
APA, Harvard, Vancouver, ISO, and other styles
46

Chalmandrier, Loic. "De la communauté à la méta-communauté, décrypter les patrons de diversité." Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAV033/document.

Full text
Abstract:
Les patrons de diversité caractérisent la structure de la diversité des communautés, c'est-à-dire sa valeur, sa distribution et son changement dans l'espace et le temps. Leur étude peut amener des informations importantes sur les processus écologiques qui en sont à l'origine. Cependant de nombreuses hypothèses de travail sont faites lors de leur analyse. L'idée générale de cette thèse est qu'en remettant en cause ces hypothèses, un certain nombre de développements liés aux indices de diversité et aux modèles nuls deviennent possibles et permettent de mieux comprendre les processus écologiques à l'origine des patrons de diversité fonctionnelle ou phylogénétique. Le premier chapitre est consacré à l'étude des patrons de diversité fonctionnelle des communautés végétales alpines à de multiples échelles spatiales et organisationnelles. Le second chapitre s'intéresse aux perspectives méthodologiques amenés par les nombres de Hill. Dans le dernier chapitre, on s'intéresse aux enjeux méthodologiques d'un nouveau type de données de communautés : l'ADN environnemental<br>Patterns of community diversity refers to the structure of diversity, i.e. its quantification, its distribution and its turnover in space and time. Its study is likely to shed the light on the assembly rules that determined the structure of communities. However, numerous ecological assumptions are often made when studying diversity patterns. What motivated the work was the perspective that by relaxing these assumptions, a number of developments linked to diversity indices and null models are possible and can help to understand the impact of multiple ecological processes on phylogenetic and functional diversity patterns. In a first part we studied the pattern of functional diversity of alpine plant communities as a function of spatial and organizational scales. In the second part, we studied the methodological perspectives brought by the Hill numbers. In a third part, we addressed the main methodological issues of a new type of community data: environmental DNA
APA, Harvard, Vancouver, ISO, and other styles
47

Bourgeas, Raphael. "2P2IDB : Une base de données dédiée à la druggabilité des interactions protéine-protéine." Thesis, Aix-Marseille, 2012. http://www.theses.fr/2012AIXM4725/document.

Full text
Abstract:
Le nombre considérable d'interactions protéine-protéine (PPIs) existant au sein d'un organisme, ainsi que leur implication cruciale dans la vie cellulaire et dans de nombreuses pathologies, font des PPIs un immense réservoir de cibles potentielles pour la recherche de médicaments. Les PPIs sont aujourd'hui sur le devant de la scène grâce au développement de méthodologies innovantes et la validation récente de molécules chimiques modulant ces interactions dans des essais précliniques.L'étude des modulateurs d'interactions protéine-protéine (PPIM), a des implications tant dans la recherche fondamentale que thérapeutique. Les PPIMs peuvent aider à la compréhension des réseaux d'interactions. Elles permettront également de faire émerger de nouvelles familles d'agents thérapeutiques actifs dans diverses pathologies.Mon travail de thèse a principalement porté sur deux aspects de l'étude de l'inhibition des PPIs. D'une part, l'étude de l'implication des divers paramètres physicochimiques gouvernant une PPI dans sa capacité à être modulée (étude dite de la « druggabilité »), m'a amené à participer à la création d'une base de données structurale des interactions protéine-protéine : 2P2IDB (http://2p2idb.cnrs-mrs.fr/). D'autre part, j'ai contribué à l analyse de l'espace chimique des molécules présentes dans la base de données 2P2IDB. Nous avons défini la « Rule Of 4 » comme ligne de conduite pour caractériser ces molécules. Nous avons de plus utilisé le SVM afin de créer un protocole innovant (2P2IHUNTER) qui nous a permis de filtrer de grandes collections de composés afin de créer des chimiothèques dédiées aux PPIs<br>The number of protein-protein interactions (PPIs) existing in an organism, and their crucial implication in cellular life and in many pathologies, demonstrates the importance of PPIs as a large reservoir of potential targets for medicinal research. Neglected for a long time by both pharmaceutical companies and academic laboratories because they were historically classified as difficult targets, PPIs are now getting into the groove due to the development of innovative methodologies and the growing number of small molecule compounds modulating these interactions.The study of PPI modulators has implications in both fundamental and therapeutics research. On the one hand, PPI modulators can be used in basic research to decipher the role of PPIs in biological networks. On the other hand, they represent a valuable source of new families of therapeutic agents in pathologic processes.In the first part of my PhD, I contributed to the development of a structural database dedicated to protein-protein interactions: 2P2IDB (http://2p2idb.cnrs-mrs.fr/). The interface descriptors of protein-protein interfaces which are typical of complexes present in 2P2IDB have been used to develop a qualitative scoring function to assess the ‘druggability' of PPI targets.In the second part of my PhD, I contributed to the analysis of the chemical space of PPI inhibitors present in the 2P2I database using chemoinformatics tools. We defined the ‘Rule-of-4' as a guideline to characterize these compounds. We have used support vector machine approaches to elaborate a protocol: 2P2IHUNTER, which allows filtering large collection of compounds to design chemical libraries dedicated to PPI targets
APA, Harvard, Vancouver, ISO, and other styles
48

Martins, Helena. "Méthodes statistiques pour identifier l'adaptation locale dans les populations continues et mélangées." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAS022/document.

Full text
Abstract:
La recherche des signatures génétiques de l'adaptation locale est d'un grand intérêt pour de nombreuses études de génétique des populations. Les approches pour trier les loci sélectifs à partir de leur contexte génomique, se concentrent sur les valeurs extrêmes de l'indice de fixation, FST, à travers les loci. Cependant, le calcul de l'indice de fixation devient difficile lorsque la population est génétiquement continue, lorsque la prédéfinition des sous-populations est une tâche difficile et en présence d'individus mélangés dans l'échantillon. Dans cette thèse, nous présentons une nouvelle méthode pour identifier les loci sous sélection basée sur une extension de la statistique FST à des échantillons avec des individus mélangés. Considérant notre objectif d'explorer des méthodes statistiques pour identifier l'adaptation locale dans la population mélangée, nous avons inclus des données spatiales pour calculer les coefficients d'ascendance et les fréquences d'allèles. Pour enrichir notre travail, nous avons investigué les effets du déséquilibre de liaison et des méthodes d'élagage de LD dans les analyses de génomes pour la sélection<br>Finding genetic signatures of local adaptation is of great interest for many population genetic studies. Common approaches to sorting selective loci from their genomic background focus on the extreme values of the fixation index, FST, across loci. However, the computation of the fixation index becomes challenging when the population is genetically continuous, when predefining subpopulations is a difficult task, and in the presence of admixed individuals in the sample. In this thesis, we present a new method to identify loci under selection based on an extension of the FST statistic to samples with admixed individuals. Considering our goal of exploring statistical methods to identify local adaptation in admixed population, we included spatial data to compute ancestry coefficients and allele frequencies. To enrich our work, we investigated the effects of linkage disequilibrium and LD-pruning methods in genome scans for selection
APA, Harvard, Vancouver, ISO, and other styles
49

Assi, Nada. "Use of factorial biostatistical methods to investigate the relation between nutrition and cancer in the European Prospective Investigation into Cancer and Nutrition (EPIC) study." Thesis, Lyon, 2016. http://www.theses.fr/2016LYSE1185/document.

Full text
Abstract:
La nutrition est un facteur de risque modifiable pour le cancer puisqu'environ un tiers des cas pourraient être évités en adoptant une meilleure alimentation. La relation entre nutrition et cancer est complexe, et son étude est enrichie par de nouveaux défis apportés par les récentes avancées technologiques dans le domaine des « -omiques ». Cette thèse a pour but de développer de nouvelles approches biostatistiques afin d'étudier la relation entre nutrition et cancer au sein de la cohorte EPIC. Pour ce faire, l'applicabilité de nouvelles méthodologies multivariées dans le domaine de l'épidémiologie nutritionnelle a été étudiée.Une nouvelle méthode multivariée pour la réduction de la dimensionnalité, le Treelet Transform (TT), a été examinée afin d'extraire des patterns de nutriments issus de questionnaires. Les patterns ainsi obtenus par le TT étaient plus facilement interprétables que par les méthodes classiques. Ensuite, un cadre analytique pour implémenter le concept du « meeting-in-the-middle » (MITM) a été développé et appliqué dans 2 études cas-témoin nichées sur le cancer hépatocellulaire avec des données métabolomiques. Le MITM cherche à identifier des biomarqueurs qui soient à la fois des marqueurs de certaines expositions passées et des prédicteurs de maladies. L'implémentation s'est focalisée sur l'application de la PLS et de l'analyse de médiation.Enfin, nous avons examinés la relation entre les niveaux plasmatiques de 60 acides gras issus de biomarqueurs et le risque de cancer du sein dans une étude cas-témoin nichée dans EPIC.Cette thèse servira de base pour des applications épidémiologiques futures examinant la relation nutrition-cancer<br>Diet is a modifiable risk factor for many cancers. It has been estimated that about a third of cancer cases can be prevented by complying with a healthy diet and adhering to the recommendations in terms of nutrition. The nutrition-cancer relationship is a complex one, and its study is currently at a turning point with the opportunity and challenges brought by the recent technological advances in the fields of « -omics ».This thesis aims to develop new biostatistical approaches to investigate the nutrition-cancer relation within the European Prospective Investigation into Cancer and nutrition (EPIC) study. To do so, the applicability of new methodologies in the field of nutritional epidemiology has been examined.First, a new multivariate dimension reduction method, the Treelet Transform (TT) was applied to extract nutrient patterns relying on questionnaire data. The extracted patterns were more easily interpretable than those obtained with more classical methods.Then, an analytical framework was conceived for the « meeting-in-the-middle » (MITM) principle and applied to two nested case-control studies on hepatocellular carcinoma, with targeted and untargeted metabolomics data. The MITM aims to identify overlap biomarkers of certain exposures that are at the same time predictive of disease outcomes. The implementation focused on the application of partial least squares and mediation analyses. Last, the association between 60 plasma fatty acids levels assessed from biomarkers and breast cancer risk was examined in a nested case-control study in EPIC. This thesis will serve as a basis for future epidemiological applications looking into the nutrition-cancer relation
APA, Harvard, Vancouver, ISO, and other styles
50

Mboup, Bassirou. "Validation de biomarqueurs prédictifs de la réponse au traitement : extension des courbes de prédictivités à un critère de jugement censuré On Evaluating How Well a Biomarker Can Predicttreatment Response With Survival Data Insights for Quantifying the Long-Term Benefit of Immunotherapy Using Quantile Regression." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASR011.

Full text
Abstract:
Il est fréquent en oncologie, de vouloir déterminer si seulement un sous groupe de patients va bénéficier ou pas d’un traitement. C’est un des paradigmes de la médecine personnalisée ou stratifiée. Les biomarqueurs prédictifs sont souvent utilisés pour sélectionner ces patients et la plupart de ces biomarqueurs sont continus. Par exemple les signatures génomiques comme Oncotype-Dx. Il a été proposé dans la littérature une méthodologie d’évaluation d’un biomarqueur avec réponse binaire. L’objectif dans cette thèse est dans un premier travail d’étendre cette méthodologie avec un critère de jugement censuré et de déterminer à différent horizons de prédiction le seuil optimal du biomarqueur au-delà duquel le traitement sera attribué ou évité. Un modèle dont l’estimation de ces paramètres repose sur des pondérations par l’inverse des probabilités de censure est proposé permettant ainsi d’obtenir un estimateur consistant. Une extension des courbes de prédictivité par bras de traitement dépendantes du temps est ainsi proposée. Dans un second travail, un test de l’hypothèse de calibration avec des données censurées à droite a été proposé. Ce test est valide au-delà 60% de taux de censure contrairement à ceux qui existe déjà dans la littérature et nous permettra d’étudier l’influence d’une mauvaise calibration sur la détermination du seuil. Un troisième travail s’intéresse à la détermination du seuil d’un nouveau biomarqueur pronostique pour le cancer de l’ovaire afin de classer les patients en haut ou bas risque de rechute. Enfin, dans un quatrième travail, nous proposons d’employer la régression quantile pour données censurées pour quantifier le bénéfice à long terme de l’immunothérapie<br>It is common in oncology to want to determine whether or not only a subgroup of patients will benefit from a treatment. This is one of the paradigms of personalized or stratified medicine. Predictive biomarkers are often used to select these patients and most of these biomarkers are continuous. For example genomic signatures such as Oncotype-Dx. A methodology for evaluating a biomarker with binary response has been proposed in the literature. The objective of this thesis is in first work to extend this methodology with right-censored data and to determine at different prediction horizons the optimal threshold of the biomarker beyond which treatment will be attributed or avoided. A model whose estimates of these parameters are based on inverse censored probability weights is proposed to provide consistent estimators. An extension of the predictiveness curves will be carried out. In a second work, a test of the calibration hypothesis with right-censored data has been proposed. This test will be valid beyond the 60% censoring rate contrary to those already existing in the literature and will allow us to study the influence of a bad calibration on the determination of the threshold. A third work focuses on the determination of the threshold of a new prognostic biomarker for ovarian cancer in order to classify patients at high or low risk of relapse. Finally, a fourth work consists in illustrating the relevance of the censored quantile regression for quantifying the long term benefit of immunotherapy in a reconstructed data set from a single randomized trial. The proposed methodology can be readilty employed for individual patients data meta-analysis to summarize evidence of immunotherapy as quantified by the upper quantile of the survival distribution
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography