To see the other types of publications on this topic, follow the link: Analyse et statistique spatiale des données.

Dissertations / Theses on the topic 'Analyse et statistique spatiale des données'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Analyse et statistique spatiale des données.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Gharbi, Zied. "Contribution à l’économétrie spatiale et l’analyse de données fonctionnelles." Thesis, Lille 1, 2019. http://www.theses.fr/2019LIL1A012/document.

Full text
Abstract:
Ce mémoire de thèse touche deux champs de recherche importants en statistique inférentielle, notamment l’économétrie spatiale et l’analyse de données fonctionnelles. Plus précisément, nous nous sommes intéressés à l’analyse de données réelles spatiales ou spatio-fonctionnelles en étendant certaines méthodes inférentielles pour prendre en compte une éventuelle dépendance spatiale. Nous avons d’abord considéré l’estimation d’un modèle autorégressif spatiale (SAR) ayant une variable dépendante fonctionnelle et une variable réponse réelle à l’aide d’observations sur une unité géographique donnée. Il s’agit d’un modèle de régression avec la spécificité que chaque observation de la variable indépendante collectée dans un emplacement géographique dépend d’observations de la même variable dans des emplacements voisins. Cette relation entre voisins est généralement mesurée par une matrice carrée nommée matrice de pondération spatiale et qui mesure l’effet d’interaction entre les unités spatiales voisines. Cette matrice est supposée exogène c’est-à-dire la métrique utilisée pour la construire ne dépend pas des mesures de variables explicatives du modèle. L’apport de cette thèse sur ce modèle réside dans le fait que la variable explicative est de nature fonctionnelle, à valeurs dans un espace de dimension infinie. Notre méthodologie d’estimation est basée sur une réduction de la dimension de la variable explicative fonctionnelle, par l’analyse en composantes principales fonctionnelles suivie d’une maximisation de la vraisemblance tronquée du modèle. Des propriétés asymptotiques des estimateurs, des illustrations des performances des estimateurs via une étude de Monte Carlo et une application à des données réelles environnementales ont été considérées. Dans la deuxième contribution, nous reprenons le modèle SAR fonctionnel étudié dans la première partie en considérant une structure endogène de la matrice de pondération spatiale. Au lieu de se baser sur un critère géographique pour calculer les dépendances entre localisations voisines, nous calculons ces dernières via un processus endogène, c’est-à-dire qui dépend des variables à expliquées. Nous appliquons la même approche d’estimation à deux étapes décrite ci-dessus, nous étudions aussi les performances de l’estimateur proposé pour des échantillons à taille finie et discutons le cadre asymptotique. Dans la troisième partie de cette contribution, nous nous intéressons à l’hétéroscédasticité dans les modèles partiellement linéaires pour variables exogènes réelles et variable réponse binaire. Nous proposons un modèle Probit spatial contenant une partie non-paramétrique. La dépendance spatiale est introduite au niveau des erreurs (perturbations) du modèle considéré. L’estimation des parties paramétrique et non paramétrique du modèle est récursive et consiste à fixer d’abord les composants paramétriques et à estimer la partie non paramétrique à l’aide de la méthode de vraisemblance pondérée puis utiliser cette dernière estimation pour construire un profil de la vraisemblance pour estimer la partie paramétrique. La performance de la méthode proposée est étudiée via une étude Monte Carlo. La contribution finit par une étude empirique sur la relation entre la croissance économique et la qualité environnementale en Suède à l’aide d’outils de l’économétrie spatiale
This thesis covers two important fields of research in inferential statistics, namely spatial econometrics and functional data analysis. More precisely, we have focused on the analysis of real spatial or spatio-functional data by extending certain inferential methods to take into account a possible spatial dependence. We first considered the estimation of a spatial autoregressive model (SAR) with a functional dependent variable and a real response variable using observations on a given geographical unit. This is a regression model with the specificity that each observation of the independent variable collected in a geographical location depends on observations of the same variable in neighboring locations. This relationship between neighbors is generally measured by a square matrix called the spatial weighting matrix, which measures the interaction effect between neighboring spatial units. This matrix is assumed to be exogenous, i.e. the metric used to construct it does not depend on the explanatory variable. The contribution of this thesis to this model lies in the fact that the explanatory variable is of a functional nature, with values in a space of infinite dimension. Our estimation methodology is based on a dimension reduction of the functional explanatory variable through functional principal component analysis followed by maximization of the truncated likelihood of the model. Asymptotic properties of the estimators, illustrations of the performance of the estimators via a Monte Carlo study and an application to real environmental data were considered. In the second contribution, we use the functional SAR model studied in the first part by considering an endogenous structure of the spatial weighting matrix. Instead of using a geographical criterion to calculate the dependencies between neighboring locations, we calculate them via an endogenous process, i.e. one that depends on explanatory variables. We apply the same two-step estimation approach described above and study the performance of the proposed estimator for finite or infinite-tending samples. In the third part of this thesis we focus on heteroskedasticity in partially linear models for real exogenous variables and binary response variable. We propose a spatial Probit model containing a non-parametric part. Spatial dependence is introduced at the level of errors (perturbations) of the model considered. The estimation of the parametric and non-parametric parts of the model is recursive and consists of first setting the parametric parameters and estimating the non-parametric part using the weighted likelihood method and then using the latter estimate to construct a likelihood profile to estimate the parametric part. The performance of the proposed method is investigated via a Monte-Carlo study. An empirical study on the relationship between economic growth and environmental quality in Sweden using some spatial econometric tools finishes the document
APA, Harvard, Vancouver, ISO, and other styles
2

Ahmed, Mohamed Salem. "Contribution à la statistique spatiale et l'analyse de données fonctionnelles." Thesis, Lille 3, 2017. http://www.theses.fr/2017LIL30047/document.

Full text
Abstract:
Ce mémoire de thèse porte sur la statistique inférentielle des données spatiales et/ou fonctionnelles. En effet, nous nous sommes intéressés à l’estimation de paramètres inconnus de certains modèles à partir d’échantillons obtenus par un processus d’échantillonnage aléatoire ou non (stratifié), composés de variables indépendantes ou spatialement dépendantes.La spécificité des méthodes proposées réside dans le fait qu’elles tiennent compte de la nature de l’échantillon étudié (échantillon stratifié ou composé de données spatiales dépendantes).Tout d’abord, nous étudions des données à valeurs dans un espace de dimension infinie ou dites ”données fonctionnelles”. Dans un premier temps, nous étudions les modèles de choix binaires fonctionnels dans un contexte d’échantillonnage par stratification endogène (échantillonnage Cas-Témoin ou échantillonnage basé sur le choix). La spécificité de cette étude réside sur le fait que la méthode proposée prend en considération le schéma d’échantillonnage. Nous décrivons une fonction de vraisemblance conditionnelle sous l’échantillonnage considérée et une stratégie de réduction de dimension afin d’introduire une estimation du modèle par vraisemblance conditionnelle. Nous étudions les propriétés asymptotiques des estimateurs proposées ainsi que leurs applications à des données simulées et réelles. Nous nous sommes ensuite intéressés à un modèle linéaire fonctionnel spatial auto-régressif. La particularité du modèle réside dans la nature fonctionnelle de la variable explicative et la structure de la dépendance spatiale des variables de l’échantillon considéré. La procédure d’estimation que nous proposons consiste à réduire la dimension infinie de la variable explicative fonctionnelle et à maximiser une quasi-vraisemblance associée au modèle. Nous établissons la consistance, la normalité asymptotique et les performances numériques des estimateurs proposés.Dans la deuxième partie du mémoire, nous abordons des problèmes de régression et prédiction de variables dépendantes à valeurs réelles. Nous commençons par généraliser la méthode de k-plus proches voisins (k-nearest neighbors; k-NN) afin de prédire un processus spatial en des sites non-observés, en présence de co-variables spatiaux. La spécificité du prédicteur proposé est qu’il tient compte d’une hétérogénéité au niveau de la co-variable utilisée. Nous établissons la convergence presque complète avec vitesse du prédicteur et donnons des résultats numériques à l’aide de données simulées et environnementales.Nous généralisons ensuite le modèle probit partiellement linéaire pour données indépendantes à des données spatiales. Nous utilisons un processus spatial linéaire pour modéliser les perturbations du processus considéré, permettant ainsi plus de flexibilité et d’englober plusieurs types de dépendances spatiales. Nous proposons une approche d’estimation semi paramétrique basée sur une vraisemblance pondérée et la méthode des moments généralisées et en étudions les propriétés asymptotiques et performances numériques. Une étude sur la détection des facteurs de risque de cancer VADS (voies aéro-digestives supérieures)dans la région Nord de France à l’aide de modèles spatiaux à choix binaire termine notre contribution
This thesis is about statistical inference for spatial and/or functional data. Indeed, weare interested in estimation of unknown parameters of some models from random or nonrandom(stratified) samples composed of independent or spatially dependent variables.The specificity of the proposed methods lies in the fact that they take into considerationthe considered sample nature (stratified or spatial sample).We begin by studying data valued in a space of infinite dimension or so-called ”functionaldata”. First, we study a functional binary choice model explored in a case-controlor choice-based sample design context. The specificity of this study is that the proposedmethod takes into account the sampling scheme. We describe a conditional likelihoodfunction under the sampling distribution and a reduction of dimension strategy to definea feasible conditional maximum likelihood estimator of the model. Asymptotic propertiesof the proposed estimates as well as their application to simulated and real data are given.Secondly, we explore a functional linear autoregressive spatial model whose particularityis on the functional nature of the explanatory variable and the structure of the spatialdependence. The estimation procedure consists of reducing the infinite dimension of thefunctional variable and maximizing a quasi-likelihood function. We establish the consistencyand asymptotic normality of the estimator. The usefulness of the methodology isillustrated via simulations and an application to some real data.In the second part of the thesis, we address some estimation and prediction problemsof real random spatial variables. We start by generalizing the k-nearest neighbors method,namely k-NN, to predict a spatial process at non-observed locations using some covariates.The specificity of the proposed k-NN predictor lies in the fact that it is flexible and allowsa number of heterogeneity in the covariate. We establish the almost complete convergencewith rates of the spatial predictor whose performance is ensured by an application oversimulated and environmental data. In addition, we generalize the partially linear probitmodel of independent data to the spatial case. We use a linear process for disturbancesallowing various spatial dependencies and propose a semiparametric estimation approachbased on weighted likelihood and generalized method of moments methods. We establishthe consistency and asymptotic distribution of the proposed estimators and investigate thefinite sample performance of the estimators on simulated data. We end by an applicationof spatial binary choice models to identify UADT (Upper aerodigestive tract) cancer riskfactors in the north region of France which displays the highest rates of such cancerincidence and mortality of the country
APA, Harvard, Vancouver, ISO, and other styles
3

Ollier, Sébastien. "Des outils pour l'intégration des contraintes spatiales, temporelles et évolutives en analyse des données écologiques." Lyon 1, 2004. http://www.theses.fr/2004LYO10293.

Full text
Abstract:
Au cours de cette thèse, on revient dans une première partie sur la question théorique de l'ordination sous contraintee spatiales par une revue des objets permettant l'intégration des proximités spatiales. On introduit ensuite une nouvelle procédure qui généralise, à l'interface des programmathèques "spdep" et "ade4" du logiciel R, l'ACP sous contrainte de Wartenberg. On aborde ensuite le problème de la typologie de structures multiéchelles. On propose une solution à la normalisation des échelles. Les illustrations portent sur des données d'altimétrie laser. Enfin, à partir d'une critique des procédures ad hoc rencontrées dans la littérature, on définit des procédures canoniques permettant la prise en compte des proximités évolutives en analyse des données. La conclusion porte sur la pratique de la biométrie et les relations qui s'établissent entre donnée expérimentale, langage mathématique et mise en oeuvre informatique
APA, Harvard, Vancouver, ISO, and other styles
4

Goulard, Michel. "Champs spatiaux et statistique multidimensionnelle." Grenoble 2 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb376138909.

Full text
APA, Harvard, Vancouver, ISO, and other styles
5

Toupin, Marie-Hélène. "La copule khi-carré et son utilisation en statistique spatiale et pour la modélisation de données multidimensionnelles." Doctoral thesis, Université Laval, 2017. http://hdl.handle.net/20.500.11794/27977.

Full text
Abstract:
Cette thèse étudie les propriétés des copules appartenant à la famille khi-carré. Il s’agit d’une généralisation des copules normales multidimensionnelles obtenue en élevant au carré les composantes d’un vecteur de variables aléatoires normales. Ces copules sont indicées par une matrice de corrélation et par un paramètre de forme. Cette thèse montre comment cette famille de copules peut être utilisée pour faire de l’interpolation spatiale et pour modéliser des données multidimensionnelles. Dans un premier temps, l’utilité de cette classe de structures de dépendance est démontrée par le biais d’une application en statistique spatiale. Un problème important dans ce contexte est de prévoir la valeur d’un champ aléatoire stationnaire en une position où il n’a pas été observé. Cette thèse montre comment construire de telles prévisions à l’aide de modèles spatiaux basés sur les copules. L’accent est mis sur l’utilisation de la famille des copules khi-carré dans ce contexte. Il faut d’abord supposer que la matrice de corrélation a une forme paramétrique standard, telle celle de Matérn, indicée par un paramètre inconnu associé à la force de l’association spatiale. Ce paramètre est d’abord estimé à l’aide d’une pseudo-vraisemblance composite construite à partir des lois bidimensionnelles des données observées. Ensuite, une méthode d’interpolation spatiale utilisant les rangs des observations est suggérée afin d’approximer la meilleure prévision du champ aléatoire à une position non observée. Dans un deuxième temps, les propriétés fondamentales des copules khi-carré sont étudiées en détail. Cette famille de copules permet une grande flexibilité quant à la modélisation de données multidimensionnelles. Dans le cas bivarié, ces copules s’adaptent à de la dépendance autant symétrique qu’asymétrique. En dimension plus grande, le paramètre de forme contrôle le degré d’asymétrie radiale des distributions marginales bidimensionnelles. Des procédures d’estimation de la matrice de corrélation et du paramètre de forme sont comparées dans le cas de répétitions indépendantes et identiquement distribuées. Enfin, des formules de l’espérance conditionnelle pour la meilleure prévision dans un contexte spatiale sont établies. Finalement, des tests d’adéquation basés sur des moments pour la famille des copules khi-carré sont développés. Ces nouveaux tests peuvent être appliqués à un ensemble de données de n’importe quelle dimension. Ces procédures reposent sur deux mesures d’association basées sur les rangs des observations ce qui évite d’avoir à spécifier les lois marginales. Il est démontré que le comportement conjoint de ces deux mesures est asymptotiquement normal. L’efficacité des nouvelles procédures d’adéquation est démontrée via une étude de simulations et est comparée à un test d’adéquation classique basé sur la copule empirique.
This thesis studies the properties of the family of chi-square copulas. This is a generalization of the multidimensional normal copulas obtained by squaring the components of normal random vector. These copulas are indexed by a correlation matrix and by a shape parameter. This thesis shows how this family can be used to perform spatial interpolation and to model multidimensional data. First, the usefulness of this class of dependence structures is demonstrated with an application in spatial statistics. An important problem in that context is to predict the value of a stationary random field at a position where it has not been observed. This thesis shows how to construct such predictions using spatial models based on copulas. One focusses on the use of the family of chi-square copulas in that context. One must first assumes that the correlation matrix has a standard parametric form, such as that of Matérn, indexed by an unknown parameter associated with the force of the spatial association. This parameter is first estimated using a composite pseudo-likelihood constructed from the bivariate distributions of the observed data. Then, a spatial interpolation method using the ranks of the observations is suggested to approximate the best prediction of the random field at an unobserved position under a chi-square copula. In a second work, the fundamental properties of the chi-square copulas are studied in detail. This family allows a lot of flexibility to model multidimensional data. In the bivariate case, this family is adapted to symmetric and asymmetric dependence structures. In larger dimensions, the shape parameter controls the degree of radial asymmetry of the two-dimensional marginal distributions. Parameter estimation procedures of the correlation matrix and of the shape parameter are compared under independent and identically distributed repetitions. Finally, the formulas of the conditional expectation for the best prediction in a spatial context are established. Goodness-of-fit tests for the family of chi-square copulas are then developed. These new tests can be applied to data in any dimension. These procedures are based on two association measures based on the ranks of the observations, which avoids having to specify the marginal distributions. It is shown that the joint behavior of these two measures is asymptotically normal. The efficiency of the new goodness-of-fit procedures is demonstrated through a simulation study and is compared to a classical goodness-of-fit test based on the empirical copula.
APA, Harvard, Vancouver, ISO, and other styles
6

Cucala, Lionel. "ESPACEMENTS BIDIMENSIONNELS ET DONNÉES ENTACHÉES D'ERREURS DANS L'ANALYSE DES PROCESSUS PONCTUELS SPATIAUX." Phd thesis, Université des Sciences Sociales - Toulouse I, 2006. http://tel.archives-ouvertes.fr/tel-00135890.

Full text
Abstract:
CETTE THÈSE S'INTÉRESSE À DEUX GRANDES QUESTIONS DES PROCESSUS PONCTUELS SPATIAUX: LES ASPECTS DISTRIBUTIONNELS DES ESPACEMENTS ET L'ESTIMATION DE L'INTENSITÉ D'UN PROCESSUS PONCTUEL BRUITÉ.LA PREMIÈRE PARTIE CONCERNE LA CONSTRUCTION DE TESTS D'HOMOGÉNÉITÉ SPATIALE BASÉS SUR LES ESPACEMENTS. ENSUITE NOUS NOUS INTÉRESSONS À LA RECHERCHE D'AGRÉGATS (ZONES DE FORTE INTENSITÉ) À L'AIDE DE CES MEMES ESPACEMENTS. LA DEUXIÈME QUESTION EST ELLE TRAITÉE PAR L'INTRODUCTION D'UN ESTIMATEUR À NOYAU PRENANT EN COMPTE À LA FOIS L'INCERTITUDE SUR LES LOCALISATIONS DES ÉVÉNEMENTS ET L'OBSERVATION SUR UN DOMAINE LIMITÉ.
APA, Harvard, Vancouver, ISO, and other styles
7

Faye, Papa Abdoulaye. "Planification et analyse de données spatio-temporelles." Thesis, Clermont-Ferrand 2, 2015. http://www.theses.fr/2015CLF22638/document.

Full text
Abstract:
La Modélisation spatio-temporelle permet la prédiction d’une variable régionalisée à des sites non observés du domaine d’étude, basée sur l’observation de cette variable en quelques sites du domaine à différents temps t donnés. Dans cette thèse, l’approche que nous avons proposé consiste à coupler des modèles numériques et statistiques. En effet en privilégiant l’approche bayésienne nous avons combiné les différentes sources d’information : l’information spatiale apportée par les observations, l’information temporelle apportée par la boîte noire ainsi que l’information a priori connue du phénomène. Ce qui permet une meilleure prédiction et une bonne quantification de l’incertitude sur la prédiction. Nous avons aussi proposé un nouveau critère d’optimalité de plans d’expérience incorporant d’une part le contrôle de l’incertitude en chaque point du domaine et d’autre part la valeur espérée du phénomène
Spatio-temporal modeling allows to make the prediction of a regionalized variable at unobserved points of a given field, based on the observations of this variable at some points of field at different times. In this thesis, we proposed a approach which combine numerical and statistical models. Indeed by using the Bayesian methods we combined the different sources of information : spatial information provided by the observations, temporal information provided by the black-box and the prior information on the phenomenon of interest. This approach allowed us to have a good prediction of the variable of interest and a good quantification of incertitude on this prediction. We also proposed a new method to construct experimental design by establishing a optimality criterion based on the uncertainty and the expected value of the phenomenon
APA, Harvard, Vancouver, ISO, and other styles
8

Chakroun, Hédia. "Concepts et techniques d'intégration du contexte spatial dans les modèles de pondération des données multisources." Sherbrooke : Université de Sherbrooke, 1998.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
9

Saby, Nicolas. "Distribution à l'échelle nationale des charactéristiques des sols et détection des changements. : Apport des bases de données géographiques, des techniques d’analyse spatiale et de la modélisation." Rennes, Agrocampus Ouest, 2009. http://www.theses.fr/2009NSARB026.

Full text
Abstract:
L’objectif de ce travail de thèse est d’étudier l’apport des bases de données géographiques dans la surveillance la qualité des sols au niveau d’un pays. Les bases de dodnnées utilisées sont issues des programmes nationaux français de surveillance. Nous avons choisi d’aborder cette question par le choix de techniques d’analyses statistiques spatiales et temporelles adaptées au type d’échantillonnage et à la nature de l’information à explorer. Parmi l’ensemble des variables mesurables sur le sol, nous nous sommes focalisées sur des propriétés du sol à fort impact environnemental que sont les teneurs en carbonne et en éléments traces métalliques. Nos résultats montrent qu’il est possible de produire des cartographies nationales de ces propriétés, de mettre en évidence les gradients importants, et de les attribuer à des processus naturels et anthropiques. Les évolutions temporelles majeures peuvent être détectées et expliquées. Nous soulevons les limites des dispositifs actuels et des techniques d’analyse spatiales employées et nous proposons des pistes futures pour la surveillance des sols
The aim of this work is to assess the potential of spatial databases to monitor soil quality at a national level. Data were collected in the framework of French National Programmes. To adress this issue we show that the spatio-temporal statistical analyses must be adapted to the sampling design and to the nature of the information studied. Among the set of the possible soil variables, this work focused on some of those having a high environmental impact : the organic carbon content and the content of same trace elements. Our results show the possiblity to map soil properties at national scale, to reveal strong spatial structures and, to attribute them to different natural and artifcial processes. Large temporal trends could also be detected and explained. I discuss the limitation of the present designs and of the statistical analyses we conducted and i propose further research developpements for monitoring of soil quality
APA, Harvard, Vancouver, ISO, and other styles
10

Souris, Marc. "La construction d'un système d'information géographique : principes et algorithmes du système Savane." La Rochelle, 2002. http://www.theses.fr/2002LAROS087.

Full text
Abstract:
Cette thèse présente un travail de recherche et de développement informatique visant à apporter une réponse concrète à la question suivante : comment construire un système d'information géographique complet et opérationnel, en suivant les principes théoriques de la gestion de données et en les adaptant aux données géographiques ? Son objet principal est de montrer sur un exemple concret l'implication des principes théoriques de la gestion de données dans la réalisation pratique d'un logiciel de type SIG. Elle présente l'architecture et la réalisation d'un système d'information géographique opérationnel le système SAVANE - à partir des nombreux concepts, techniques et algorithmes nécessaires à cette réalisation. Ce travail de recherche a été effectué dans le cadre de l'IRD (Institut de recherche pour le développement). Le mémoire reprend l'ensemble des travaux réalisés, en décrivant chaque aspect nécessaire à la construction du système et en expliquant les choix effectués, selon la démarche que nous avons suivie tout au long de ce travail, à savoir : - exposer avec précision tous les aspects concernant la définition et l'utilisation de l'information géographique ; - exposer et développer les principes de la gestion de données (modèle relationnel et objet) pour les étendre aux données localisées ; - développer ou mettre en oeuvre les algorithmes nécessaires à l'implantation de ces principes dans un système d'information ; - construire un système opérationnel, mettant en oeuvre les principes théoriques et répondant à un cahier des charges fonctionnel couvrant l'ensemble des besoins nécessaires à l'utilisation de ce système dans le cadre de projets appliqués, notamment en géographie et dans le cadre de la recherche pour le développement. . L'exposé des méthodes est souvent suivi de la présentation d'algorithmes et de leur réalisation concrète. Des références renvoient fréquemment le lecteur à une annexe contenant l'implantation effective des structures et des algorithmes
This thesis present a work in computer sciences and software development. This purpose is to try to give an answer to the question : " How to build a full geographic information system following the principles of database management adapting it to geographical data ? ". We try to show with the full example of the Savane system how general theory of geographical data and algorithms in computational geometry may be use to build a GIS software. This work is part of a research program from the IRD (Institut de Recherche pour le Développement). The thesis expose all the architecture, methods and algorithms of the system, trying to explain all the options of the system building, in the different areas : definition and utilization of geographical information ; principles of database management systems and extension to geographical data ; algorithms to use to the implementation of this principles in an information system ; construction of an operational system build from the theoretical principles and functional requirements for the use in projects in geography and research for the development
APA, Harvard, Vancouver, ISO, and other styles
11

Da, Silva Sébastien. "Fouille de données spatiales et modélisation de linéaires de paysages agricoles." Thesis, Université de Lorraine, 2014. http://www.theses.fr/2014LORR0156/document.

Full text
Abstract:
Cette thèse s'inscrit dans un partenariat entre l'INRA et l'INRIA et dans le champs de l'extraction de connaissances à partir de bases de données spatiales. La problématique porte sur la caractérisation et la simulation de paysages agricoles. Plus précisément, nous nous concentrons sur des lignes qui structurent le paysage agricole, telles que les routes, les fossés d'irrigation et les haies. Notre objectif est de modéliser les haies en raison de leur rôle dans de nombreux processus écologiques et environnementaux. Nous étudions les moyens de caractériser les structures de haies sur deux paysages agricoles contrastés, l'un situé dans le sud-Est de la France (majoritairement composé de vergers) et le second en Bretagne (Ouest de la France, de type bocage). Nous déterminons également si, et dans quelles circonstances, la répartition spatiale des haies est structurée par la position des éléments linéaires plus pérennes du paysage tels que les routes et les fossés et l'échelle de ces structures. La démarche d'extraction de connaissances à partir de base de données (ECBD) mise en place comporte différentes étapes de prétraitement et de fouille de données, alliant des méthodes mathématiques et informatiques. La première partie du travail de thèse se concentre sur la création d'un indice spatial statistique, fondé sur une notion géométrique de voisinage et permettant la caractérisation des structures de haies. Celui-Ci a permis de décrire les structures de haies dans le paysage et les résultats montrent qu'elles dépendent des éléments plus pérennes à courte distance et que le voisinage des haies est uniforme au-Delà de 150 mètres. En outre différentes structures de voisinage ont été mises en évidence selon les principales orientations de haies dans le sud-Est de la France, mais pas en Bretagne. La seconde partie du travail de thèse a exploré l'intérêt du couplage de méthodes de linéarisation avec des méthodes de Markov. Les méthodes de linéarisation ont été introduites avec l'utilisation d'une variante des courbes de Hilbert : les chemins de Hilbert adaptatifs. Les données spatiales linéaires ainsi construites ont ensuite été traitées avec les méthodes de Markov. Ces dernières ont l'avantage de pouvoir servir à la fois pour l'apprentissage sur les données réelles et pour la génération de données, dans le cadre, par exemple, de la simulation d'un paysage. Les résultats montrent que ces méthodes couplées permettant un apprentissage et une génération automatique qui capte des caractéristiques des différents paysages. Les premières simulations sont encourageantes malgré le besoin d'un post-Traitement. Finalement, ce travail de thèse a permis la création d'une méthode d'exploration de données spatiales basée sur différents outils et prenant en charge toutes les étapes de l'ECBD classique, depuis la sélection des données jusqu'à la visualisation des résultats. De plus, la construction de cette méthode est telle qu'elle peut servir à son tour à la génération de données, volet nécessaire pour la simulation de paysage
This thesis is part of a partnership between INRA and INRIA in the field of knowledge extraction from spatial databases. The study focuses on the characterization and simulation of agricultural landscapes. More specifically, we focus on linears that structure the agricultural landscape, such as roads, irrigation ditches and hedgerows. Our goal is to model the spatial distribution of hedgerows because of their role in many ecological and environmental processes. We more specifically study how to characterize the spatial structure of hedgerows in two contrasting agricultural landscapes, one located in south-Eastern France (mainly composed of orchards) and the second in Brittany (western France, \emph{bocage}-Type). We determine if the spatial distribution of hedgerows is structured by the position of the more perennial linear landscape features, such as roads and ditches, or not. In such a case, we also detect the circumstances under which this spatial distribution is structured and the scale of these structures. The implementation of the process of Knowledge Discovery in Databases (KDD) is comprised of different preprocessing steps and data mining algorithms which combine mathematical and computational methods. The first part of the thesis focuses on the creation of a statistical spatial index, based on a geometric neighborhood concept and allowing the characterization of structures of hedgerows. Spatial index allows to describe the structures of hedgerows in the landscape. The results show that hedgerows depend on more permanent linear elements at short distances, and that their neighborhood is uniform beyond 150 meters. In addition different neighborhood structures have been identified depending on the orientation of hedgerows in the South-East of France but not in Brittany. The second part of the thesis explores the potential of coupling linearization methods with Markov methods. The linearization methods are based on the use of alternative Hilbert curves: Hilbert adaptive paths. The linearized spatial data thus constructed were then treated with Markov methods. These methods have the advantage of being able to serve both for the machine learning and for the generation of new data, for example in the context of the simulation of a landscape. The results show that the combination of these methods for learning and automatic generation of hedgerows captures some characteristics of the different study landscapes. The first simulations are encouraging despite the need for post-Processing. Finally, this work has enabled the creation of a spatial data mining method based on different tools that support all stages of a classic KDD, from the selection of data to the visualization of results. Furthermore, this method was constructed in such a way that it can also be used for data generation, a component necessary for the simulation of landscapes
APA, Harvard, Vancouver, ISO, and other styles
12

Guillot, Gilles. "Modélisation statistique des champs de pluie sahéliens : application à leur désagrégation spatiale et temporelle." Université Joseph Fourier (Grenoble), 1998. http://www.theses.fr/1998GRE10226.

Full text
Abstract:
La resolution couramment atteinte par les donnees pluviometriques derivees des mesures satellitales ou des sorties de modeles de circulation generale atmospherique (m. C. G. A) sur la zone sahelienne, est de l'ordre de 1 1, sur des pas de temps correspondant a la duree de vie des systemes convectifs. Ces echelles sont incompatibles avec les echelles de la modelisation hydrologique, particulierement dans cette region, ou les pluies principalement d'origine convective, presentent une forte variabilite spatiale et temporelle. Le travail presente a consiste a developper et valider un modele des champs de pluie saheliens, permettant d'utiliser l'information de grande echelle fournie par un satellite ou un m. C. G. A, pour simuler de champs de pluie a une plus haute resolution. Les bases de ce modele proviennent de l'analyse du jeu de donnees de l'experience epsat-niger. Il s'appuie sur trois composantes : (i) une representation geostatistique des champs spatiaux au pas de temps de l'evenement, (ii) un modele de la cinematique des systemes convectifs, (iii) un modele statistique a quatre parametres des hyetogrammes. Ce modele est developpe dans un cadre mathematique qui maintient une coherence entre les proprietes observees a differentes echelles. De ce fait, il peut etre utilise pour realiser des simulations conditionnees par des valeurs pluviometriques de grande echelle.
APA, Harvard, Vancouver, ISO, and other styles
13

Terrier, Régis. "Calorimétrie et recherche de sources en astronomie gamma spatiale." Paris 7, 2002. https://tel.archives-ouvertes.fr/tel-00002636.

Full text
APA, Harvard, Vancouver, ISO, and other styles
14

Ternynck, Camille. "Contributions à la modélisation de données spatiales et fonctionnelles : applications." Thesis, Lille 3, 2014. http://www.theses.fr/2014LIL30062/document.

Full text
Abstract:
Dans ce mémoire de thèse, nous nous intéressons à la modélisation non paramétrique de données spatiales et/ou fonctionnelles, plus particulièrement basée sur la méthode à noyau. En général, les échantillons que nous avons considérés pour établir les propriétés asymptotiques des estimateurs proposés sont constitués de variables dépendantes. La spécificité des méthodes étudiées réside dans le fait que les estimateurs prennent en compte la structure de dépendance des données considérées.Dans une première partie, nous appréhendons l’étude de variables réelles spatialement dépendantes. Nous proposons une nouvelle approche à noyau pour estimer les fonctions de densité de probabilité et de régression spatiales ainsi que le mode. La particularité de cette approche est qu’elle permet de tenir compte à la fois de la proximité entre les observations et de celle entre les sites. Nous étudions les comportements asymptotiques des estimateurs proposés ainsi que leurs applications à des données simulées et réelles.Dans une seconde partie, nous nous intéressons à la modélisation de données à valeurs dans un espace de dimension infinie ou dites "données fonctionnelles". Dans un premier temps, nous adaptons le modèle de régression non paramétrique introduit en première partie au cadre de données fonctionnelles spatialement dépendantes. Nous donnons des résultats asymptotiques ainsi que numériques. Puis, dans un second temps, nous étudions un modèle de régression de séries temporelles dont les variables explicatives sont fonctionnelles et le processus des innovations est autorégressif. Nous proposons une procédure permettant de tenir compte de l’information contenue dans le processus des erreurs. Après avoir étudié le comportement asymptotique de l’estimateur à noyau proposé, nous analysons ses performances sur des données simulées puis réelles.La troisième partie est consacrée aux applications. Tout d’abord, nous présentons des résultats de classification non supervisée de données spatiales (multivariées), simulées et réelles. La méthode de classification considérée est basée sur l’estimation du mode spatial, obtenu à partir de l’estimateur de la fonction de densité spatiale introduit dans le cadre de la première partie de cette thèse. Puis, nous appliquons cette méthode de classification basée sur le mode ainsi que d’autres méthodes de classification non supervisée de la littérature sur des données hydrologiques de nature fonctionnelle. Enfin, cette classification des données hydrologiques nous a amené à appliquer des outils de détection de rupture sur ces données fonctionnelles
In this dissertation, we are interested in nonparametric modeling of spatial and/or functional data, more specifically based on kernel method. Generally, the samples we have considered for establishing asymptotic properties of the proposed estimators are constituted of dependent variables. The specificity of the studied methods lies in the fact that the estimators take into account the structure of the dependence of the considered data.In a first part, we study real variables spatially dependent. We propose a new kernel approach to estimating spatial probability density of the mode and regression functions. The distinctive feature of this approach is that it allows taking into account both the proximity between observations and that between sites. We study the asymptotic behaviors of the proposed estimates as well as their applications to simulated and real data. In a second part, we are interested in modeling data valued in a space of infinite dimension or so-called "functional data". As a first step, we adapt the nonparametric regression model, introduced in the first part, to spatially functional dependent data framework. We get convergence results as well as numerical results. Then, later, we study time series regression model in which explanatory variables are functional and the innovation process is autoregressive. We propose a procedure which allows us to take into account information contained in the error process. After showing asymptotic behavior of the proposed kernel estimate, we study its performance on simulated and real data.The third part is devoted to applications. First of all, we present unsupervised classificationresults of simulated and real spatial data (multivariate). The considered classification method is based on the estimation of spatial mode, obtained from the spatial density function introduced in the first part of this thesis. Then, we apply this classification method based on the mode as well as other unsupervised classification methods of the literature on hydrological data of functional nature. Lastly, this classification of hydrological data has led us to apply change point detection tools on these functional data
APA, Harvard, Vancouver, ISO, and other styles
15

Le, Gall Caroline. "Algorithmes de détection de ruptures et statistiques spatiales : applications au diagnostic de défaillances dans un procédé de fabrication." Toulouse 3, 2002. http://www.theses.fr/2002TOU30176.

Full text
Abstract:
L'amélioration continue du rendement d'une chaîne de fabrication, c'est-à-dire du rapport du nombre d'unités fonctionnelles sur le nombre total d'unités produites, constitue un enjeu important pour la compétitivité de l'outil de production. Dans le contexte de la fabrication de circuits intégrés, l'introduction de nouvelles technologies de plus en plus complexes rend les outils statistiques traditionnellement utilisés insuffisants pour la prévention de toutes les défaillances du procédé. Dès lors, de nouvelles techniques statistiques sont développées pour améliorer ou remplacer certains outils existants mais aussi pour en créer de nouveaux. Ainsi, un nouveau processus d'amélioration du rendement est proposé. Lorsqu'une baisse du rendement est observée, il s'agit dans un premier temps de la caractériser. Cette caractérisation découle d'une analyse spatiale des plaquettes de silicium sur lesquelles sont produits les circuits intégrés. .
The continuous improvement of the yield of a production line is a significant goal for the competitiveness of the facility. In the context of integrated circuit manufacturing, the introduction of new increasingly complex technologies makes the statistical tools traditionally used insufficient to prevent process failures. Consequently, new statistical techniques have been developed to improve or replace some existing tools and also to form some new ones. Thus, an improvement process is proposed. When a decrease of yield is observed, it first needs to be characterized. The characterization is achieved by a spatial analysis of the silicon wafers on which the integrated circuits are manufactured. . .
APA, Harvard, Vancouver, ISO, and other styles
16

Lemort, Sophie. "Analyse spatiale intrasite de l'habitat : méthodologie, procédures et études de cas : les sites protohistohistoriques de Bucy-le-Long "la Foselle" 'Aisne, Néolithique ancien), et de Changis-sur-Marne "les Pétreaux" (Seine-et-Marne, Âges du Bronze et du Fer)." Thesis, Paris 1, 2018. http://www.theses.fr/2018PA01H079.

Full text
Abstract:
L’analyse spatiale intrasite de l’habitat ne permet pas de recourir à un modèle général d’étude, applicable à n’importe quel site archéologique. Pourtant, plusieurs d’entre eux ont des profils semblables d’implantation de l’habitat. Peut-on donc envisager de rechercher des protocoles d’analyse qui soient transposables sur des sites d’habitat couramment rencontrés ? C’est l’objet de la présente étude à partir d’une démarche exploratoire, sur deux sites d’habitat protohistoriques. Sur le site rubané de Bucy-le-Long « la Fosselle », l’analyse se concentre sur la distribution spatiale des vestiges mobiliers au sein d’unités architecturales comparables. L’analyse des données est employée pour déterminer les différents paramètres d’étude. Le potentiel informatif des unités d’habitation, établi selon des critères morphologiques et taphonomiques, est évalué et confronté au potentiel archéologique, déterminé à partir de la richesse du mobilier et des différentes catégories d’artefacts. L’analyse globale intrasite est envisagée en regroupant les mobiliers par catégorie fonctionnelle et pour mettre en évidence des assemblages significatifs de vestiges selon les habitations. Ils permettent ainsi de caractériser et sectoriser les ensembles signifiants d’activités vivrières et d’activités techniques à l’échelle du site, à partir d’un partitionnement des maisons. Le site de Changis-sur-Marne « les Pétreaux » connaît une longue occupation du Bronze final à la Tène ancienne, ce qui rend la lecture des implantations difficiles à démêler. L’analyse spatiale est tout d’abord tentée sur des groupes de structures établies lors des travaux de terrain. Puis, la répartition du mobilier est étudiée à plusieurs échelles d’observation. Cependant, il apparaît que ces premiers découpages ne reflètent pas des groupements d’établissements ruraux significatifs. Un partitionnement des structures au sein d’entités spatiales plus restreintes est alors envisagé à partir de la recherche d’agrégats, mis en évidence par l’analyse spatiale de semis de points. La dynamique d’occupation du site est de ce fait plus aisément perceptible. Les deux études de cas sont pour finir confrontées à d’autres études spatiales menées sur des sites d’habitat. Il apparaît qu’aux côtés des vestiges mobiliers très régulièrement pris pour référence dans l’analyse spatiale intrasite de l’habitat, les vestiges immobiliers trouvent toutes leurs places
Intra-site spatial analysis of settlement does not allow use of general model applicable to any archaeological site. However some items have similar habitat settlement profiles. Can we consider looking for protocols transposable to usual settlement sites? The purpose of this study is based on an exploratory approach, on two protohistoric settlements. On the Bandkeramik site of Bucy-le-Long "la Fosselle", the analysis focuses on spatial distribution of the material remains within comparable architectural units. Data analysis is used to determine different study parameters. The informative potential of housing units, established according to morphological and taphonomic criteria, is evaluated and compared with the archaeological potential, determined from the richness of the furniture and the different categories of artifacts. The global intra-site analysis is made by grouping the furniture by functional category, to highlight significant assemblages of vestiges according to the dwellings. They allow to characterize and to segment the significant sets of food and technical activities at the site scale, based on houses partitioning. The site of Changis-sur-Marne "les Pétreaux" having suffered a long occupation from the Late bronze to the Early la Tène period, lead to a difficult reading of the settlements. During excavation spatial analysis is tried on structures groups. Then, the distribution of furniture is studied at various observation scales. However, those first divisions do not reflect groups of obvious rural settlements. A partitioning of the structures within smaller spatial entities is then engaged starting from the search for aggregates, highlighted by the space-time hot spot analysis. The dynamic of occupation of the site is thus more easily perceptible. Two case studies are finally challenged with other spatial studies about settlement sites. In addition to the material remains commonly seen as reference in the intra-site spatial analysis of settlement, archaeological structures find all their places
APA, Harvard, Vancouver, ISO, and other styles
17

Durango, Juan. "Impacts environnementaux de l'exploitation pétrolière en Amazonie équatorienne : de l'étude spatiale de la vulnérabilité à l'évaluation du risque." Thesis, Toulouse 3, 2019. http://www.theses.fr/2019TOU30005.

Full text
Abstract:
L'Équateur est le 5ème producteur de pétrole d'Amérique latine. La plupart des réserves se trouvent sous le nord-est de l'Amazonie équatorienne (NEA), représentant 15% de l'ensemble du pays, mais englobant une grande diversité biologique et culturelle. La production de pétrole et de gaz génère des déchets toxiques susceptibles de polluer l'environnement. La méthodologie a été définie pour évaluer les aléas et la vulnérabilité environnementale en tant que composantes indépendantes du risque, en utilisant des méthodes indicielles et des outils de hiérarchisation. Ensuite, ils ont été combinés à l'aide de méthodes de superposition spatiale. La qualité des données publiques utilisées dans cette étude a constitué une difficulté. Dans ce contexte, le premier objectif était de déterminer les volumes d'hydrocarbures déversés accidentellement dans des blocs pétroliers bien documentés. Ensuite, des volumes de déversements estimés ont été attribués aux blocs mal documentés pour obtenir une carte homogène. Le deuxième objectif consistait à cartographier les principales émissions atmosphériques associées aux torchères, c'est-à-dire les gaz à effet de serre (CO2, CH4) et les particules de noir de carbone (BC). Le troisième objectif était d'évaluer la vulnérabilité potentielle du patrimoine naturel à l'échelle régionale à l'aide de proxys tels que le statut de protection et l'occupation des sols. Le quatrième objectif consistait à illustrer l'approche proposée pour l'évaluation des risques en évaluant le potentiel de contamination des eaux souterraines à partir des fosses de stockage de résidus d'hydrocarbures. Les principaux résultats indiquent 10 000,2 t (909,1 t.an-1 ; SD = 1219,5) de pétrole déversé accidentellement dans la NEA durant la période 2001-2011, selon les événements enregistrés. Cependant, une augmentation de 54.8% a été constatée lors de l'extrapolation des taux de déversement des blocs pétroliers bien documentés aux blocs mal documentés. La précision des prévisions spatialisées a été de 32 à 97%. Les gaz brûlés au cours de la période 2003-2012 se sont élevés à 7,6 Gm3 (760 Mm3.an-1), ce qui correspond à des valeurs allant de 3,7 à 4,5 kt.an-1 BC. Les hydrocarbures dans les fosses de stockage ont été estimés à 49 436,4 t. Plusieurs cartes résultent de cette thèse. Les émissions spatialisées indiquent que les déversements et les émissions des torchères sont plus fréquents dans les agglomérations de Joya de los Sachas, Dayuma et Shushufindi. Les cartes de vulnérabilité du patrimoine naturel indiquent que 42% de la surface du territoire est hautement vulnérable, à l'est de la zone d'étude. La vulnérabilité des eaux souterraines est faible à moyenne dans la plupart des zones. En outre, l'exemple envisagé pour l'évaluation des risques liés aux eaux souterraines et aux fosses non étanchéifiées indique que les impacts potentiels les plus importants sont localisés au niveau des agglomérations de Nueva Loja, Tarapoa et Shushufindi. La qualité des données publiques disponibles a été jugée acceptable. En comparant nos estimations des émissions atmosphériques avec d'autres estimations indépendantes, une différence de 2,5 fois au maximum a été trouvée. La précision de la répartition spatiale des déversements accidentels a révélé une méthodologie prometteuse pour améliorer la cartographie des aléas. L'évaluation de la vulnérabilité a montré que les composantes du patrimoine naturel permettent de construire des indices de vulnérabilité à l'échelle régionale, l'occupation des sols étant significativement corrélée à la richesse spécifique et les aires protégées étant conservées efficacement sur le long terme, véhiculant ainsi une information sur l'intégrité écologique. En conclusion, les estimations et les cartes obtenues peuvent s'avérer utiles pour la surveillance de la sécurité et la sûreté des installations, la responsabilisation des institutions publiques et l'aménagement du territoire afin de réduire les risques futurs
Ecuador is the 5th oil producer in Latin America. Most of crude oil reserves lie beneath the north-eastern Ecuadorian Amazon (NEA), representing 15% of the entire country, yet encompassing high biodiversity and cultural heritage. Crude oil and gas production generate toxic wastes potentially polluting the environment. The methodology was set to evaluate hazards and environmental vulnerability, using score indexes and rankings, as independent components of risk. Then, they were combined using spatial overlay methods. An observed hindrance for risk analysis was the quality of public data that were used in this study. In this context, the first aim was to determine accidental oil spill volumes in well-documented oil blocks. Then, putative spill volumes were allocated to poorly-documented oil blocks to obtain a homogeneous map. The second aim was to map key atmospheric emissions associated to gas flaring, i.e., greenhouse gas (CO2, CH4) and black carbon (BC) particles. The third aim was to assess the potential vulnerability of natural heritage using regional scale proxies such as protection status and land use. Finally, the fourth aim was to exemplify the presented risk assessment approach by evaluating total petroleum hydrocarbons (TPH) potentially flowing to groundwater from oil pits. Main results indicate 10,000.2 t (909.1 t.yr-1; SD = 1,219.5) oil spilled in the NEA during the 2001-2011 period (11 years), according to recorded events. However, a 54.8% increase was found when extrapolating spill rates from well-documented oil blocks to poorly-documented ones. Spatial prediction accuracy ranged from 32 to 97%. Gas flared amounted to 7.6 Gm3 (760 Mm3.yr-1), equivalent to a range of 3.7 - 4.5 kt.yr-1 BC, during 2003-2012 lapse. Total petroleum hydrocarbons in unlined oil pits was estimated to 49,436.4 t. Several maps resulted from this thesis. Spatial emissions indicate spills and gas flaring are occurring at higher rates in settlements of Joya de los Sachas, Dayuma and Shushufindi. The natural heritage vulnerability maps indicated 42% of highly vulnerable surface at the most eastern side of the studied area. Groundwater vulnerability was low to medium in most areas; furthermore, the example considered for risk assessment of groundwater and unlined oil pits, indicated highest potential impacts in settlements of Nueva Loja, Tarapoa and Shushufindi. Publicly available data quality was found to be acceptable. For instance, when comparing airborne emission estimates with some other independent estimates only 2.5-fold difference was found at most. Spatial allocation accuracy of oil spills showed promising methodology for improving hazard mapping. Vulnerability assessment indicated natural heritage proxies to be suitable for building vulnerability indexes at regional scale as land use is significantly correlated to species richness, and protected areas are efficiently conserved in the long term, thus conveying some information on ecological integrity. Moreover, there was only 8.8% of spatial incongruence between the two proxies. Groundwater vulnerability mapping indicated gaps in knowledge that were discussed; some distance thresholds were proposed to select validation sites in future studies. In conclusion, estimates and maps obtained may be valuable for safety and security monitoring, accountability of public institutions and land use planning to lessen future risks
APA, Harvard, Vancouver, ISO, and other styles
18

Vannier, Clémence. "Observation et modélisation spatiale de pratiques agricoles territorialisées à partir de données de télédétection : application au paysage bocager." Phd thesis, Université Rennes 2, 2011. http://tel.archives-ouvertes.fr/tel-00651991.

Full text
Abstract:
Aujourd'hui l'environnement connaît des bouleversements fondamentaux dus en grande partie à l'action de l'homme sur les milieux. En effet, tandis que les phénomènes climatiques et biophysiques ont été pendant longtemps les moteurs principaux des transformations des surfaces terrestres, l'Homme est aujourd'hui à l'origine de la majeure partie des transformations qui affectent les écosystèmes terrestres. Ainsi, les pratiques des acteurs du territoire jouent un rôle fondamental sur les modifications de l'usage des sols, et par conséquent sur les écosystèmes environnementaux. L'intensification de l'agriculture entraîne une dégradation des milieux " naturels ", et de profonds changements dans les structures paysagères. Dans les régions bocagères, la gestion du réseau de haies joue un rôle déterminant dans la conservation des écosystèmes, de la biodiversité tant faunistique que floristique et également sur la qualité de l'eau, des sols, ... Cette thèse, centrée sur les haies bocagères, porte plus particulièrement sur l'identification de pratiques agricoles territorialisées et sur leur organisation spatio‐temporelle. Les objectifs poursuivis dans cette thèse sont d'étudier les pratiques agricoles effectuées sur les haies en Bretagne à travers leurs interactions avec les structures paysagères, et d'en modéliser le fonctionnement, afin de comprendre comment elles influencent la dynamique du paysage.L'identification et la caractérisation des pratiques agricoles ont été effectuées à partir de l'évaluation de différents types d'images de télédétection à haute et très haute résolution spatiale et de données laser aéroportées LiDAR, en utilisant une approche de classification contextuelle orientée‐objets. La modélisation des pratiques agricoles a été réalisée avec un modèle multi‐agents, afin de prendre en compte la dimension spatiale des jeux d'acteurs pour évaluer l'influence des pratiques agricoles sur l'évolution du réseau de haies. Les résultats de l'observation du réseau bocager à partir des données de télédétection mettent en avant leur complémentarité : la caractérisation de la continuité des haies à un niveau fin est rendue possible grâce aux images à très haute résolution spatiale, tandis que la détermination et la cartographie des pratiques agricoles à l'échelle de l'arbre peut être appréhendée à partir de données laser aéroportées de type LiDAR. L'observation et la caractérisation du réseau de haies ont permis de déterminer l'arrangement spatial des structures boisées en prenant en compte non plus seulement la présence des éléments mais également leur emprise dans le paysage et leur agencement au sein de la dynamique temporelle des successions culturales. Le modèle multi‐agents développé a permis d'analyser l'influence des pratiques agricoles sur la dynamique du paysage, et de déterminer l'importance de décisions prises au niveau local sur l'évolution du réseau de haies à une échelle supérieure
APA, Harvard, Vancouver, ISO, and other styles
19

Delaunay, Marie. "Approche géographique appliquée au Réseau National de Vigilance et de Prévention des Pathologies Professionnelles (RNV3P)." Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAS031/document.

Full text
Abstract:
Le domaine de la santé au travail est complexe car il associe de nombreuses données de différentes natures (secteurs d'activité, métiers, expositions, pathologies), disponibles à des échelles emboitées (entreprises, bassins d'activité, zones d'emploi, régions, etc) et appartenant à différents partenaires (assureurs, préventeurs, systèmes de surveillance). Ces multiples sources de données complémentaires, formalisées ou non, sont toujours analysées de manière indépendante, en ignorant notamment la dimension géographique y étant associée (territoires d'activités sous-jacents).L'objectif de notre travail est de considérer une de ces sources de données, le rnv3p (Réseau National de Vigilance et de Prévention des Pathologies Professionnelles), comme un objet géographique. Grâce à différentes méthodes (explicitées Partie 1) et outils géomatiques, et la prise en compte de la population active sous-jacente, c'est d'abord une description du réseau en termes de recrutement, zones d'ombre et zones de capture préférentielle qui est faite (Partie 2). Dans un second temps, c'est la confrontation de cette base à d'autres sources de données décrivant des maladies professionnelles (en particulier indemnisées) qui est analysée au travers d'approches par secteur d'activité et pathologie (Partie 3). Enfin, des préconisations concernant le développement d'un outil cartographique adossé à la base rnv3p à des fins de vigilance et au service des différents acteurs en santé travail ont été faites (Partie 4).Mots clés: santé-travail, pathologies professionnelles, réseau de surveillance, Systèmes d'Information Géographiques (SIG), analyse spatiale
The field of occupational health is complex because it combines many different types of data (activity sector, occupations, risk exposures, diseases), available at nested scales (communes, activity territories, employment areas, regions, etc.) and from different partners (insurers, stakeholders, monitoring systems). These multiple sources of additional data, formalized or not, are always analysed independently, ignoring in particular the geographic dimension associated therewith (underlying activities territories).The aim of our work is to consider one of these data sources, the rnv3p (French National Occupational Diseases Surveillance and Prevention Network), as a spatial object. Through different methods (explained Part 1) and geomatics tools, and taking into account the underlying workforce, it is primarily a description of the network in terms of recruitment, shadow and preferential recruitment areas that is made (Part 2). Secondly, it is the confrontation of this database to other data sources describing occupational diseases (especially compensated one) which is analyzed through approaches by industry and pathology (Part 3). Finally, recommendations were made regarding the development of a mapping tool, built for the rnv3p database for vigilance purposes and helping various occupational health stakeholders (Part 4).Key words: occupational health, work related diseases, surveillance network, Geographic Information System (GIS), spatial analysis
APA, Harvard, Vancouver, ISO, and other styles
20

Occelli, Florent. "Systèmes d’Information Géographique et Lien Environnement – Santé (SIGLES) : contribution au développement d'outils cartographiques d'aide à la décision face aux risques sanitaires liés à l'environnement." Thesis, Lille 2, 2014. http://www.theses.fr/2014LIL2S043/document.

Full text
Abstract:
La question des inégalités environnementales et sociales de santé (IESS) à l’échelle des territoires est rapportée à deux dimensions cumulatives : un niveau d’exposition des populations à un environnement de vie dégradé et un niveau de vulnérabilité face à ces facteurs de risques, capables d’affecter la santé. Ces travaux de recherche concernent les Systèmes d’Information Géographique (SIG) appliqués au domaine de la santé environnementale. Ils ont pour objectifs généraux la caractérisation de la qualité des milieux environnementaux et l’évaluation des IESS. L’atteinte de ces objectifs passe préalablement par la récolte, la genèse et la mise en forme de bases de données environnementales spatialisées. Ces bases issues de la surveillance physico-chimique et de la biosurveillance des milieux sont ensuite cartographiées à l'aide des outils SIG, notamment les méthodes géostatistiques d’interpolation spatiale. En parallèle, les disparités spatiales d'incidence de pathologies sont étudiées grâce à des méthodes de cartographie des maladies (Ratios d'Incidence Standardisés : SIR) et de détection de clusters atypiques d'évènements (statistique de scan) mises en œuvre sur la base de registres de maladies. Finalement des études écologiques spatialisées sont élaborées afin de rapprocher les cartographies environnementales générées aux indicateurs sanitaires et socio-économiques. Ces travaux s’attachent à répondre à la question « les populations présentant un état de santé dégradé vivent-elles dans un environnement dégradé ? » Ce questionnement a été étudié à travers trois axes de recherche. Le premier concerne la caractérisation de l’imprégnation de l’environnement par les éléments traces métalliques (ETM) et l’évaluation des IESS à fine résolution sur trois bassins de vie de la région Nord-Pas de Calais (NPdC). Cette recherche est menée à partir de mesures d’imprégnations biologiques réalisées à la fois chez des lichens épiphytes et chez l’Homme et d’un indicateur de défaveur localisé. Les ETM mesurés ont été considérés de manière individuelle, mais également de manière globale à travers le développement d’un indice intégré multimétallique, afin d’exprimer le niveau d’imprégnation général par plusieurs métaux. Des inégalités environnementales ont été mises en évidence à l’échelle des quartiers du bassin de Dunkerque. Nos résultats supposent également l’implication de l’environnement dans l’imprégnation des populations pour certains ETM.Dans le deuxième axe, nous avons mis en évidence des disparités spatiales d’incidence de l’insuffisance rénale chronique terminale entre les cantons du NPdC et souligné l’implication du statut socio-économique dans l’apparition de ces disparités, contrairement à d’autres facteurs (diabète, maladies cardiovasculaires, pratiques médicales). Seule une partie des disparités de cette pathologie est aujourd’hui expliquée. Il est donc nécessaire de poursuivre sur le rôle des contaminants de l’environnement. Enfin, le troisième axe s’intéresse à l’analyse spatiale et spatio-temporelle de contaminations des eaux souterraines par les ETM, en vue d’identifier de potentiels facteurs de risques environnementaux des maladies inflammatoires chroniques de l’intestin. La réalisation de ces travaux s’appuie sur plusieurs collaborations établies avec le Réseau REIN, le Registre EPIMAD et des équipes de recherche (EA4483 et EA2694 Université Lille 2, TVES EA4477 ULCO).A la suite de ces travaux de thèse, les perspectives de recherche sont de poursuivre le développement d’indicateurs intégrés d’exposition aux contaminations multiples des milieux environnementaux. Les résultats montrent également un manque de renseignement des bases de données environnementales par rapport aux registres de santé. Un travail est donc nécessaire afin de définir le contenu de ces bases, nécessaire pour caractériser la qualité des milieux et faciliter l’étude de l’interaction de l’Homme avec son environnement
Environmental and social inequalities in health (ESIH) over territories are related to two cumulative dimensions: populations exposed to their living poor quality environment and the vulnerability of these populations to the environmental risk factors, which can affect health. This research deals with the Geographic Information Systems (GIS) applied to the field of environmental health. General purposes are the characterization of environmental media quality and the assessment of ESIH.Achieving these objectives requires a first step of harvest, genesis and formatting spatialized environmental databases. Such data are resulting from physico-chemical monitoring and biomonitoring. They were then mapped using GIS tools, including geostatistical spatial interpolation methods. On the over hand, spatial variability in the incidence of diseases were investigated using disease mapping methods (Standardized Incidence Ratios: SIR) and the detection of atypical clusters of events (scan statistics), which are based on disease registries. Finally, geographical ecological studies are developed to associate the environmental maps generated to health and socio-economic status. Thus, this work aims to answer the question \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"do people with poor state of health live in a poor quality environment?\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\" This question has been studied through three main researches.The first relates the characterization of trace elements burdens in the environment and the assessment of ESIH on neighborhood scale, over three territories in the Nord-Pas de Calais (NPdC) region. This research is conducted from measurements of biological burdens performed both in epiphytic lichens and humans and from a localized index of deprivation. The measured metals were considered individually, but also holistically by developing an integrated multimetallic index, in order to describe the general status of environmental pollution by metals. Environmental inequalities were observed on neighborhood scale in Dunkerque. Our results assume that trace elements burdens in populations are affected by environmental burdens.In our second research we revealed spatial disparities in the incidence of end stage renal disease (ESRD) on small area in the NPdC. Unlike other factors (diabetes, cardiovascular disease, medical practices), we highlighted the role of socio-economic status in the occurrence of such disparities. Only a part of the ESRD variability is currently explained. It is therefore necessary to focus on the environmental hypothesis.The third research focuses on the spatial and spatio-temporal analysis of groundwater contamination by trace elements, in order to identify potential environmental risk factors in the incidence of chronic inflammatory bowel disease.This work is based on several collaborations with the REIN network, the EPIMAD registry, and several research teams (EA4483 and EA2694 Université Lille 2, TVES EA4477 ULCO).Following this thesis, the research prospects are to pursue the development of integrated indicators to assess population exposure to the multiple environmental media contamination. The results also indicate a lack of information in environmental databases compared to health registries. A work is thus needed to define the content of such databases. These are necessary to characterize the environmental quality and to help the assessment of interaction between the populations and their living environment
APA, Harvard, Vancouver, ISO, and other styles
21

Bounekkar, Ahmed. "Analyse statistique de texture : autocorrélation spatiale et notion de contiguïté." Lyon 1, 1997. http://www.theses.fr/1997LYO10142.

Full text
Abstract:
L'évolution technologique de ces dernières années est fortement marquée par la grande quantité d'images produites et consommées. Un contenu sémantique à la fois riche et très souple explique cet avènement de l'image et l'intérêt croissant qui lui est témoigné. La texture est présente au sein d'un grand nombre d'images. Cette présence peut être forte (images aériennes, tissus et matières synthétiques,. . Ect), ou faible (objets et scènes naturellesn cellules et images microscopiques,. . . ) suivant le type d'image. Ce travail s'inscrit dans une démarche de reconnaissance de formes dans les images numériques inspirée de la réalité des diverses activités humaines. Nous nous intéressons ici aux méthodes d'analyse de textures destinées à caractériser du mieux possible une image de texture. Nous avons ainsi évalué l'intérêt d'une approche statistique où la priorité est donnée à la notion de proximité dans le domaine spatial. On considère qu'une forme est la combinaison d'une forme (géométrique), d'une texture, d'une composante liée au mode d'acquisition de l'image et d'un terme d'erreur. Seule la composante texture nous intéresse. Par conséquent, on utilisera une forme plus simplifiée du modèle dans laquelle ne figurent que les composantes textures pures à une erreur près. .
APA, Harvard, Vancouver, ISO, and other styles
22

Jaunâtre, Kévin. "Analyse et modélisation statistique de données de consommation électrique." Thesis, Lorient, 2019. http://www.theses.fr/2019LORIS520.

Full text
Abstract:
En octobre 2014, l'Agence De l'Environnement et de la Maîtrise de l'Energie (ADEME) en coopération avec l'entreprise ENEDIS (anciennement ERDF pour Électricité Réseau Distribution France) a démarré un projet de recherche dénommé "smart-grid SOLidarité-ENergie-iNovation" (SOLENN) avec comme objectifs l'étude de la maîtrise de la consommation électrique par un accompagnement des foyers et la sécurisation de l'approvisionnement électrique entre autres. Cette thèse s'inscrit dans le cadre des objectifs susnommés. Le projet SOLENN est piloté par l'ADEME et s'est déroulé sur la commune de Lorient. Le projet a pour but de mettre en œuvre une pédagogie pour sensibiliser les foyers aux économies d'énergie. Dans ce contexte, nous abordons une méthode d'estimation des quantiles extrêmes et des probabilités d'événements rares pour des données fonctionnelles non-paramétriques qui fait l'objet d'un package R. Nous proposons ensuite une extension du fameux modèle de Cox à hasards proportionnels et permet l'estimation des probabilités d'événements rares et des quantiles extrêmes. Enfin, nous donnons l'application de certains modèles statistique développés dans ce document sur les données de consommation électrique et qui se sont avérés utiles pour le projet SOLENN. Une première application est en liaison avec le programme d'écrêtement mené par ENEDIS afin de sécuriser le fonctionnement du réseau électrique. Une deuxième application est la mise en place du modèle linéaire pour étudier l'effet de plusieurs visites individuelles sur la consommation électrique
In October 2014, the French Environment & Energy Management Agency with the ENEDIS company started a research project named SOLENN ("SOLidarité ENergie iNovation") with multiple objectives such as the study of the control of the electric consumption by following the households and to secure the electric supply. The SOLENN project was lead by the ADEME and took place in Lorient, France. The main goal of this project is to improve the knowledge of the households concerning the saving of electric energy. In this context, we describe a method to estimate extreme quantiles and probabilites of rare events which is implemented in a R package. Then, we propose an extension of the famous Cox's proportional hazards model which allows the etimation of the probabilites of rare events. Finally, we give an application of some statistics models developped in this document on electric consumption data sets which were useful for the SOLENN project. A first application is linked to the electric constraint program directed by ENEDIS in order to secure the electric network. The houses are under a reduction of their maximal power for a short period of time. The goal is to study how the household behaves during this period of time. A second application concern the utilisation of the multiple regression model to study the effect of individuals visits on the electric consumption. The goal is to study the impact on the electric consumption for the week or the month following a visit
APA, Harvard, Vancouver, ISO, and other styles
23

Cappi, Alberto. "Analyse statistique de la distribution spatiale des galaxies et des amas." Paris 11, 1993. http://www.theses.fr/1993PA112104.

Full text
Abstract:
Le premier chapitre est consacré à un survol panoramique très synthétique du cadre théorique de formation des structures dans l'univers: il s'agit de comprendre quand et comment sont nées et se sont développées les structures que nous observons. Le deuxième chapitre passé en revue les principales techniques statistiques utilisées dans la littérature pour décrire d'une façon quantitative une distribution d'objets. Dans le même chapitre j'ai exposé les principaux modèles qui cherchent à reproduire la distribution des galaxies dans l'univers. Dans le troisième chapitre j'ai montré quels sont les problèmes dans l'analyse statistique qui peuvent être posés par les effets de sélection, en prenant un cas spécifique, la sélection des galaxies en fonction de leur diamètre ou de leur magnitude apparente. Le quatrième chapitre traite de l'analyse de la distribution spatiale des groupes de galaxies, et comment elle se situe par rapport aux galaxies et aux amas. J'ai voulu souligner les difficultés et les incertitudes des échantillons disponibles. Le cinquième chapitre est consacré à l'étude des relations qui peuvent décrire la structure des amas de galaxies. Il en résulte que les amas de galaxies tout comme les galaxies elliptiques ou les amas globulaires, se trouvent sur un plan fondamental. Dans le sixième chapitre j'ai traité de la distribution spatiale des amas et des indications qu'elle nous donne sur la structure à grande échelle. Dans le septième chapitre je présente mon travail d'observation d'amas proches et lointains, et plus en général les observations en cours ou futures et des moyens techniques grâce auxquels nous pourrons arriver à une compréhension des mécanismes des formations des structures et à une connaissance de l'univers voisin
APA, Harvard, Vancouver, ISO, and other styles
24

Kezouit, Omar Abdelaziz. "Bases de données relationnelles et analyse de données : conception et réalisation d'un système intégré." Paris 11, 1987. http://www.theses.fr/1987PA112130.

Full text
Abstract:
Les utilisateurs de bases de données relationnelles ont de plus en plus souvent tendance à attendre des Systèmes de Gestion de Bases de Données (SGBD) des fonctionnalités qui aillent plus loin que l'organisation le stockage et la restitution d'un ensemble de données. D'un autre côté, les utilisateurs de l'analyse statistique multidimensionnelle, qui traitent des tableaux de données rectangulaires, ont de gros problèmes de gestion de leurs données et les outils dont ils disposaient jusqu'à présent manquaient souvent de souplesse, voire de possibilités. Pour répondre à cette préoccupation, cette thèse propose de rapprocher bases de données relationnelles et analyse statistique multidimensionnelle à travers la réalisation d'un système intégrant un SGBD relationnel et un système d'analyse de données, et de montrer par là même tout le bénéfice qui peut en être tiré du point de vue de l'interrogation des données. La première partie se propose de présenter les problèmes généraux naissant de l'intégration. Après une présentation des deux domaines et de certains travaux en bases de données statistiques, nous proposons une synthèse des notions de l'analyse statistique multidimensionnelle et des bases de données relationnelles. Ceci permettra de déboucher sur les spécifications d'un outil intégré de gestion et d'analyse des données et également de mettre en évidence un problème de cohérence particulier. Outre l'apport provenant de chaque part (gestion des données plus performante grâce au SGBD, interrogation statistique grâce au système d'analyse des données), des possibilités nouvelles naissent de l'intégration. Il s'agit principalement de la capacité d'effectuer des requêtes approximatives, que nous défroissons à cette occasion, sur une base de données et de la résolution dans certains cas du problème des données manquantes. La seconde partie est consacrée à la présentation d'une réalisation particulière. Nous avons pour cela intégré le SGBD relationnel PEPIN et le Système de classification automatique SICLA. Le prototype opérationnel permet ainsi de gérer une base de données relationnelle et de l'interroger statistiquement. Un exemple d'utilisation pour le traitement d'une enquête est donné.
APA, Harvard, Vancouver, ISO, and other styles
25

Abdali, Abdelkebir. "Systèmes experts et analyse de données industrielles." Lyon, INSA, 1992. http://www.theses.fr/1992ISAL0032.

Full text
Abstract:
L'analyse du fonctionnement des Systèmes de Production Industrielle s'appuie sur des informations de natures diverses. Une bonne partie d'entre elles se présentant sous forme numérisée, on leur applique des méthodes d'analyse des données dont les résultats doivent être confrontés, puis interprétés à l'aide des autres connaissances. Notre travail s'insère dans le cadre de l'application des techniques de l'Intelligence Artificielle à la Statistique. Il vise en particulier à étudier la faisabilité et le développement d'un Système Expert Statistique dans le domaine des Systèmes de Production Industrielle. Nous avons élaboré ALADIN (Aide Logicielle pour l'Analyse de Données Industrielles), un système destiné à aider un utilisateur non-spécialiste à analyser des données recueillies sur des procédés industriels. L'architecture de ce système est flexible et allie aspect qualitatif (connaissances sur les procédés industriels et connaissances sur les méthodes statistiques et d'analyse de données) et aspect quantitatif (collection de programmes d'analyse). Pour l'instant, nous nous sommes limités aux problèmes d'Analyse en Composantes Principales. Outre l'aspect industriel, ALADIN présente l'avantage de fournir une assistance au niveau de chacun des nombreux maillons de la conduite d'une analyse de données et particulièrement en amont de l'analyse proprement dite i. E. Lors de la phase de prétraitement et de préparation des données: cette étape, toujours nécessaire compte tenu de la nature des mesures, est en effet généralement longue et fastidieuse
To analyses industrial process behavio, many kinds of information are needed. As tye ar mostly numerical, statistical and data analysis methods are well-suited to this activity. Their results must be interpreted with other knowledge about analysis prcess. Our work falls within the framework of the application of the techniques of the Artificial Intelligence to the Statistics. Its aim is to study the feasibility and the development of statistical expert systems in an industrial process field. The prototype ALADIN is a knowledge-base system designed to be an intelligent assistant to help a non-specialist user analyze data collected on industrial processes, written in Turbo-Prolong, it is coupled with the statistical package MODULAD. The architecture of this system is flexible and combing knowledge with general plants, the studied process and statistical methods. Its validation is performed on continuous manufacturing processes (cement and cast iron processes). At present time, we have limited to principal Components analysis problems
APA, Harvard, Vancouver, ISO, and other styles
26

Dang, Van Mô. "Classification de donnees spatiales : modeles probabilistes et criteres de partitionnement." Compiègne, 1998. http://www.theses.fr/1998COMP1173.

Full text
Abstract:
La problématique de la classification de données spatiales se pose par exemple lorsqu'on segmente une image en régions homogènes ou lorsqu'on cartographie des données multidimensionnelles localisées telles que des relevés physico-chimiques du sol. Dans ce travail, les méthodes proposées s'appuient sur des distributions de probabilité afin de modéliser les mécanismes engendrant la partition non observée et les observations. S'il s'agit d'effectuer les regroupements en se basant uniquement sur les valeurs observées, on rappelle que les modèles de mélange, la vraisemblance classifiante et l'algorithme EM procurent des solutions flexibles et relativement simples à mettre en œuvre. Afin d'intégrer en outre une hypothèse d'homogénéité spatiale de la partition, on se propose de conduire des raisonnements similaires dans le cadre des modèles utilisant un champ de Markov caché. D'une part, on démontre qu'en appliquant l'algorithme EM au cas des champs de potts cachés avec une approximation de champ moyen, on effectue les mêmes calculs que l'optimisation alternée d'une vraisemblance classifiante floue. Ce constat permet d'améliorer sur certains points une méthode de classification spatiale floue itérative récemment proposée. Sur des données simulées et réelles, la méthode obtenue fournit des résultats comparables aux techniques utilisant des simulations de Monte-Carlo pour un cout algorithmique moindre. D'autre part, on adapte l'approche précédente à des types particuliers de données spatiales. Pour un problème d'écologie numérique, on construit ainsi une méthode visant à classifier des indicateurs de présence/absence localisés. On propose selon une démarche analogue un algorithme de classification peu sensible aux valeurs atypiques. Enfin, pour traiter des données spatiales incomplètes, on propose d'optimiser une vraisemblance classifiante dont le modèle statistique sous-jacent intègre la notion de valeurs manquantes.
APA, Harvard, Vancouver, ISO, and other styles
27

Bureau, Jérémie. "Définition et analyse statistique d'une mesure d'intégrité pour données GPS-EGNOS." Toulouse 3, 2012. http://thesesups.ups-tlse.fr/1983/.

Full text
Abstract:
Parmi les applications GNSS (Global Navigation Satellite System) existantes ou en développement, certaines dont l'aviation, nécessitent de hautes performances en termes de précision de positionnement et de fiabilité. Ces performances critiques sont évaluées à l'aide d'outils probabilistes et le problème d'appréciation de la précision ou de la fiabilité du système (intégrité) peut être vu comme une estimation de quantile. Ce problème inverse nécessite la connaissance de la fonction de répartition des observations, ce qui n'est pas le cas lorsque l'on travaille sur des données réelles. Il faut alors utiliser des techniques statistiques pour l'estimer. Les exigences spécifiques à certaines applications, comme par exemple l'atterrissage d'un avion, nécessitent des niveaux de quantiles très élevés atteignant des probabilités de l'ordre de 10^7. Ces probabilités correspondent à des fréquences d'occurrence d'événements rares, situés dans les queues de distribution. Les quantiles associés à de tels niveaux de probabilité sont qualifiés de quantiles extrêmes et se situent le plus souvent au-delà du domaine des observations. Nous proposons dans cette thèse deux méthodes d'estimation de quantiles extrêmes peu employées dans le domaine du GNSS. La première est une application des modèles issus de la théorie des extrêmes et plus particulièrement du modèle à dépassement de seuil POT (Peak Over Threshold). Cette théorie fournit une classe de modèles permettant l'extrapolation de l'observé vers le non observé et ainsi la caractérisation des événements rares qui peuvent ne jamais avoir été observés. La deuxième méthode fournit une approximation de la décroissance de la queue d'une distribution au moyen de techniques analytiques adaptées à un cadre statistique: il s'agit de la méthode du point selle. Ces deux techniques de caractérisation des fonctions de répartition sont valables sous certaines hypothèses de stationnarité et d'indépendance des observations; or les données GPS ne vérifient pas toujours ces conditions. Dans ce travail, nous proposons des méthodes statistiques pour stationnariser les données afin d'utiliser les modèles d'estimation de quantiles extrêmes dans un cadre adéquat. A partir des outils décrits dans cette thèse, nous fournissons un protocole d'analyse statistique d'intégrité. Les problématiques de calibration de ces outils sont traitées par des processus automatisés dans une plateforme d'analyse de données, support logiciel développé pour cette étude
Among the GNSS (Global Navigation Satellite System) applications currently used or in development, some of them require high performances in terms of precise positioning and reliability for safety of life. These critical performances are evaluated using statistical tools, and the problem of measuring the position accuracy or the system reliability (integrity) can be modeled as a quantile estimation. This inverse problem requires the knowledge of the cumulative distribution function of the observations. This is not possible when we have to study real data, then it becomes necessary to use statistical techniques to estimate this function. Specific safety of life applications, such as an airborne precision approach, require very high levels of quantiles which probabilities can reach 10^7. These probabilities correspond to frequencies of rare events occurrence, located in the distribution tails. Quantiles associated to such levels of probability are qualified as extreme quantiles and are generally located beyond the observations domain. We propose in this work two methods of extreme quantile estimation seldom used in the GNSS field. The first one is a direct application of the models stemming from extreme values theory and more particularly from the model of excesses over a threshold called POT (Peak Over Threshold). This theory provides a class of models allowing an extrapolation from the observed domain to the unobserved domain and then the characterization of rare events which never have been observed. The second method supplies an approximation for the decreasing of a distribution tail by the use of analytical techniques adapted to a statistical framework. This method is called derived from saddle point approximation technics. These two techniques of tails distributions characterization are valid under certain hypothesis of stationnarity and independency of the observations. GPS data do not always satisfy these conditions. In this work, we propose statistical methods to reach these conditions allowing us to use the models of extreme quantile estimation in an adequate way. From the tools studied in this thesis, we outline a statistical analysis methodology for integrity measurement. The problems of calibrating these tools are treated by automated processes in a data analysis platform, software developed as a support for this study
APA, Harvard, Vancouver, ISO, and other styles
28

Badran, Hussein. "Contribution à la mesure en analyse factorielle des données et applications." Aix-Marseille 3, 2001. http://www.theses.fr/2001AIX30035.

Full text
Abstract:
Cette thèse regroupe un certain nombre de travaux pour la plupart sous forme d'articles classés en deux grandes parties. La première partie, plus théorique, concerne certaines études attachées au contexte de l'analyse factorielle. Dans un premier travail, sont abordées des questions liées aux lois de probabilités intervenant en analyse factorielle et d'abord l'évaluation et la caractérisation des données manquantes. On donne ensuite quelques résultats nouveaux sur les transformations projectives permettant d'approcher des lois de probabilités données sur des compacts. Enfin est proposé un résultat sur la mesure de deux parties complémentaires d'un convexe définies par un hyperplan passant par son centre de gravité au sens d'une distribution de masse donnée. La deuxième partie rassemble un certain nombre d'applications de l'analyse factorielle montrant d'une part la diversité des domaines d'application mais aussi les problèmes spécifiques que l'on peut découvrir au fur et à mesure
This thesis presents under a same cover a certain number of articles and studies that are regrouped into two parts. The first part, mostly theoretical, concerns some studies in the framework of factorial analysis. In the beginning several questions related to probability distribution functions appearing in factorial analysis are considereed, mainly about the evaluation and characterization of missing data. Then new results are given on projective transformations that allow to approach probability laws on compact sets. Finally another result on measureness (under the meaning of a given mass distribution) of two complementary subsets of convex sets defined by hyperplanes going through the gravity center. The second part aims at presenting a certain number of applications of Correspondence Factorial Analysis showing the diversity of concrete problems that can be invoked. It offers results of many studies conducted in France as in Lebanon in the framework of several researches that have facilitated the discovery of new information in very different sectors from experimental sciences going from earth science to economical, political and social sciences
APA, Harvard, Vancouver, ISO, and other styles
29

Lahatte, Agénor. "Analyse de systèmes de demande des ménages et dépendance spatiale." Université Louis Pasteur (Strasbourg) (1971-2008), 2002. http://www.theses.fr/2002STR1EC05.

Full text
Abstract:
La thèse fait le lien entre les modèles de choix de quantité et de qualité de biens de consommation proposés par Deaton (1987, 1988, 1990) et Crawford et alii (1996) (CLP) et le courant de littérature spatiale. D'abord dans un cadre général d'analyse de systèmes de parts [CLP est un exemple de tels systèmes] je considère la structure spatiale des décisions des agents économiques et je montre que la propriété d'addition des parts implique des restrictions d'égalité sur les paramètres autorégressifs des modèles de parts avec dépendance spatiale. Par une étude de Monte Carlo, je souligne par ailleurs la possibilité de mettre en oeuvre le test de Moran dans un contexte microéconomique non seulement pour détecter la présence possible de corrélation spatiale dans les termes d'erreur de régression mais aussi pour identifier le ou les types d'interaction occasionnant l'autocorrélation. Pour estimer les versions spatiales du modèle CLP, je suggère une combinaison de la méthodologie de Deaton (1987, 1988, 1990) et Crawford et alii (1996) et de la procédure de Kelejian et Prucha (1999). Je montre que cette méthode d'estimation peut comporter un problème d'identification des paramètres spatiaux et qu'elle fonctionne très bien avec des structures particulières de matrices de pondération spatiales. Une illustration empirique de l'estimation des versions spatiales du modèle CLP, basée sur des données de consommation de ménages tchèques est fournie; les résultats d'estimation suggèrent l'absence de dépendance spatiale dans l'échantillon considéré
The thesis connects two distinct strands of the literature: models of quantity and quality proposed by Deaton (1987, 1988, 1990) and Crawford, Laisney and Preston (1996) (CLP) and spatial econometrics. I first consider spatial patterns of economic agents decisions in the general context of analysis of share systems and I show that the adding-up property of shares implies equality restrictions on spatial autoregressive parameters of the share models with spatial dependence. Then, in a Monte Carlo study, I emphasize the possibility of the implementation of the Moran's (1950) test in microeconomic context not only to test for the presence of spatial correlation across error terms, but also to identify its potential sources. For estimating the spatial versions of the CLP model, I combine the methodology of Deaton (1987, 1988, 1990) and Crawford et alii (1996) and the procedure of Kelejian and Prucha (1999). I show then that this estimation method involves an identification problem of spatialparameters and that it requires spatial matrices with special structures. An illustration of the estimation of spatial versions of the CLP model is given, with an application of the technique to Czech household survey data; the estimates do not suggest that neighbors' budget shares are an important determinant of the household expenditures in the data analysed
APA, Harvard, Vancouver, ISO, and other styles
30

Mourad, Georges. "L'analyse factorielle des correspondances et l'études de quelques marchés : flux des marchandises OCDE-OPEP et OCDE-URSS, flux du pétrole OPEP-OCDE, immatriculation de véhicules utilitaires et des voitures particulières en Europe occidentale." Paris 6, 1986. http://www.theses.fr/1986PA066212.

Full text
APA, Harvard, Vancouver, ISO, and other styles
31

Rahal, Mohamed Cherif. "Classification ascendante spatiale : nouveaux algorithmes et aide à l'interprétation." Paris 9, 2010. https://portail.bu.dauphine.fr/fileviewer/index.php?doc=2010PA090003.

Full text
APA, Harvard, Vancouver, ISO, and other styles
32

Connault, Pierre. "Calibration d'algorithmes de type Lasso et analyse statistique de données métallurgiques en aéronautique." Thesis, Paris 11, 2011. http://www.theses.fr/2011PA112041.

Full text
Abstract:
Notre thèse comprend deux parties : l’une méthodologique, l’autre appliquée.La partie méthodologique porte sur le Lasso et une variante de cet algorithme, le Lasso projeté, en vue de leur calibration par pente. Notre méthode tire parti des propriétés de parcimonie du Lasso, en envisageant le problème de sa calibration comme un problème de sélection de modèles, permettant l’emploi de critères pénalisés nécessitant le réglage d’une constante. Pour déterminer la forme de la pénalité et la valeur de la constante, nous adaptons les approches classiques de Birgé et Massart. Ceci permet de dégager la notion de pénalité canonique. Pente et validation croisée sont ensuite comparées. La proximité des résultats suggère qu’en pratique on utilise les deux conjointement, avec des corrections visuelles concernant la pente. Des améliorations sur le temps de calcul des pénalités canoniques sont ensuite proposées, mais sans succès patent. La partie appliquée analyse certaines questions métallurgiques en aéronautique. En fiabilité, le grand nombre de variables présentes, relativement au nombre limité de données, mène à une instabilité des solutions par modèles linéaires et à des temps de calculs trop élevés ; c’est pourquoi le Lasso constitue une solution intéressante. Notre méthode de réglage permet souvent de retenir les variables conformes à l’expérience métier. La question de la qualité du procédé de fabrication, par contre, ne peut se traiter au moyen du Lasso. Quatre aspects sont alors envisagés : la détermination des facteurs du procédé, la mise en évidence de recettes, l’étude de la stabilité du procédé dans le temps et la détection de pièces hors-normes. Un schéma général d’étude procédé est ainsi dégagé,en qualité comme en fiabilité
Our work contains a methodological and an applied part.In the methodological part we study Lasso and a variant of this algorithm : the projectedLasso. We develop slope heuristics to calibrate them.Our approach uses sparsity properties of the Lasso, showing how to remain to a modelselection framework. This both involves a penalized criterion and the tuning of a constant.To this aim, we adopt the classical approaches of Birgé and Massart about slope heuristics.This leads to the notion of canonical penalty.Slope and (tenfold) crossvalidation are then compared through simulations studies.Results suggest the user to consider both of them. In order to increase calculation speed,simplified penalties are (unsuccessfully) tried.The applied part is about aeronautics. The results of the methodological part doapply in reliability : in classical approaches (without Lasso) the large number of variables/number of data ratio leads to an instability of linear models, and to huge calculustimes. Lasso provides a helpful solution.In aeronautics, dealing with reliability questions first needs to study quality of theelaboration and forging processes. Four major axis have to be considered : analysing thefactor of the process, discrimining recipes, studying the impact of time on quality anddetecting outliers. This provides a global statistical strategy of impowerment for processes
APA, Harvard, Vancouver, ISO, and other styles
33

Ahamada, Ibrahim. "Analyse spectrale des données non stationnaires : théories et applications aux tests de stationnarité." Aix-Marseille 2, 2002. http://www.theses.fr/2002AIX24007.

Full text
APA, Harvard, Vancouver, ISO, and other styles
34

Cardot, Hervé. "Contribution à l'estimation et à la prévision statistique de données fonctionnelles." Toulouse 3, 1997. http://www.theses.fr/1997TOU30162.

Full text
Abstract:
Ce travail aborde le probleme de l'estimation non parametrique des caracteristi ques du second ordre de fonctions aleatoires discretisees pour lesquelles nous considerons deux modeles : le premier est un modele de regression non parametrique, sous contrainte de rang, de donnees longitudinales dont les points de mesure varient d'une courbe a l'autre. Les estimateurs, definis comme solution d'un probleme d'optimisation, sont cons truits au moyen de splines hybrides et conduisent a une nouvelle analyse en composantes principales fonctionnelles. Cette methode est appliquee a l'etude de donnees pluviometriques. Nous prouvons ensuite la convergence en moyenne quadratique de l'estimateur de la moyenne et des vecteurs propres de l'operateur de covariance. Enfin un developpement asymptotique de l'erreur quadratique base sur la theorie des pertu rbations montre qu'il est preferable de lisser lorsque les donnees sont bruitees. Le second modele porte sur la prevision de processus autoregressifs fonctionnels. Nous developpons une methode de regression non parametrique simultanee des trajectoires qui anticipe la reduction de dimension necessaire a la construction d'un predicteur. Cette approche est ensuite appliquee a la prevision de series reelles (trafic autoroutier, series climatologiques enso) et comparee avec d'autres predicteurs de type parametrique ou non (noyaux,. . . ). Nous prouvons egalement la convergence en probabilite du predicteur construit par l'interpolation et le lissage spline des trajectoires.
APA, Harvard, Vancouver, ISO, and other styles
35

Sallah, Kankoe. "Diffusion spatio-temporelle des épidémies : approche comparée des modélisations mathématiques et biostatistiques, cibles d'intervention et mobilité humaine." Thesis, Aix-Marseille, 2017. http://www.theses.fr/2017AIXM0607.

Full text
Abstract:
Dans la première partie de cette thèse, nous avons mis en place un métamodèle de transmission du paludisme basé sur la modélisation compartimentale susceptible-infecté-résistant (SIR) et prenant en compte les flux de mobilité humaine entre différents villages du Centre Sénégal. Les stratégies d’intervention géographiquement ciblées, s’étaient avérées efficaces pour réduire l’incidence du paludisme aussi bien dans les zones d’intervention qu’à l’extérieur de ces zones. Cependant, des actions combinées ciblant à la fois le vecteur et l’hôte, coordonnées à large échelle sont nécessaires dans les régions et pays visant l’élimination du paludisme à court/moyen terme.Dans la deuxième partie nous avons évalué différentes méthodes d’estimation de la mobilité humaine en l’absence de données individuelles. Ces méthodes incluaient la traçabilité spatio-temporelle des téléphones mobiles ainsi que les modèles mathématiques de gravité et de radiation. Le transport de l’agent pathogène dans l’espace géographique, par la mobilité d’un sujet infecté est un déterminant majeur de la vitesse de propagation d’une épidémie. Nous avons introduit le modèle d’impédance qui minimise l’erreur quadratique moyen sur les estimations de mobilité, en particulier dans les contextes où les ensembles de population sont caractérisés par leurs tailles hétérogènes.Nous avons enfin élargi le cadre des hypothèses sous-jacentes à la calibration des modèles de gravité de la mobilité humaine. L’hypothèse d’une distribution avec excès de zéros a fourni un meilleur ajustement et une meilleure prédictibilité, comparée aux hypothèses classiques n’assumant pas un excès de zéros : Poisson, Quasipoisson
In the first part of this thesis, we have developed a malaria transmission metamodel based on the susceptible-infected-resistant compartmental modeling framework (SIR) and taking into consideration human mobility flows between different villages in the Center of Senegal. Geographically targeted intervention strategies had been shown to be effective in reducing the incidence of malaria both within and outside of intervention areas. However, combined interventions targeting both vector and host, coordinated on a large scale are needed in regions and countries aiming to achieve malaria elimination in the short/medium term.In the second part we have evaluated different methods of estimating human mobility in the absence of real data. These methods included spatio-temporal traceability of mobile phones, mathematical models of gravity and radiation. The transport of the pathogen through the geographical space via the mobility of an infected subject is a major determinant of the spread of an epidemic. We introduced the impedance model that minimized the mean square error on mobility estimates, especially in contexts where population sets are characterized by their heterogeneous sizes.Finally, we have expanded the framework of assumptions underlying the calibration of the gravity models of human mobility. The hypothesis of a zero inflated distribution provided a better fit and a better predictability, compared to the classical approach not assuming an excess of zeros: Poisson, Quasipoisson
APA, Harvard, Vancouver, ISO, and other styles
36

Chambaz, Antoine. "Segmentation spatiale et sélection de modèle : théorie et applications statistiques." Paris 11, 2003. http://www.theses.fr/2003PA112012.

Full text
Abstract:
Cette thèse trouve sa dynamique dans l'élaboration d'une méthode originale de raffinement de localisation du trafic de téléphonie mobile en zone urbaine pour France Télécom R&D, ainsi que dans l'étude de thèmes théoriques soulevés lors de notre exploration. Notre approche est de nature statistique. Il apparaît que les thèmes centraux de cette thèse sont la segmentation spatiale et la sélection de modèle. Nous introduisons dans un premier temps les données sur lesquelles nous avons fondé notre approche du problème, que nous expliquons à leur lumière. Nous motivons le choix d'un modèle de régression hétéroscédastique. Nous présentons ensuite une démarche non paramétrique par arbres de régression de type CART et ses extensions par ré-échantillonnage Bagging et Boosting dans un cadre de régression homoscédastique. Nous proposons une adaptation de ces techniques au cas hétéroscédastique. Une analyse originale de l'importance des variables y est as~ociée. L'application commentée de notre méthode à divers jeux de données de trafic constitue notre réponse finale au problème initial. Le travail appliqué évoqué plus tôt motive l'étude de la consistance d'une famille d'estimateurs de l'ordre et de la segmentation d'un modèle segmenté. Nous nous consacrons aussi, dans un cadre général de sélection de modèle dans un emboîtement, à l'estimation de l'ordre d'un modèle et aux propriétés de consistance, ainsi qu'aux vitesses de sur- ou sous-estimation. Une approche fonctionnelle, i. E. Une approche pour laquelle les événements d'intérêt sont exprimés en termes d'événements sur la mesure empirique, permet d'unifier et de généraliser une large gamme de résultats antérieurs. Les preuves font appel à une variété de techniques: arguments classiques de minimisation de contraste, concentration, inégalités maximales pour des variables dépendantes, lemme de Stein, pénalisation, Prin- cipes de Grandes et Moyennes Déviations pour la mesure empirique, tour à la Hu ber
We tacke in this thesis the elaboration of an original method that provides refinement of the localization of the mobIle telecommunication traffic in urban area for France Télécom R&D. This work involves both practical and theoretical developments. Our point of view is of statistical nature. The major themes are spatial segmentation and model selection. We first introduce the various datasets from which our approach stems. They cast some light on the original problem. We motivate the choice of an heteroscedastic regression model. We then present a practical nonparametric regression method based on CART regression trees and its Bagging and Boosting extensions by resampling. The latter classical methods are designed for ho- moscedastic models. We propose an adaptation to heteroscedastic ODes, including an original analysis of variable importance. We apply the method to various traffic datasets. The final results are commented. The above practical work motivates the theoretical study of the consistency of a family of estimators of the order of a segmented model and its associated segmentation. We also cope, in a general framework of model select ion in a nested family of models, with the estimation of the order of a model. We are particularly concerned with consistency properties and rates of und er- or overestimation. We tackle the problem at stake with a linear functional approach, i. E. An approach where the events of interest are described as events concerning the empirical measute. This allows to derive general results that gather and enhance earlier ODes. A large range of techniques are involved : classical arguments of M -estimation, concentration, max- imal inequalities for dependent variables, Stein's lemma, penalization, Large and Moderate Deviations Principles for the empirical measure, à la Huber trick
APA, Harvard, Vancouver, ISO, and other styles
37

Pettorelli, Nathalie. "Variabilité individuelle et dynamique de population : importance de la composante spatiale." Lyon 1, 2002. http://www.theses.fr/2002LYO10131.

Full text
Abstract:
La variabilité individuelle joue un rôle majeur dans la compréhension de la dynamique d'une population particulière. Nous avons tenté de déterminer si l'espace pouvait constituer un attribut important de cette variabilité. Après avoir recherché de probables variations de types de futaie et/ou de taillis ainsi que d'occurrence et/ou d'abondance d'espèces consommés, nous avons exploré l'impact de ces variations sur les poids hivernaux des chevrillards et des adultes, sur les survies ainsi que sur l'intensité des mouvements. Puis, par l'utilisation d'un modèle matriciel, nous avons exploré l'influence des variations spatiales des paramètres démographiques et des paramètres de gestion sur le taux de croissance global et local de la population.
APA, Harvard, Vancouver, ISO, and other styles
38

Boly, Aliou. "Fonctions d'oubli et résumés dans les entrepôts de données." Paris, ENST, 2006. http://www.theses.fr/2006ENST0049.

Full text
Abstract:
Les entrepôts de données stockent des quantités de données de plus en plus massives et arrivent vite à saturation. La solution qui est appliquée en général est d'assurer un archivage périodique des données les plus anciennes. Cette solution n'est pas satisfaisante car l'archivage et la remise en ligne des données sont des opérations coûteuses au point que l'on peut considérer que des données archivées sont des données perdues du point de vue de leur utilisation dans le cadre d'une analyse des données. Dans cette thèse, nous proposons une solution pour résoudre ce problème : un langage de spécifications de fonctions d'oubli est défini pour déterminer les données qui doivent être présentes dans l'entrepôt de données à chaque instant. Ces spécifications de fonctions d'oubli conduisent à supprimer de façon mécanique les données 'oublier', tout en conservant un résumé de celles-ci par agrégation et par échantillonnage. L'objectif est de mettre à disposition de l'administrateur de l'entrepôt de données des outils permettant de maîtriser la taille de l'entrepôt et d'automatiser au maximum le processus d'archivage des données anciennes en fonction de stratégies prédéfinies. Dans cette thèse, nous nous plaçons dans le cadre du modèle relationnel et nous définissons un langage de spécifications de fonctions d'oubli ainsi que les principes et les algorithmes pour mettre à jour le contenu de l'entrepôt conformément aux spécifications de fonctions d'oubli. Des mécanismes de consultation et d'analyse des résumés constitués sont également proposés
The amount of data stored in data warehouses grows very quickly so that they get saturated. To overcome this problem, the solution is generally to archive older data when new data arrive if there is no space left. This solution is not satisfactory because data mining analyses based on long term historical data become impossible. As a matter of fact data mining analysis cannot be done on archived data without re-loading them in the data warehouse; and the cost of loading back a large dataset of archived data is too high to be operated just for one analysis. So, archived data must be considered as lost data regarding to data mining applications. In this thesis, we propose a solution for solving this problem: a language is defined to specify forgetting functions on older data. The specifications include the definition of some summaries of deleted data to define what data should be present in the data warehouse at each step of time. These summaries are aggregates and samples of deleted data and will be kept in the data warehouse. The goal of these forgetting functions is to control the size of the data warehouse. This control is provided both for the aggregate summaries and the samples. The specification language for forgetting function is defined in the context of relational databases. Once forgetting functions have been specified, the data warehouse is automatically updated in order to follow the specifications. This thesis presents both the language for specifications, the structure of the summaries, the algorithms to update the data warehouse and the possibility of performing interesting analyses of historical data
APA, Harvard, Vancouver, ISO, and other styles
39

Raillard, Nicolas. "Modélisation du comportement extrême d'un processus spatio-temporel : applications en océanographie et météorologie." Rennes 1, 2011. http://www.theses.fr/2011REN1S111.

Full text
Abstract:
Ce travail de thèse porte sur l'étude des extrêmes d'une variable océanique importante dans le cadre des applications: la hauteur significative des vagues. Cette quantité est observée fidèlement par des satellites, mais cette source de donnée produit des données complexes du fait d'une répartition des observations irrégulière, en temps et en espace. Ce problème est primordial dans le cadre de l'étude des extrêmes, car peu de modèles statistiques sont adaptés à de telles données. Deux modèles sont présentés dans ce document. Nous commençons par décrire un modèle d'interpolation basé sur l'estimation des vitesses de déplacement des structures d'états de mer à l'aide de méthodes de filtrage particulaire. Ensuite nous avons mis en place une procédure d'estimation de la structure d'ordre deux du champ déplacé, dans le but d'appliquer une interpolation. Cette procédure a montré une amélioration par rapport aux techniques usuelles, mais une insuffisance pour modéliser les extrêmes. Dans un second temps, nous mettons en oeuvre une procédure pour modéliser les dépassements de seuils d’un processus observé à temps irrégulier ou avec des valeurs manquantes. Nous proposons un modèle basé sur les méthodes de dépassement de seuils multi-variés et les extrêmes de processus, ainsi qu’une méthode d'estimation des paramètres par des techniques de vraisemblance composite. Enfin, nous montrons la convergence de l’estimateur et, à l’aide de simulations ainsi que par une application à des données de hauteurs significatives, nous concluons que la prise en compte de tous les dépassements permet d'améliorer l'estimation des niveaux de retour de même que de la description de la durée des extrêmes
In this thesis, the extremes of an important oceanographic variable for application will be studied: the significant wave height. This quantity is observed precisely thanks to remote sensing with the satellites. However, this data source produce complex data set with data irregularly spaced in space and time. This issue is central for studding extreme values, since few models are suited to such data. Two models are described in this document. First, we introduce an interpolation model, based on the estimation of displacements sea-states structures, thanks to particle filters. Then, an estimation of the covariance structure of the displaced field is applied to obtain and interpolation scheme. This technique leads to an improvement of usual approaches, but is insufficient to cope with extremes. Secondly, we develop a procedure to model the threshold exeedances for a process observed at irregular time steps or with missing observations. We propose a model based on methods from multivariate threshold exceedances and from extremes of stochastic processes, together with an estimation procedure inspired by composite likelihood techniques. Then, we show both the consistency of the estimators and the practical behaviour with simulations. Last, we use real datasets of significant wave height and see that taking into account every excess leads to an improvement in the estimation of return level and in describing the lengths of extreme events
APA, Harvard, Vancouver, ISO, and other styles
40

Baumont, Catherine. "Contribution à l'analyse des espaces urbains multicentriques : la localisation résidentielle : étude théorique et empirique." Dijon, 1990. http://www.theses.fr/1990DIJOE004.

Full text
Abstract:
La thèse se présente en trois parties. La première partie est consacrée a l'analyse de l'intégration des espaces urbains multicentriques en analyse spatiale. Un premier chapitre présente l'analyse des espaces urbains multicentriques comme une alternative aux modèles urbains monocentriques. Un deuxième chapitre insiste sur le caractère imprécis des espaces urbains multicentriques. Dans la deuxième partie, l'équilibre spatial du ménage dans une ville multicentrique est traité. La formalisation traditionnelle : maximisation d'une utilité résidentielle sous une contrainte budgétaire, presentée dans le troisième chapitre, souffre de défauts que le modèle flou construit dans le quatrième chapitre peut dépasser. Enfin, dans la troisième partie, une étude économétrique des deux modèles est réalisée. Les caractéristiques techniques des tests sont décrites dans un cinquième chapitre, tandis que les résultats des tests (sur la fonction d'utilité de résidence, sur la fonction de coût de logement et sur le caractère opérationnel des deux modèles) sont présentes dans le sixième et dernier chapitre. On montre alors que l'agglomération dijonnaise présente, au vu des tests, une structure multicentrique et que le modèle flou permet d'apporter une solution économique satisfaisante au problème de la localisation résidentielle
The thesis is divided into three parts. The first part is devoted to the analysis of multicenter urban spaces integration in spatial analysis. Both fuzzy and non fuzzy characteristics of them are taken into account. In the second part we try to solve the problem of spatial equilibrium of household in a multicenter urban pattern and we construct two models : a standard model and a fuzzy model. Then in the third part we present an econometric study based on the models described in the second part. Dijon is the urban area chosen for the test. The fuzzy approach allows us to bring an interesting economoc solution of household location in multicenter urban spaces
APA, Harvard, Vancouver, ISO, and other styles
41

Poupeau, Benoît. "Analyse et requêtes de données géographiques 3 D : contributions de la cristallographie géométrique." Phd thesis, Université Paris-Est, 2008. http://tel.archives-ouvertes.fr/tel-00481924.

Full text
Abstract:
Un des rôles des SIG 3D est d'intégrer et de mettre en cohérence des données issues de producteurs de données variés tout en respectant les choix faits en fonction des besoins des utilisateurs, en termes de géométrie et de topologie. Les SIG 3D actuels utilisent généralement une modélisation géométrique et topologique unique qui facilite, entre autres, les requêtes comme celles calculées à partir des modèles topologiques tels que le parcours de proche en proche des primitives géométriques d'un objet ou de ses voisins. En contrepartie, cette homogénéisation entraîne une perte des spécificités des modèles, de lourds calculs de conversion et ne corrige pas, sans une aide extérieure, les problèmes inhérents à l'acquisition et à la modélisation. Cette thèse propose un modèle d'analyse pour les SIG 3D permettant d'opérer des requêtes sur un objet (analyse intra-objet), quel que soit le choix technique de l'utilisateur, ou sur un ensemble d'objets (analyse inter-objets), même s'ils ne sont pas parfaitement cohérents. A partir de principes issus de la cristallographie, ce modèle, nommé Cristage, analyse les symétries de chaque objet pour décrire sa structure, c'est-à-dire la manière dont les primitives sont agencées entre elles. Complémentaire des modèles topologiques, cette première abstraction donne une vision globale de l'objet, ce qui facilite certaines requêtes comme l'extraction du toit d'une cavité ou la simplification géométrique d'un bâtiment 3D. L'analyse des différents éléments de symétrie (plans, axes et centre) offre une seconde abstraction : la maille. Considérée en cristallographie comme l'enveloppe du plus petit parallélépipède conservant les propriétés géométriques, elle est utilisée comme une boîte englobante adaptée à la forme de l'objet. Elle permet, en particulier, la mise en relation logique des objets géographiques, quelle que soit leur dimension. A l'aide des mailles, deux graphes sont calculés. Le premier, qualifié de graphe d'incidence, décrit les relations entre objets et facilite le parcours entre eux. Le second, appelé graphe temporel, dessine, pour un objet, l'évolution de ses relations avec son environnement
APA, Harvard, Vancouver, ISO, and other styles
42

Kholladi, Mohamed Khureddine. "Représentation, modélisation et manipulation des connaissances spatiales en géomatique"G. R. E. M. A. C. O. S. "." Lyon, INSA, 1991. http://www.theses.fr/1991ISAL0082.

Full text
Abstract:
L'objectif de ce mémoire est de dresser un panorama complet des problématiques qui se posent dans des domaines de la représentation, la modélisation et la manipulation de objets tridimensionnels à travers trois applications utilisant des objets géomatiques. Cette manipulation nécessite des raisonnements spatiaux qui sont dans la plupart des cas de nature géométrique et topologique tels que : - la création de nouveaux faits spatiaux a partir d'interpolation (cas des couches géologiques - la déduction de nouveaux faits spatiaux a partir d'informations incomplètes ou mal structurées. La diversité des problématiques de manipulations de connaissances spatiales met en relief la multiplicité des méthodes de raisonnements et la difficulté de les unifier dans un raisonnement type, qui serait susceptible de s'appliquer a tous les cas de figures. Dans la perspective de développement d'outils dédiés aux raisonnements spatiaux, les travaux de ce mémoire vont apporter une contribution dans les trois axes différents suivants : - maîtrise des moyens de représentations selon les types d'application ; - adaptation de la modélisation des objets spatiaux - manipulations et raisonnements dans des contestes différents. Cela nous amène à penser que la multiplicité des problèmes engendre la multiplicité des outils de raisonnements et l'objet de ce mémoire est à partir d'échantillons de problèmes dans des contextes de travaux aussi différents les uns des autres, de souligner les caractéristiques spécifiques à chaque modèle de raisonnements spatiaux
In this dissertation we present a large survey of problems concerning representation, modelling and manipulation of three dimensional objects. This work is described thanks to three applications using various geomatic objects. The manipulation activity is based on spatial reasoning which fs mainly geometric or topologic such as : - creation of new spatial. Facts thanks. To interpolation (as in our geological strata application), deduction of new -facts from either 6ncomplete or badly structured information. Spatial knowledge manipulation involves several problems. This in lights the multiple reasoning methods and shows how their unification in a Single reasoning model, which could be applied to several cases, is very difficult. As far as the development of spatial reasoning tolls is concerned, our work presents a contribution in the three following axes : control of the representation depending on the application types, - adaptation of the modelling of spatial objects, - manipulation and reasoning in different contexts. This has made us think that this dissertation we in light for each reasoning model, its specific characteristics, thanks to several problems which are taken from very different contexts
APA, Harvard, Vancouver, ISO, and other styles
43

Zreik, Rawya. "Analyse statistique des réseaux et applications aux sciences humaines." Thesis, Paris 1, 2016. http://www.theses.fr/2016PA01E061/document.

Full text
Abstract:
Depuis les travaux précurseurs de Moreno (1934), l’analyse des réseaux est devenue une discipline forte, qui ne se limite plus à la sociologie et qui est à présent appliquée à des domaines très variés tels que la biologie, la géographie ou l’histoire. L’intérêt croissant pour l’analyse des réseaux s’explique d’une part par la forte présence de ce type de données dans le monde numérique d’aujourd’hui et, d’autre part, par les progrès récents dans la modélisation et le traitement de ces données. En effet, informaticiens et statisticiens ont porté leurs efforts depuis plus d’une dizaine d’années sur ces données de type réseau en proposant des nombreuses techniques permettant leur analyse. Parmi ces techniques on note les méthodes de clustering qui permettent en particulier de découvrir une structure en groupes cachés dans le réseau. De nombreux facteurs peuvent exercer une influence sur la structure d’un réseau ou rendre les analyses plus faciles à comprendre. Parmi ceux-ci, on trouve deux facteurs importants: le facteur du temps, et le contexte du réseau. Le premier implique l’évolution des connexions entre les nœuds au cours du temps. Le contexte du réseau peut alors être caractérisé par différents types d’informations, par exemple des messages texte (courrier électronique, tweets, Facebook, messages, etc.) échangés entre des nœuds, des informations catégoriques sur les nœuds (âge, sexe, passe-temps, Les fréquences d’interaction (par exemple, le nombre de courriels envoyés ou les commentaires affichés), et ainsi de suite. La prise en considération de ces facteurs nous permet de capturer de plus en plus d’informations complexes et cachées à partir des données. L’objectif de ma thèse été de définir des nouveaux modèles de graphes aléatoires qui prennent en compte les deux facteurs mentionnés ci-dessus, afin de développer l’analyse de la structure du réseau et permettre l’extraction de l’information cachée à partir des données. Ces modèles visent à regrouper les sommets d’un réseau en fonction de leurs profils de connexion et structures de réseau, qui sont statiques ou évoluant dynamiquement au cours du temps. Le point de départ de ces travaux est le modèle de bloc stochastique (SBM). Il s’agit d’un modèle de mélange pour les graphiques qui ont été initialement développés en sciences sociales. Il suppose que les sommets d’un réseau sont répartis sur différentes classes, de sorte que la probabilité d’une arête entre deux sommets ne dépend que des classes auxquelles ils appartiennent
Over the last two decades, network structure analysis has experienced rapid growth with its construction and its intervention in many fields, such as: communication networks, financial transaction networks, gene regulatory networks, disease transmission networks, mobile telephone networks. Social networks are now commonly used to represent the interactions between groups of people; for instance, ourselves, our professional colleagues, our friends and family, are often part of online networks, such as Facebook, Twitter, email. In a network, many factors can exert influence or make analyses easier to understand. Among these, we find two important ones: the time factor, and the network context. The former involves the evolution of connections between nodes over time. The network context can then be characterized by different types of information such as text messages (email, tweets, Facebook, posts, etc.) exchanged between nodes, categorical information on the nodes (age, gender, hobbies, status, etc.), interaction frequencies (e.g., number of emails sent or comments posted), and so on. Taking into consideration these factors can lead to the capture of increasingly complex and hidden information from the data. The aim of this thesis is to define new models for graphs which take into consideration the two factors mentioned above, in order to develop the analysis of network structure and allow extraction of the hidden information from the data. These models aim at clustering the vertices of a network depending on their connection profiles and network structures, which are either static or dynamically evolving. The starting point of this work is the stochastic block model, or SBM. This is a mixture model for graphs which was originally developed in social sciences. It assumes that the vertices of a network are spread over different classes, so that the probability of an edge between two vertices only depends on the classes they belong to
APA, Harvard, Vancouver, ISO, and other styles
44

Bonis, Thomas. "Algorithmes d'apprentissage statistique pour l'analyse géométrique et topologique de données." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS459/document.

Full text
Abstract:
Dans cette thèse, on s'intéresse à des algorithmes d'analyse de données utilisant des marches aléatoires sur des graphes de voisinage, ou graphes géométriques aléatoires, construits à partir des données. On sait que les marches aléatoires sur ces graphes sont des approximations d'objets continus appelés processus de diffusion. Dans un premier temps, nous utilisons ce résultat pour proposer un nouvel algorithme de partitionnement de données flou de type recherche de modes. Dans cet algorithme, on définit les paquets en utilisant les propriétés d'un certain processus de diffusion que l'on approche par une marche aléatoire sur un graphe de voisinage. Après avoir prouvé la convergence de notre algorithme, nous étudions ses performances empiriques sur plusieurs jeux de données. Nous nous intéressons ensuite à la convergence des mesures stationnaires des marches aléatoires sur des graphes géométriques aléatoires vers la mesure stationnaire du processus de diffusion limite. En utilisant une approche basée sur la méthode de Stein, nous arrivons à quantifier cette convergence. Notre résultat s'applique en fait dans un cadre plus général que les marches aléatoires sur les graphes de voisinage et nous l'utilisons pour prouver d'autres résultats : par exemple, nous arrivons à obtenir des vitesses de convergence pour le théorème central limite. Dans la dernière partie de cette thèse, nous utilisons un concept de topologie algébrique appelé homologie persistante afin d'améliorer l'étape de "pooling" dans l'approche "sac-de-mots" pour la reconnaissance de formes 3D
In this thesis, we study data analysis algorithms using random walks on neighborhood graphs, or random geometric graphs. It is known random walks on such graphs approximate continuous objects called diffusion processes. In the first part of this thesis, we use this approximation result to propose a new soft clustering algorithm based on the mode seeking framework. For our algorithm, we want to define clusters using the properties of a diffusion process. Since we do not have access to this continuous process, our algorithm uses a random walk on a random geometric graph instead. After proving the consistency of our algorithm, we evaluate its efficiency on both real and synthetic data. We then deal tackle the issue of the convergence of invariant measures of random walks on random geometric graphs. As these random walks converge to a diffusion process, we can expect their invariant measures to converge to the invariant measure of this diffusion process. Using an approach based on Stein's method, we manage to obtain quantitfy this convergence. Moreover, the method we use is more general and can be used to obtain other results such as convergence rates for the Central Limit Theorem. In the last part of this thesis, we use the concept of persistent homology, a concept of algebraic topology, to improve the pooling step of the bag-of-words approach for 3D shapes
APA, Harvard, Vancouver, ISO, and other styles
45

Hedli-Griche, Sonia. "Estimation de l'opérateur de régression pour des données fonctionnelles et des erreurs corrélées." Université Pierre Mendès France (Grenoble), 2008. http://www.theses.fr/2008GRE21009.

Full text
Abstract:
Dans les recherches que nous présentons dans ce mémoire, nous étudions le problème de la modélisation non paramétrique lorsque les données statistiques sont des courbes. Plus précisément, nous nous intéressons à des problèmes de prévision à partir d'une variable explicative à valeurs dans un espace de dimension éventuellement infinie. Récemment, des travaux ont été réalisés sur l'estimation fonctionnelle opérationnelle sous des conditions d'indépendance des données fonctionnelles. Dans cette thèse, nous nous sommes affranchi de cette hypothèse en considérant que les données fonctionnelles sont dépendantes et que le processus d'erreur est stationnaire (à courte ou à longue mémoire). Nous avons étudié et estimé l'opérateur de régression sur plusieurs facettes: quand les données fonctionnelles (dépendantes) sont déterministes ou aléatoires, quand le processus d'erreur est à courte ou longue mémoire, la normalité asymptotique quand le processus d'erreur est négativement associé, le choix local/global de la largeur de fenêtre, l'étude de la pertinence de nos résultats théoriques sur des données simulées puis sur des données réelles
In the research work that we present in this thesis, we study the problem of nonparametric modelization when the statistical data are represented by curves. More precisely, we are interested in the problems of prediction from an explanatory random variable that takes values in some, eventually, infinite dimensional space. Recently, some work has been realised in the functional operatoriel estimation under the independence assumptions of the functional data. In this thesis, we consider that the functional data are dependent and that the error process is stationary (with short or long memory). We have studied and estimated the regression operator under different set-ups: when the functional data (dependent) are deterministic or random, when the error process is a short or long memory, the asymptotic normality when the error process is negatively associated, the local/global choice of the bandwidth, the study of the relevancy of our theoretical results to simulated data and then to real data
APA, Harvard, Vancouver, ISO, and other styles
46

Al, Ayoubi Baydaa. "Analyse des données en distance de type M1 : théorie et algorithmes d'optimisation." Rennes 2, 1991. http://www.theses.fr/1991REN20010.

Full text
Abstract:
Notre étude puise ses fondements dans l'analyse des données sous ses deux aspects : analyse factorielle et classification automatique. Dans la pratique de l'analyse des données, l'expérimentateur se trouve en présence de données brutes qui se présentent sous forme d'un tableau croisant individus et variables. L'un des buts de cet expérimentateur est le traitement mathématique qui conduira à proposer une représentation graphique simple offrant une visualisation claire et globale de l'ensemble des données. . . Dans cette perspective, il lui faut introduire une métrique mesurant les dissemblances entre individus. Cependant, l'analyse des données classique se base essentiellement sur la métrique euclidienne. Nous proposons de refaire l'analyse factorielle en adoptant la métrique de Minkowski d'ordre 1 (ou de type M) qui est très intéressante vu le fait que la plupart de nos boulevards et de nos rues sont traces selon le schéma relatif à cette métrique. Nous étudions, les principales caractéristiques d'un espace métrique muni de la norme de Minkowski d'ordre 1, ainsi que l'essentiel des relations qui existent entre cette métrique et les autres types de distances. Apres cette étude théorique, et comme il est courant dans les domaines mathématiques visant à une application pratique des méthodes, nous proposons un algorithme d'optimisation visant à représenter l'ensemble des données par un schéma factoriel dans un espace muni de la norme précédemment mentionnée. Dans le cadre de l'élaboration de nouvelles méthodes et de nouvelles formes de représentations en classification
Our study deals with two aspects of the foundation of data analysis : factor analysis and classification theory. In the application of data analysis, the research encounters noise within the data which occur in rectangular arrays. One of the goals of the research is a mathematical procedure which leads to a simple graphical representation offering a clear over view of the data. From this perspective, one must introduce a distance measuring the differences between individuals. However classical data analysis uses the usual Euclidean distance. We intend to approach factor analysis w using the city block metric. We study the main properties of the city block metric as well as its relations to other distances. As it is important and desirable to present applications of an abstract theory, after our theoretical results, we present an optimization algorithm intended to graphically represent the data by a set in RP equipped with the above metric. In the case of the explanateur of new methods and representations within classification theory, we develop a classification algorithm which entails the graphical representation of the individuals from a particular population called an "additive forest", which is a generalization of the notion of "additive tree"
APA, Harvard, Vancouver, ISO, and other styles
47

Bailleul, Marc. "Analyse statistique implicative : variables modales et contribution des sujets : application a la modelisation de l'enseignant dans le systeme didactique." Rennes 1, 1994. http://www.theses.fr/1994REN10061.

Full text
Abstract:
Cette these, dans sa partie mathematique, se situe dans la lignee des travaux entrepris par r. Gras et ses eleves, a. Larher, s. Ag almouloud, a. Totohasina et h. Ratsimba rajohn a l'universite de rennes i. Elle etend, de facon originale, les apports des chercheurs precedents aux variables ordinales et developpe la notion de contribution des individus au phenomene d'implication statistique entre variables modales. Ces outils mathematiques sont utilises ensuite pour etudier, a partir d'un questionnaire sous forme de choix ordonne de mots dans un corpus propose, les representations de l'enseignement des mathematiques chez des enseignants de cette discipline au college et au lycee. On verra apparaitre dans les graphes implicatifs des structures que l'on cherchera a caracteriser du point de vue du mode de fonctionnement de l'enseignement qu'elles sous-tendent. On etudiera leur environnement c'est-a-dire le terrain sur lequel elles se sont construites et les effets qu'elles produisent dans des discours d'enseignants et des cahiers d'eleves. L'ensemble de ce travail est place dans le cadre plus large d'une contribution a la didactique de la formation des enseignants de mathematiques et plus precisement a l'etude du pole enseignant, sous son double aspect: maitre dans la situation didactique de classe et eleve dans la situation didactique de formation
APA, Harvard, Vancouver, ISO, and other styles
48

Lechuga, lopez Olga. "Contributions a l’analyse de données multivoie : algorithmes et applications." Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLC038/document.

Full text
Abstract:
Nous proposons d’étendre des méthodes statistiques classiques telles que l’analyse discriminante, la régression logistique, la régression de Cox, et l’analyse canonique généralisée régularisée au contexte des données multivoie, pour lesquelles, chaque individu est décrit par plusieurs instances de la même variable. Les données ont ainsi naturellement une structure tensorielle. Contrairement à leur formulation standard, une contrainte structurelle est imposée. L’intérêt de cette contrainte est double: d’une part elle permet une étude séparée de l’influence des variables et de l’influence des modalités, conduisant ainsi à une interprétation facilitée des modèles. D’autre part, elle permet de restreindre le nombre de coefficients à estimer, et ainsi de limiter à la fois la complexité calculatoire et le phénomène de sur-apprentissage. Des stratégies pour gérer les problèmes liés au grande dimension des données sont également discutées. Ces différentes méthodes sont illustrées sur deux jeux de données réelles: (i) des données de spectroscopie d’une part et (ii) des données d’imagerie par résonance magnétique multimodales d’autre part, pour prédire le rétablissement à long terme de patients ayant souffert d’un traumatisme cranien. Dans ces deux cas les méthodes proposées offrent de bons résultats quand ont compare des résultats obtenus avec les approches standards
In this thesis we develop a framework for the extension of commonly used linear statistical methods (Fisher Discriminant Analysis, Logistical Regression, Cox regression and Regularized Canonical Correlation Analysis) to the multiway context. In contrast to their standard formulation, their multiway generalization relies on structural constraints imposed to the weight vectors that integrate the original tensor structure of the data within the optimization process. This structural constraint yields a more parsimonious and interpretable model. Different strategies to deal with high dimensionality are also considered. The application of these algorithms is illustrated on two real datasets: (i) serving for the discrimination of spectroscopy data for which all methods where tested and (ii) to predict the long term recovery of patients after traumatic brain injury from multi-modal brain Magnetic Resonance Imaging. In both datasets our methods yield valuable results compared to the standard approach
APA, Harvard, Vancouver, ISO, and other styles
49

Durbec, Jean-Pierre. "Traitement statistique des données en océanologie biologique : modèles adaptés à l' "in situ" et à l'expérimentation." Aix-Marseille 2, 1988. http://www.theses.fr/1988AIX22012.

Full text
APA, Harvard, Vancouver, ISO, and other styles
50

Picard, Jacques. "Structure, classification et discrimination des profils évolutifs incomplets et asynchrones." Lyon 1, 1987. http://www.theses.fr/1987LYO19044.

Full text
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography