Dissertations / Theses on the topic 'Modelos de regresión generalizados'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Modelos de regresión generalizados.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Tarsicio, De Zan Arturo. "Principios de metodología de superficie de respuesta para modelos logísticos." Doctoral thesis, Universitat Politècnica de Catalunya, 2006. http://hdl.handle.net/10803/6518.
Full textIn this PhD thesis we approached some principles that relate to the study the Response Surface Methodology (abbreviated as RSM) for binary responses (Bernoulli and binomial distributions), modellable through the scope of Generalized Linear Models (abbreviated as GLM}. Our starting point is the classic approach of the RSM, in the context of linear normal models and, particularly, from the seminal work on the subject, by the article of Box and Wilson (1951). Our first research question from which we started ellaborating this work was around of the following statement: "How could experimenters deal with this problem when the nature of the process does not follow the classical assumptions of normality and linearity?". Connecting this question with the present state-of-the-art in RSM, the second question that we address is: "How could one design a sequential strategy to learn about the operation of a system with binary response, when certain objectives are persecuted?". In order to explore these questions deeper by means of a methodological support, we leaned towards the GLM approach. These models -presented and formulated primarily in the work of Nelder and Wedderburn (1972)- are the tool that we have chosen in order to find a systematic applied methodology, that aims for suitable models that can be fitted to binary response.We consider as a particular strategy, the one in which the experimenter has a fixed number of observations to be made, in what we labeled as "strategy of fixed budget". Thus, the objective will be to quantify the information gain once we have used all the budget available. In both cases, our plan is to carry out 2-level factorial and sequential designs. Our approach starts with a definition of a family of design strategies for exploration of a process that is being represented by a certain response surface. These strategies are characterized though three variables: w, bounded between 0 and 1, used to define the first experimentation center point. Once that is determined, a second variable is considered: L, or the range of variation of the factors. Finally, when several experimental conditions were considered, the variable S, identifies the jump length that connects one center point of experimentation with the following one, Having defined the scope this way, we can say that a design strategy may be characterized by means of a three-variable picture: L, S and w. Once the experimenter defined what kind of response surface is the best one to approach the real process, the goal will be to find the levels of L, S and w that maximizes the value of two alternative criteria: the first one is based on the determinant of the Fisher's Information Matrix, and it captures (he amount of information gathered by the design, and the second one is the value taken by the theoretical surface on the maximum of the fitted surface. In order to this scope, we have written some programs in R language (www.r-proiect.org), a powerful and flexible environment of programming and doing statistics.A complete bibliographical review of both topics (RSM and GLM), as well as the design of "ad-hoc" specific software, try to offer a new and an original point of view to study this problem, which maybe useful as a starting point for continuing the research in these areas and the link between these two methodologies. It is of special interest the exploration of new practical applications to real problems based on some objective criteria that can support the process of decision making.
Zan, Arturo T. de. "Principios de metodología de superficie de respuesta para modelos logísticos." Doctoral thesis, Universitat Politècnica de Catalunya, 2006. http://hdl.handle.net/10803/6518.
Full textNuestra pregunta de investigación alrededor de la cual hemos elaborado este trabajo gira alrededor del siguiente planteamiento: "¿cómo podría proceder el experimentador cuando la naturaleza de su proceso no sigue los supuestos clásicos de normalidad y linealidad?". Enlazando esta cuestión con el estado actual del arte en materia de la MSR, una segunda pregunta fue: "¿Cómo podría ser un proceso secuencial de aprendizaje del funcionamiento de un sistema en los que intervengan respuestas de naturaleza binaria en el que se persiga un objetivo determinado?". Para poder investigar con mayor profundidad esta pregunta, y mediante un sustento metodológico lo suficientemente sólido, nos apoyamos en los MLG. Estos modelos -a partir de su primera presentación y formulación en el trabajo de Nelder y Wedderburn (1972)- son la herramienta que elegimos para encontrar una metodología de aplicación sistemática, que nos permita buscar modelos adecuados que puedan ajustar respuestas de naturaleza binaria. Consideramos como estrategia particular aquella en la que se encontraría el experimentador cuando dispone de un número fijo de observaciones a realizar de las variables de un sistema, que traducimos con el nombre de "estrategia de presupuesto fijo". Así, el objetivo será poder cuantificar de alguna forma la ganancia de información que alcanzamos a conocer del proceso luego de haber utilizado todo el presupuesto disponible. En todos los casos nuestro plan es el de utilizar familias de estrategias de diseños factoriales a dos niveles, secuencialmente encadenados. Nuestro estudio comienza definiendo una familia de estrategias de exploración de un proceso representado por una superficie de respuesta teórica binaria, en la que hemos identificado tres variables: un valor llamado w, acotado entre 0 y 1, el cual es utilizado para definir el primer centro de experimentación. Luego, se considera una segunda variable, que será el valor que tenga el rango de variación de los factores, L, y finalmente, cuando se ensayen nuevas alternativas de puntos de diseño, habrá un valor S, que llamaremos "salto", que representará la longitud que separa un centro de diseño del siguiente. De esta manera, diremos que una estrategia de diseño queda caracterizada por los valores L, S y w. Partiendo así de una superficie de respuesta que sea la que mejor se considera que se aproxima a un proceso real, el objetivo será el de encontrar a través de simulaciones los niveles de w, L y S que alcancen los mejores valores posibles bajo dos criterios de selección de diseños: (a) una basada en el determinante de la Matriz de Información de Fisher (que hemos llamado "criterio de la cantidad de información"), y (b) el otro, basado en el valor de la superficie teórica evaluado en las mejores condiciones que se obtengan del modelo ajustado (que hemos llamado "criterio de proximidad al máximo"). A tal efecto, hemos utilizado programas escritos en el lenguaje R (www.r-project.orq), un entorno de programación potente y flexible,
La completa revisión bibliográfica de ambos temas (MSR y MLG), junto con el diseño de herramientas informáticas "ad-hoc", ofrecen un enfoque novedoso y origina! que puede servir como punto de partida para continuar buscando el enlace entre estas dos metodologías y su aplicación en problemas prácticos sobre la base de criterios objetivos que puedan soportar la toma de decisiones.
In this PhD thesis we approached some principles that relate to the study the Response Surface Methodology (abbreviated as RSM) for binary responses (Bernoulli and binomial distributions), modellable through the scope of Generalized Linear Models (abbreviated as GLM}. Our starting point is the classic approach of the RSM, in the context of linear normal models and, particularly, from the seminal work on the subject, by the article of Box and Wilson (1951). Our first research question from which we started ellaborating this work was around of the following statement: "How could experimenters deal with this problem when the nature of the process does not follow the classical assumptions of normality and linearity?". Connecting this question with the present state-of-the-art in RSM, the second question that we address is: "How could one design a sequential strategy to learn about the operation of a system with binary response, when certain objectives are persecuted?". In order to explore these questions deeper by means of a methodological support, we leaned towards the GLM approach. These models -presented and formulated primarily in the work of Nelder and Wedderburn (1972)- are the tool that we have chosen in order to find a systematic applied methodology, that aims for suitable models that can be fitted to binary response.
We consider as a particular strategy, the one in which the experimenter has a fixed number of observations to be made, in what we labeled as "strategy of fixed budget". Thus, the objective will be to quantify the information gain once we have used all the budget available. In both cases, our plan is to carry out 2-level factorial and sequential designs. Our approach starts with a definition of a family of design strategies for exploration of a process that is being represented by a certain response surface. These strategies are characterized though three variables: w, bounded between 0 and 1, used to define the first experimentation center point. Once that is determined, a second variable is considered: L, or the range of variation of the factors. Finally, when several experimental conditions were considered, the variable S, identifies the jump length that connects one center point of experimentation with the following one, Having defined the scope this way, we can say that a design strategy may be characterized by means of a three-variable picture: L, S and w. Once the experimenter defined what kind of response surface is the best one to approach the real process, the goal will be to find the levels of L, S and w that maximizes the value of two alternative criteria: the first one is based on the determinant of the Fisher's Information Matrix, and it captures (he amount of information gathered by the design, and the second one is the value taken by the theoretical surface on the maximum of the fitted surface. In order to this scope, we have written some programs in R language (www.r-proiect.org), a powerful and flexible environment of programming and doing statistics.
A complete bibliographical review of both topics (RSM and GLM), as well as the design of "ad-hoc" specific software, try to offer a new and an original point of view to study this problem, which maybe useful as a starting point for continuing the research in these areas and the link between these two methodologies. It is of special interest the exploration of new practical applications to real problems based on some objective criteria that can support the process of decision making.
Mendes, Clarice Camargo. "Modelos para dados de contagem com aplicações." [s.n.], 2007. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307184.
Full textDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica
Made available in DSpace on 2018-08-08T17:00:10Z (GMT). No. of bitstreams: 1 Mendes_ClariceCamargo_M.pdf: 1127292 bytes, checksum: f015352011300a41bb50c17c81a49bb1 (MD5) Previous issue date: 2007
Resumo: Ao lidarmos com dados de contagem, uma abordagem possível é estimar um Modelo Linear Generalizado com distribuição de Poisson. Freqüentemente nestes modelos costuma surgir o problema da superdispersão, um fenômeno que aparece quando estamos diante de uma variabilidade dos dados maior do que a média. Temos basicamente três soluções para este problema: abordagem bayesiana, assumindo que o parâmetro do modelo possui uma distribuição de probabilidade; estimação por Quase-verossimilhança, incluindo um fator de dispersão diferente da unidade ou uma função de variância diversa e, finalmente, o emprego de modelos mistos, com a separação de efeitos fixos e aleatórios. Outra ocorrência comum para dados de contagem é encontrarmos amostras que apresentem um número excessivo de zeros. Detectamos a presença da superdispersão, mas agora ela é devida à ocorrência de mais valores zero na amostra do que seria esperado para dados que seguissem a distribuição de Poisson. Para este caso Lambert (1982) apresenta a chamada regressão de Poisson inflacionada de zeros (ZIP - Zero lnflated Poisson). Através de uma aplicação a dados reais, em estudo referente à alimentação de rãs da espécie Adenomera, identificamos os melhores modelos para explicar a quantidade de comida ingerida em função dos efeitos de sexo e da estação do ano. Utilizamos técnicas de diagnóstico para avaliar o impacto que uma determinada observação exerce na estimativa dos parâmetros.
Abstract: When one deals with count data, a possible approach is to fit a generalized linear model with Poisson distribution. Usually it may occur the problem of superdispersion, when the variability of the data is greater then the mean. There are three basic solutions to this problem: the Bayesian approach, when we assume that the parameter of the mo deI has a distribution of probability; the Quasilikelihood estimation, including a non-unitary dispersion parameter or a different variance function and, finally, the mixed models. Another possible occurrence to count data is the presence of samples with an excess of zeros. We detect the presence of the superdispersion, but now it is due to more zero counts than expected from the Poisson distribution. For this case, Lambert (1982) presents the Zero Infiated Poisson (ZIP) mode. As an application to real data, in the study of frogs' nourishment from the species Adenomera, we identify the best models to explain the quantity of swallowed food related to sex and season effects. We employ techniques of diagnosis to verify the impact of a specific observation in the parameter estimations
Mestrado
Bioestatistica
Mestre em Estatística
Vásquez, Beltrán Aníbal Alcides. "Modelos de regresión gamma generalizada cero-inflacionada para la media con aplicación a gastos en educación." Master's thesis, Pontificia Universidad Católica del Perú, 2018. http://tesis.pucp.edu.pe/repositorio/handle/123456789/12999.
Full textTesis
Gallego, Blasco Vicente Salvador. "Análisis de la incidencia de factores causales en la evolución de la siniestralidad laboral en España." Doctoral thesis, Universitat Politècnica de València, 2021. http://hdl.handle.net/10251/168774.
Full text[CA] Partint de les dades corresponents als accidents ocorreguts en el període 1995-2017, es La Llei de Prevenció de Riscos Laborals de 8 de novembre de 1995 (*LPRL), en vigor des del 10 de febrer de 1996, estableix en el seu article 5: "tindrà per objecte la promoció de la millora de les condicions de treball dirigida a elevar el nivell de protecció de la seguretat i la salut dels treballadors en el treball." En aquesta Tesi s'ha investigat l'evolució dels índexs de sinistralitat laboral i la seua relació amb l'evolució de diferents variables explicatives relacionades amb el desenvolupament normatiu, el mercat de treball, l'estructura productiva, les condicions d'ocupació i les condicions individuals, entre altres, per al cas d'Espanya i en el període 1995-2017, que abasta des de la promulgació de la LPRL fins a dates recents on es disposava de les dades històriques necessàries. La investigació s'ha centrat en els índexs de salut més rellevants segons el seu significat en termes de risc i/o els seus components. L'objectiu de la investigació ha sigut el trobar evidències sobre relacions causa-efecte entre índexs i variables, a partir de les quals extraure lliçons que facilitaran una millor planificació de l'acció preventiva. Per a això, s'han proposat diversos models explicatius utilitzant diferents eines estadístiques, que han permés formular de manera explícita i analitzar la relació entre l'evolució dels indicadors de salut ocupacional i l'evolució de les principals variables explicatives. En termes generals pot concloure's que la implantació d'aquesta llei i normativa que l'acompanya ha tingut un impacte positiu en les condicions de treball i en conseqüència sobre el nivell de seguretat i salut dels treballadors des de llavors i fins hui. No obstant això, s'observen diferents comportaments cíclics en l'evolució dels indicadors, com ara els índexs d'incidència, freqüència i gravetat, que posa de manifest la seua dependència de la naturalesa i comportament cíclic d'algunes de les variables explicatives més importants relacionades amb cicles econòmics, mercat de treball, estructura productiva, etc. A més, s'observa com a aspectes com ara la pertinença a grups d'edat joves o experts, el nivell d'estudis, determinades categories professionals, i alguns sectors particulars tenen efectes significatius sobre els valors aconseguits pels índexs de sinistralitat. En canvi, uns altres, com el treball a temps parcial o la contractació temporal no manifesten tindre tanta repercussió sobre els indicadors.
[EN] The Occupational Risk Prevention Act of November 8, 1995 (ORPA), in force since February 10, 1996, establishes in its article 5: "will have as its objective the promotion of the improvement of working conditions aimed at raise the level of protection of the safety and health of workers at work. " This thesis has investigated the evolution of the occupational accident rates and their relationship with the evolution of different explanatory variables related to regulatory development, the labor market, the productive structure, employment conditions and individual conditions, among others, in the case of Spain and in the period 1995-2017, which ranges from the enactment of the LPRL to recent dates where the necessary historical data was available. Research has focused on the most relevant health indices according to their meaning in terms of risk and / or their components. The objective of the research has been to find evidence on cause-effect relationships between indices and variables, from which to extract lessons that will facilitate better planning of preventive action. To this end, several explanatory models have been proposed using different statistical tools, which have made it possible to explicitly formulate and analyze the relationship between the evolution of occupational health indicators and the evolution of the main explanatory variables. In general terms, it can be concluded that the implementation of said law and accompanying regulations has had a positive impact on working conditions and consequently on the level of health and safety of workers since then and to date. However, different cyclical behaviors are observed in the evolution of the indicators, such as incidence, frequency and severity indices, which highlights their dependence on the nature and cyclical behavior of some of the most important explanatory variables related to economic cycles, labor market, productive structure, etc. Furthermore, aspects such as belonging to young age groups or experts, educational level, certain professional categories, and some particular sectors are observed as having significant effects on the values reached by the accident rates. On the other hand, others, such as part-time work or temporary hiring, do not claim to have such an impact on the indicators.
Gallego Blasco, VS. (2021). Análisis de la incidencia de factores causales en la evolución de la siniestralidad laboral en España [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/168774
TESIS
Paula, Marcelo de. "Uma família de modelos de regressão com a distribuição original da variável resposta." Universidade Federal de São Carlos, 2013. https://repositorio.ufscar.br/handle/ufscar/4490.
Full textFinanciadora de Estudos e Projetos
We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates.
É sabido que a área de modelagem estatística por regressão sofreu um grande impulso desde o desenvolvimento dos modelos lineares generalizados (MLGs) no início da década de 70 do Século XX, propostos por Nelder e Wedderburn (1972). A teoria dos MLGs pode ser interpretada como uma generalização do modelo de regressão linear tradicional, em que a variável resposta não precisa necessariamente assumir a distribuição normal, e sim, qualquer distribuição pertencente à família exponencial de distribuições. Em algumas situações, porém, a distribuição da variável resposta Se originalmente fruto de uma outra distribuição discreta ou contínua, ou seja, a variável resposta tem uma distribuição original que não Se a usualmente considerada. Um exemplo desta situação Se a dicotomização de uma variável discreta ou contínua por meio de um ponto de corte arbitrário. Além disso, a variável resposta pode estar relacionada, de alguma forma, com uma outra variável de interesse. Nesse trabalho propomos uma família de modelos de regressão com a informação da variável resposta original, cuja distribuição de probabilidades ou função densidade de probabilidade pertence à família exponencial. O modelo de regressão logística com resposta normal e log-normal desenvolvido por Suissa e Blais (1995) Se apresentado como caso particular dos modelos de regressão com resposta de origem. Para a resposta de origem normal consideramos os modelos logístico, exponencial, geométrico, Poisson e log-normal. Para a resposta de origem exponencial consideramos os modelos logístico, normal, geométrico, Poisson e log-normal. Em contribuição ao trabalho de Suissa e Blais atribuímos duas respostas discretas ao modelo logístico, geométrico e de Poisson, e também consideramos uma resposta contínua normal com estrutura heteroscedástica. Adicionalmente, propomos também o modelo logístico com resposta pertencente à classe de distribuições séries de potências inflacionadas considerando o caso particular da resposta geométrica zero inflacionada. Realizamos vários estudos com dados artificiais comparando o modelo de regressão proposto com a informação da distribuição de origem e o modelo de regressão usual. Dois conjuntos de dados reais também são considerados. Assumindo uma distribuição corretamente especificada, o modelo produz estimativas de máxima verossimilhança mais eficientes e estimativas intervalares mais precisas para os coeficientes de regressão.
Briones, Zúñiga José Luis. "Modelo autorregresivo con heterocedasticidad condicionada generalizada fraccionalmente integrado. Caso: Estimación de la volatilidad del tipo de cambio nominal del Perú." Master's thesis, Universidad Nacional Mayor de San Marcos, 2018. https://hdl.handle.net/20.500.12672/10072.
Full textTesis
Karcher, Cristiane. "Redes Bayesianas aplicadas à análise do risco de crédito." Universidade de São Paulo, 2009. http://www.teses.usp.br/teses/disponiveis/3/3142/tde-25052009-162507/.
Full textCredit Scoring Models are used to estimate the insolvency probability of a customer, in a period, based on their personal and financial information. In this text, the proposed model for Credit Scoring is Bayesian Networks (BN) and its results were compared to Logistic Regression. The BN evaluated were the Bayesian Networks Classifiers, with structures of type: Naive Bayes, Tree Augmented Naive Bayes (TAN) and General Bayesian Network (GBN). The RB structures were developed using a Structure Learning technique from a real database. The models performance were evaluated and compared through the hit rates observed in Confusion Matrix, Kolmogorov-Smirnov statistic and Gini coefficient. The development and validation samples were obtained using a Cross-Validation criteria with 10-fold. The analysis showed that the fitted BN models have the same performance as the Logistic Regression Models, evaluating the Kolmogorov-Smirnov statistic and Gini coefficient. The TAN Classifier was selected as the best BN model, because it performed better in prediction of bad customers and allowed an interaction effects analysis between variables.
Rodrigues, José Tenylson Gonçalves. "Análise de dados longitudinais para variáveis binárias." Universidade Federal de São Carlos, 2009. https://repositorio.ufscar.br/handle/ufscar/4531.
Full textFinanciadora de Estudos e Projetos
The objective of this work is to present techniques of regression analysis for longitudinal data when the response variable is binary. Initially, there is a review of generalized linear models, marginal models, transition models, mixed models, and logistic regression methods of estimation, which will be necessary for the development of work. In addition to the methods of estimation, some structures of correlation will be studied in an attempt to capture the intra-individual serial dependence over time. These methods were applied in two situations, one where the response variable is continuous and normal distribution, and another when the response variable has the Bernoulli distribution. It was also sought to explore and present techniques for selection of models and diagnostics for the two cases. Finally, an application of the above methodology will be presented using a set of real data.
O objetivo deste trabalho é apresentar técnicas de análise de regressão para dados longitudinais quando a variável resposta é binária. Inicialmente, é feita uma revisão sobre modelos lineares generalizados, modelos marginais, modelos de transição, modelos mistos, regressão logística e métodos de estimação, pois serão necessários para o desenvolvimento do trabalho. Além dos métodos de estimação, algumas estruturas de correlação serão estudadas, na tentativa de captar a dependência serial intra-indivíduo ao longo do tempo. Estes métodos foram aplicados em duas situações; uma quando a variável resposta é contínua, e se assume ter distribuição normal, e a outra quando a variável resposta assume ter distribuição de Bernoulli. Também se procurou pesquisar e apresentar técnicas de seleção de modelos e de diagnósticos para os dois casos. Ao final, uma aplicação com a metodologia pesquisada será apresentada utilizando um conjunto de dados reais.
Nakamura, Luiz Ricardo. "Advances on the Birnbaum-Saunders distribution." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-30092016-171320/.
Full textA distribuição Birnbaum-Saunders (BS) é o modelo mais popular utilizado para descrever processos de fadiga. Ao longo dos anos, essa distribuição vem recebendo aplicações nas mais diversas áreas, demandando assim algumas extensões mais flexíveis para resolver problemas mais complexos. Uma das extensões mais conhecidas na literatura é a família de distribuições Birnbaum-Saunders generalizada (GBS), que inclui as distribuições Birnbaum-Saunders casoespecial (BS-SC) e Birnbaum-Saunders t generalizada (BSGT) como modelos especiais. Embora a distribuição BS-SC tenha sido previamente desenvolvida na literatura, nunca foi estudada mais profundamente e, assim, nesta tese, um estudo bayesiano é desenvolvido acerca da mesma além de um novo gerador de números aleatórios dessa distribuição ser apresentado. Adicionalmente, um modelo de regressão baseado na distribuição BSGT é desenvolvido utilizando-se os modelos aditivos generalizados para locação, escala e forma (GAMLSS), os quais apresentam grande flexibilidade tanto para a assimetria como para a curtose. Uma nova extensão da distribuição BS também é apresentada, denominada família de distribuições Birnbaum-Saunders potência (BSP), que contém inúmeros casos especiais ou limites já publicados na literatura, incluindo a família GBS. A principal característica desta nova família é que ela é capaz de produzir formas tanto uni como bimodais dependendo do valor de seus parâmetros. Esta nova família também é introduzida na estrutura dos modelos GAMLSS para fornecer uma ferramenta capaz de modelar todos os parâmetros da distribuição como funções lineares e/ou não-lineares suavizadas de variáveis explicativas. Ao longo desta tese são apresentadas cinco diferentes aplicações em conjuntos de dados reais para ilustrar os resultados teóricos obtidos.
Araujo, Adrilayne dos Reis. ""Regressão logística com resposta contínua"." Universidade de São Paulo, 2002. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-27012006-125807/.
Full textBinary regression with continuous outcomes constitutes an alternative to logistic regression when the outcome is continuous and the investigators interest focuses to estimate the probability of subjects who fall above or below a cut-off value. The model is based on a generalized linear model with composite link that takes advantage of the continuous structure of the outcome, typically gaussian or lognormal. Under correct response model-ling, binary regression with continuous outcomes is more efficient than logistic regression. A binary regression with continuous outcomes was considered to predict the risk that a NO2 pollutant concentration is above the limits set by environmental legislation in São Paulo city during 1998 and 1999. Climatic and temporal variables were considered as pre-dictors. Temperature, humidity, days of the week, station of the year, precipitation and speed of the wind revealed important to predict the risk.
Lídia, Coco Terra Maria. "Modelos lineares generalizados simétricos heteroscedásticos." Universidade Federal de Pernambuco, 2009. https://repositorio.ufpe.br/handle/123456789/6132.
Full textConselho Nacional de Desenvolvimento Científico e Tecnológico
A classe de modelos lineares generalizados simétricos heteroscedásticos é caracterizada pela resposta pertencente à classe simétrica de distribuições, um preditor linear relacionado com o parâmetro de posição e um preditor linear relacionado com o parâmetro de escala, ambos relacionado através de funções de ligação. Estes modelos são uma extensão natural dos modelos lineares generalizados simétricos (MLGS) proposta por Lobos (2004), em que apenas o parâmetro de posição é relacionado por um preditor linear através de uma função de ligação duplamente diferenciável. Neste trabalho, inicialmente, apresentamos alguns resultados nos MLGS heteroscedásticos. Em seguida, testes assintóticos para avaliar homoscedasticidade são propostos bem como métodos de diagnósticos sob o enfoque de influência local. Alguns exemplos com dados reais serão discutidos a fim de ilustrar a teoria desenvolvida
Morellato, Saulo Almeida 1983. "Inferência estatística para regressão múltipla h-splines." [s.n.], 2014. http://repositorio.unicamp.br/jspui/handle/REPOSIP/306505.
Full textTese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica
Made available in DSpace on 2018-08-25T00:25:46Z (GMT). No. of bitstreams: 1 Morellato_SauloAlmeida_D.pdf: 32854783 bytes, checksum: 040664acd0c8f1efe07cedccda8d11f6 (MD5) Previous issue date: 2014
Resumo: Este trabalho aborda dois problemas de inferência relacionados à regressão múltipla não paramétrica: a estimação em modelos aditivos usando um método não paramétrico e o teste de hipóteses para igualdade de curvas ajustadas a partir do modelo. Na etapa de estimação é construída uma generalização dos métodos h-splines, tanto no contexto sequencial adaptativo proposto por Dias (1999), quanto no contexto bayesiano proposto por Dias e Gamerman (2002). Os métodos h-splines fornecem uma escolha automática do número de bases utilizada na estimação do modelo. Estudos de simulação mostram que os resultados obtidos pelos métodos de estimação propostos são superiores aos conseguidos nos pacotes gamlss, mgcv e DPpackage em R. São criados dois testes de hipóteses para testar H0 : f = f0. Um teste de hipóteses que tem sua regra de decisão baseada na distância quadrática integrada entre duas curvas, referente à abordagem sequencial adaptativa, e outro baseado na medida de evidência bayesiana proposta por Pereira e Stern (1999). No teste de hipóteses bayesiano o desempenho da medida de evidência é observado em vários cenários de simulação. A medida proposta apresentou um comportamento que condiz com uma medida de evidência favorável à hipótese H0. No teste baseado na distância entre curvas, o poder do teste foi estimado em diversos cenários usando simulações e os resultados são satisfatórios. Os procedimentos propostos de estimação e teste de hipóteses são aplicados a um conjunto de dados referente ao trabalho de Tanaka e Nishii (2009) sobre o desmatamento no leste da Ásia. O objetivo é escolher um entre oito modelos candidatos. Os testes concordaram apontando um par de modelos como sendo os mais adequados
Abstract: In this work we discuss two inference problems related to multiple nonparametric regression: estimation in additive models using a nonparametric method and hypotheses testing for equality of curves, also considering additive models. In the estimation step, it is constructed a generalization of the h-splines method, both in the sequential adaptive context proposed by Dias (1999), and in the Bayesian context proposed by Dias and Gamerman (2002). The h-splines methods provide an automatic choice of the number of bases used in the estimation of the model. Simulation studies show that the results obtained by proposed estimation methods are superior to those achieved in the packages gamlss, mgcv and DPpackage in R. Two hypotheses testing are created to test H0 : f = f0. A hypotheses test that has a decision rule based on the integrated squared distance between two curves, for adaptive sequential approach, and another based on the Bayesian evidence measure proposed by Pereira and Stern (1999). In Bayesian hypothesis testing the performance measure of evidence is observed in several simulation scenarios. The proposed measure showed a behavior that is consistent with evidence favorable to H0. In the test based on the distance between the curves, the power of the test was estimated at various scenarios using simulations, and the results are satisfactory. At the end of the work the proposed procedures of estimation and hypotheses testing are applied in a dataset concerning to the work of Tanaka and Nishii (2009) about the deforestation in East Asia. The objective is to choose one amongst eight models. The tests point to a pair of models as being the most suitableIn this work we discuss two inference problems related to multiple nonparametric regression: estimation in additive models using a nonparametric method and hypotheses testing for equality of curves, also considering additive models. In the estimation step, it is constructed a generalization of the h-splines method, both in the sequential adaptive context proposed by Dias (1999), and in the Bayesian context proposed by Dias and Gamerman (2002). The h-splines methods provide an automatic choice of the number of bases used in the estimation of the model. Simulation studies show that the results obtained by proposed estimation methods are superior to those achieved in the packages gamlss, mgcv and DPpackage in R. Two hypotheses testing are created to test H0 : f = f0. A hypotheses test that has a decision rule based on the integrated squared distance between two curves, for adaptive sequential approach, and another based on the Bayesian evidence measure proposed by Pereira and Stern (1999). In Bayesian hypothesis testing the performance measure of evidence is observed in several simulation scenarios. The proposed measure showed a behavior that is consistent with evidence favorable to H0. In the test based on the distance between the curves, the power of the test was estimated at various scenarios using simulations, and the results are satisfactory. At the end of the work the proposed procedures of estimation and hypotheses testing are applied in a dataset concerning to the work of Tanaka and Nishii (2009) about the deforestation in East Asia. The objective is to choose one amongst eight models. The tests point to a pair of models as being the most suitable
Doutorado
Estatistica
Doutor em Estatística
Terra, Maria Lídia Coco, and Audrey Helen A. Cysneiros. "Modelos Não Lineares Generalizados com Superdispersão." Universidade Federal de Pernambuco, 2013. https://repositorio.ufpe.br/handle/123456789/12148.
Full textMade available in DSpace on 2015-03-12T14:03:12Z (GMT). No. of bitstreams: 2 TeseDoutoradoMariaLidia.pdf: 1307418 bytes, checksum: f88f918ecc9fbd62d6fddde58ecb741f (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013
CAPES
Dey et al. (1997) propuseram uma classe de modelos que permite a introdução de um segundo parâmetro que controla a variância independentemente da média através de um modelo de regressão, chamada modelos lineares generalizados com superdispersão. Nesta tese, estendemos a classe de modelos proposta por Dey et al. (1997) permitindo que as funções de ligações da média e da dispersão possam ser funções não lineares obtendo expressões matriciais para os fatores de correção Bartlett e tipo-Bartlett para as estatísticas da razão da verossimilhanças e escore, respectivamente, na classe dos modelos não lineares generalizados com superdispersão (MNLGSs). Foi realizado um estudo de simulação para avaliar os desempenhos dos testes baseados nas estatísticas da razão de verossimilhanças e escore com suas respectivas versões corrigidas (Bartlett e tipo-Bartlett) com relação ao tamanho e poder em amostras de tamanhos finitos. Propomos também técnicas de diagnósticos para os MNLGSs, tais como: Alavancagem generalizada, Distância de Cook e Influência local. Finalmente, um conjunto de dados reais é utilizado para avaliar nossos resultados teóricos
ARAÚJO, Yuri Alves de. "Modelos não lineares parciais generalizados superdispersados." Universidade Federal de Pernambuco, 2017. https://repositorio.ufpe.br/handle/123456789/24575.
Full textMade available in DSpace on 2018-05-07T22:34:45Z (GMT). No. of bitstreams: 1 DISSERTAÇÃO Yuri Alves de Araújo.pdf: 758815 bytes, checksum: d5dcd9d661e8145ae2ace6d8e4d10444 (MD5) Previous issue date: 2017-02-20
CAPES
Os modelos de regressão são amplamente utilizados quando desejamos avaliar o comportamento de uma ou mais características de interesse (variáveis respostas), em função de outras características observadas (variáveis explicativas). No entanto, os modelos usuais em geral são bastante restritivos e, naturalmente, ocorre uma busca por modelos cada vez mais flexíveis. Neste contexto, Dey et al. (1997) propõem uma classe de modelos lineares generalizados superdispersados, os quais tem a capacidade de controlar a vari-abilidade modelando também sua dispersão de forma independente de sua média. Por outro lado, classes de modelos semiparamétricos estão cada vez mais relevantes na literatura, visto que estes apresentam grande flexibilidade na relação entre a variável resposta e suas correspondentes variáveis explicativas. Nesta dissertação estendemos a classe de modelos superdispersados propostos por Dey et al. (1997) para o âmbito semiparamétrico, ao considerar que a média e a dispersão da variável resposta dependem de componentes paramétricos não lineares e de componentes não paramétricos. Propomos um processo de estimação conjunto dos parâmetros do modelo, e adicionalmente, um critério para a seleção dos parâmetros associados à suavidade das funções não paramétricas. Desenvolvemos técnicas de diagnóstico baseadas em medidas de alavancagem, análise de resíduos e influência local. Na análise de influência local, foram considerados três esquemas de perturbação: perturbação na variável resposta, perturbação nos preditores e ponderação de casos. Por fim, foram realizadas implementações computacionais das técnicas de diagnóstico com o auxilio do software R, as quais são relacionadas com propostas de aplicações práticas envolvendo análise de dados reais.
Regression models are widely used when we want to evaluate the behavior of one or more characteristics of interest (response variables), according to other observed charac-teristics (explanatory variables). However, usual models are so restrictive and, naturally, a search for models is becoming increasingly flexible. In this context, Dey et al. (1997) proposed a class of overdispersed generalized linear models, which has the capacity to controls variability the also modeling a dispersion independently of the mean. On the other hand, are increasingly relevant in literature, since they have great flexibility in the rela-tionship between the response variable and their corresponding explanatory variables. In this work, we extend to the class of models proposed by Dey et al. (1997) for semiparame-tric context, considering that the mean and the dispersion for response variable depend on nonlinear parametric components and nonparametric components. We propose the joint parameter estimation process, and in addition, a selection criteria for the smooth param-eters associated with nonparametric functions. We develop diagnostic techniques based on leverage measures, residuals analisys and local influence under different perturbation schemes. Finally, applications to real data are presented.
Melo, Martínez Oscar Orlando. "Modelos lineales generalizados geoestadísticos basados en distancias." Doctoral thesis, Universitat de Barcelona, 2013. http://hdl.handle.net/10803/127219.
Full textIn the context of regression with a beta-type response variable, we propose a new method that links two methodologies: a distance-based model, and a beta regression with variable dispersion. The proposed model is useful for those situations where the response variable is a rate, a proportion or parts per million. This variable is related with a mixture between continuous and categorical explanatory variables. We present its main statistical properties and some measures for selection of the most predictive dimensions in the model. Furthermore, the prediction of a new observation and the problem of missing data are also developed. Using the proposed model, the mutual funds are analyzed employing the Gower distance for both the mean model and the variable dispersion model. Also, we present a new method based on distances, which allows the modeling of continuous and non-continuous random variables through distance-based spatial generalized linear mixed models (SGLMMs). The parameters are estimated using Markov chain Monte Carlo (MCMC) maximum likelihood. The method is illustrated through the analysis of the variation in the prevalence of Loa loa among a sample of village residents in Cameroon, where the explanatory variables included elevation, together with maximum normalized-difference vegetation index (NDVI) and the standard deviation of NDVI calculated from repeated satellite scans over time. Additionally, we propose a beta spatial linear mixed model with variable dispersion using MCMC. An approach to the SGLMMs using the Box-Cox transformation in the precision model is developed. Thus, the parameter optimization process is made for both the spatial mean model as the spatial variable dispersion model. Statistical inference over the parameters is performed using approximations obtained from the asymptotic normality of the maximum likelihood estimator. Diagnosis and prediction of a new observation are also developed. This model is illustrated through of the clay and magnesium contents. On the other hand, we present a solution to problems where the response variable is a count, a rate or a binary (dichotomous) using a refined distance-based generalized linear space-time-autoregressive model with space-time-autoregressive disturbances. This model may also contain additional spatial exogenous variables as well as time exogenous variables. The parameter estimation process is done by the space-time generalized estimating equations (GEE) method, and a measure of goodness-of-fit is presented. Also, the best linear unbiased predictor for prediction purposes is presented. An application for the standardized number of armed actions per 1000 km2 of rebel groups FARC-EP and ELN in different departments of Colombia from 2003 to 2009 is employed to illustrate the proposed methodology. Finally, a spatial generalized linear mixed autoregressive model using distance-based is defined including spatial as well as temporal lags between vectors of stationary state variables. Although the structural parameters are not fully identified in this model, contemporaneous spatial lag coefficients may be identified by exogenous state variables. Dynamic spatial panel data econometrics is used to estimate our proposed model. In this way, the parameters are estimated using MCMC maximum likelihood. We also discuss the interaction between temporal and spatial stationarity, and we derive the impulse responses for our model, which naturally depend upon the temporal and spatial dynamics of the model.
Saavedra, Cayan Atreio Portela Bárcena. "Um aplicativo shiny para modelos lineares generalizados." Universidade de São Paulo, 2018. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-22012019-174209/.
Full textRecent technological and computational advances have brought alternatives that have led to changes in the way data analyzes and visualizations are done. One of these changes is characterized by the use of interactive platforms and dynamic graphics to carry out such analyzes. In this way, data analyzes and visualizations are no longer limited to a static environment, so exploring this dynamic interactivity can enable a wider range of data exploration and presentation. The present work aims to propose an interactive application, easy to use and with user-friendly interface, which enables studies and descriptive analysis and fit generalized linear models. This application is made using the shiny package in the R environment of statistical computing. The purpose of the application is to act as a support tool for statistical research and teaching. Users with no familiarity in programming can explore the data and perform the fit of generalized linear models without typing a single code line. Regarding teaching, the dynamics and interactivity of the application gives the student an uncomplicated way to investigate the methods involved, making it easier to assimilate concepts related to the subject.
Costa, Silvano Cesar da. "Modelos lineares generalizados mistos para dados longitudinais." Universidade de São Paulo, 2003. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-09052003-164143/.
Full textExperiments which response variables are proportions or counts are very common in several research areas, specially in the area of agriculture. The theory of generalized linear models, well difused (McCullagh & Nelder, 1989; Demetrio, 2001), is used for analyzing these experiments where the responses are independent. If the estimated variance is greater than the expected variance, the dispersion parameter is estimated including it on the parameter estimation process. When the response variable is observed over time a correlation among observations might occur and it should be taken into account in the parameter estimation. A way of dealing with this correlation is applying the methodology of generalized estimating equations (GEEs) discussed by Liang & Zeger (1986) although, in this case, the interest is on the estimates of the xed efect being the inclusion of a working correlation matrix useful to obtain more accurate estimates. Another alternative is the inclusion of a latent efect in the linear predictor to explain variabilities not considered in the model that might in uence the results. In this work the random efect and the dispersion parameter are combined and included together in the parameter estimation. Such methodology is applied to a data set obtained from an experiment realized with camu-camu to evaluate, through proportion of grafting well successful of seedling, which kind of grafting and understock are suitable to be used. Several models are fitted, since the split plot model (with independence assumption) up to the model where the dispersion parameter and the random efect are considered together. There is evidence that the model including the random efect and the dispersion parameter together, produce better estimates of the parameters. Another longitudinal data set used here comes from an experiment realized with the MON810 transgenic corn where the response variable is the number of caterpillars (Spodoptera frugiperda). In this case, due to the excessive number of zeros obtained, the zero in ated Poisson regression model (ZIP) is used in addition to the standard Poisson model, where observations are considered independent, and the zero in ated Poisson regression model with random efect. The results show that the random efect included in the linear predictor was not significant and, therefore, the adopted model is the zero in ated Poisson regression model. The results were obtained using the procedures NLMIXED, GENMOD and GPLOT available on SAS - Statistical Analysis System, version 8.2.
Barros, Fabiana Uchôa. "Refinamentos assintóticos em modelos lineares generalizados heteroscedáticos." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-12052017-103436/.
Full textIn this thesis, we have developed asymptotic refinements in heteroskedastic generalized linear models (Smyth, 1989). Initially, we obtain the second-order covariance matrix for the maximum likelihood estimators corrected by the bias of first-order. Based on the obtained matrix, we suggest changes in Wald statistics. In addition, we derive the coeficients of the Bartlett-type correction factor for the statistical gradient test. After, we get asymptotic skewness of the distribution of the maximum likelihood estimators of the model parameters. Finally, we show the asymptotic kurtosis coeficient of the distribution of the maximum likelihood estimators of the model parameters. Monte Carlo simulation studies are developed to evaluate the results obtained.
Monfardini, Frederico [UNESP]. "Modelos lineares generalizados bayesianos para dados longitudinais." Universidade Estadual Paulista (UNESP), 2016. http://hdl.handle.net/11449/138326.
Full textRejected by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br), reason: Solicitamos que realize uma nova submissão seguindo as orientações abaixo: O arquivo submetido está sem a ficha catalográfica. A versão submetida por você é considerada a versão final da dissertação/tese, portanto não poderá ocorrer qualquer alteração em seu conteúdo após a aprovação. Corrija esta informação e realize uma nova submissão contendo o arquivo correto. Agradecemos a compreensão. on 2016-05-06T14:24:35Z (GMT)
Submitted by FREDERICO MONFARDINI null (fred.monf@gmail.com) on 2016-05-11T01:12:32Z No. of bitstreams: 1 DISSERTAÇÃO - FREDERICO.pdf: 979406 bytes, checksum: 75d1f03b99c1e8e3627b3ee7b3776361 (MD5)
Rejected by Felipe Augusto Arakaki (arakaki@reitoria.unesp.br), reason: Solicitamos que realize uma nova submissão seguindo as orientações abaixo: O mês informado na capa e contra-capa do documento estão diferentes da data de defesa informada na folha de aprovação. Corrija estas informações no arquivo PDF e realize uma nova submissão contendo o arquivo correto. Agradecemos a compreensão. on 2016-05-13T13:14:09Z (GMT)
Submitted by FREDERICO MONFARDINI null (fred.monf@gmail.com) on 2016-05-16T04:01:38Z No. of bitstreams: 1 DISSSERTAÇÃO - FREDERICO.pdf: 1003174 bytes, checksum: 3449613d0bfa6567b122b1461608bc55 (MD5)
Approved for entry into archive by Felipe Augusto Arakaki (arakaki@reitoria.unesp.br) on 2016-05-16T14:41:59Z (GMT) No. of bitstreams: 1 monfardini_f_me_prud.pdf: 1003174 bytes, checksum: 3449613d0bfa6567b122b1461608bc55 (MD5)
Made available in DSpace on 2016-05-16T14:41:59Z (GMT). No. of bitstreams: 1 monfardini_f_me_prud.pdf: 1003174 bytes, checksum: 3449613d0bfa6567b122b1461608bc55 (MD5) Previous issue date: 2016-02-19
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Os Modelos Lineares Generalizados (GLM) foram introduzidos no início dos anos 70, tendo um grande impacto no desenvolvimento da teoria estatística. Do ponto de vista teórico, esta classe de modelos representa uma abordagem unificada de muitos modelos estatísticos, correntemente usados nas aplicações, podendo-se utilizar dos mesmos procedimentos de inferência. Com o avanço computacional das últimas décadas foi notável o desenvolvimento de extensões nesta classe de modelos e de métodos para os procedimentos de inferência. No contexto da abordagem Bayesiana, até a década de 80 utilizava-se de métodos aproximados de inferência, tais como aproximação de Laplace, quadratura Gaussiana e outros. No início da década de 90, foram popularizados os métodos de Monte Carlo via Cadeias de Markov (Monte Carlo Markov Chain - MCMC) que revolucionaram as aplicações no contexto Bayesiano. Apesar de serem métodos altamente eficientes, a convergência do algoritmo em modelos complexos pode ser extremamente lenta, o que gera alto custo computacional. Em 2009 surgiu o método de Aproximações de Laplace Aninhadas Integradas (Integrated Nested Laplace Aproximation - INLA) que busca eficiência tanto no custo computacional como na precisão das estimativas. Considerando a importância desta classe de modelos, neste trabalho propõem-se explorar extensões dos MLG para dados longitudinais e recentes propostas apresentadas na literatura para os procedimentos de inferência. Mais especificamente, explorar modelos para dados binários (binomiais) e para dados de contagem (Poisson), considerando a presença de variabilidade extra, incluindo superdispersão e presença de efeitos aleatórios através de modelos hierárquicos e modelos hierárquicos dinâmicos. Além disso, explorar diferentes procedimentos de inferência no contexto Bayesiano, incluindo MCMC e INLA.
Generalized Linear Models (GLM) were introduced in the early 70s, having a great impact on the development of statistical theory. From a theoretical point of view, this class of model is a unified approach to many statistical models commonly used in applications and can be used with the same inference procedures. With advances in the computer over subsequent decades has come a remarkable development of extensions in this class of design and method for inference procedures. In the context of Bayesian approach, until the 80s, it was used to approximate inference methods, such as approximation of Laplace, Gaussian quadrature, etc., The Monte Carlo Markov Chain methods (MCMC) were popularized in the early 90s and have revolutionized applications in a Bayesian context. Although they are highly efficient methods, the convergence of the algorithm in complex models can be extremely slow, which causes high computational cost. The Integrated Nested Laplace Approximations method (INLA), seeking efficiency in both computational cost and accuracy of estimates, appeared in 2009. This work proposes to explore extensions of GLM for longitudinal data considering the importance of this class of model, and recent proposals in the literature for inference procedures. More specifically, it explores models for binary data (binomial) and count data (Poisson), considering the presence of extra variability, including overdispersion and the presence of random effects through hierarchical models and hierarchical dynamic models. It also explores different Bayesian inference procedures in this context, including MCMC and INLA.
Monfardini, Frederico. "Modelos lineares generalizados bayesianos para dados longitudinais /." Presidente Prudente, 2016. http://hdl.handle.net/11449/138326.
Full textBanca: Fernando Moala
Banca: Thais Cristina Oliveira da Fonseca
Resumo: Os Modelos Lineares Generalizados (GLM) foram introduzidos no início dos anos 70, tendo um grande impacto no desenvolvimento da teoria estatística. Do ponto de vista teórico, esta classe de modelos representa uma abordagem unificada de muitos modelos estatísticos, correntemente usados nas aplicações, podendo-se utilizar dos mesmos procedimentos de inferência. Com o avanço computacional das últimas décadas foi notável o desenvolvimento de extensões nesta classe de modelos e de métodos para os procedimentos de inferência. No contexto da abordagem Bayesiana, até a década de 80 utilizava-se de métodos aproximados de inferência, tais como aproximação de Laplace, quadratura Gaussiana e outros. No início da década de 90, foram popularizados os métodos de Monte Carlo via Cadeias de Markov (Monte Carlo Markov Chain - MCMC) que revolucionaram as aplicações no contexto Bayesiano. Apesar de serem métodos altamente eficientes, a convergência do algoritmo em modelos complexos pode ser extremamente lenta, o que gera alto custo computacional. Em 2009 surgiu o método de Aproximações de Laplace Aninhadas Integradas (Integrated Nested Laplace Aproximation - INLA) que busca eficiência tanto no custo computacional como na precisão das estimativas. Considerando a importância desta classe de modelos, neste trabalho propõem-se explorar extensões dos MLG para dados longitudinais e recentes propostas apresentadas na literatura para os procedimentos de inferência. Mais especificamente, explorar modelos... (Resumo completo, clicar acesso eletrônico abaixo)
Abstract: Generalized Linear Models (GLM) were introduced in the early 70s, having a great impact on the development of statistical theory. From a theoretical point of view, this class of model is a unified approach to many statistical models commonly used in applications and can be used with the same inference procedures. With advances in the computer over subsequent decades has come a remarkable development of extensions in this class of design and method for inference procedures. In the context of Bayesian approach, until the 80s, it was used to approximate inference methods, such as approximation of Laplace, Gaussian quadrature, etc., The Monte Carlo Markov Chain methods (MCMC) were popularized in the early 90s and have revolutionized applications in a Bayesian context. Although they are highly efficient methods, the convergence of the algorithm in complex models can be extremely slow, which causes high computational cost. The Integrated Nested Laplace Approximations method (INLA), seeking efficiency in both computational cost and accuracy of estimates, appeared in 2009. This work proposes to explore extensions of GLM for longitudinal data considering the importance of this class of model, and recent proposals in the literature for inference procedures. More specifically, it explores models for binary data (binomial) and count data (Poisson), considering the presence of extra variability, including overdispersion and the presence of random effects through hierarchical models and hi... (Complete abstract click electronic access below)
Mestre
Goncalves, Nayara Francine de Moura. "Bootstrap em modelos auto-regressivos aditivos generalizados." Universidade Federal de Minas Gerais, 2009. http://hdl.handle.net/1843/RFFO-7UEPM7.
Full textA classe dos Modelos Aditivos Generalizados (MAG), considerados uma extensão dos Modelos Lineares Generalizados, vem atraindo a atenção de pesquisadores principalmente em função de sua flexibilidade. Apesar de construído sob a hipótese de independência dos dados, os MAGs são muito aplicados em estudos de séries temporais, sobretudo como alternativa para modelagem de variáveis de confusão tais como tendência e sazonalidade. Recentemente, modelos mais gerais, que consideram a estrutura de correlação entre os dados, como os modelos GLARMA (autoregressive moving average generalized linear models), têm sido utilizados. Este trabalho estende os modelos GLARMA para uma classe de modelos auto-regressivos aditivos generalizados para séries de contagem cuja distribuição condicional, dadas as observações passadas e as variáveis explicativas, segue uma distribuição de Poisson. Além de apresentar uma conceituação desses modelos bem como procedimentos de ajustes, este trabalho emprega, em um estudo empírico, o procedimento bootstrap em três formas (bootstrap nas observações, bootstrap condicional e bootstrap nos resíduos) na inferência pontual dos parâmetros do modelo e compara dois métodos de construção de intervalos de confiança bootstrap - bootstrap percentílico e bootstrap com correção do vício na estimação intervalar. Os resultados mostram que, em geral, os procedimentos e os intervalos de confiança bootstrap apresentam um bom desempenho quando utilizados na classe de MAGs que por sua vez, quando auxiliados pela modelagem GLARMA, modelam bem dados de contagem com estrutura auto-regressiva de ordem 1, apresentando estimativas próximas dos valores verdadeiros dos parâmetros.
PEREIRA, Fábio Cavalcanti. "Modelos lineares generalizados aplicados à filariose bancroftiana." Universidade Federal Rural de Pernambuco, 2006. http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/4978.
Full textMade available in DSpace on 2016-07-05T18:07:15Z (GMT). No. of bitstreams: 1 Fabio Cavalcanti Pereira.pdf: 280467 bytes, checksum: 8086a624ad0323f2488ae7dfba5c17d2 (MD5) Previous issue date: 2006-02-22
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
Bancroftian filariasis is a major public health problem in the tropics with 100 millions of people infected. It is a vector born infection and it is cause by Wuchereria bancrofti a parasite that lives in the human lymphatic vessels and lymph nodes affecting all ages and gender. The basic damage of the lymphatic system is lymphangiectasia which leads to lymphatic dysfunction producing lymphedema (elephantiasis), hydroecele and fistulization syndromes (chyluria, chylocele and lymph scrotum). The aim of this investigation was to study the relationship between the risk of developing fistulation syndrome and several parameters, such a amount of fat on the diet of patients assisted at Center for Teaching, Research and Tertiary Referral for bancroftian filariasis (NEPAF - Federal University of Pernambuco) in Recife, Brazil. The present study was carried out using the generalized linear models (GLMs) for the fitting of logistic model with the statistic program S-PLUS.
A Filariose Bancroftiana, ocorre como um dos maiores problemas de saúde púbica nos trópicos e afeta cerca de 100 milhões de indivíduos. Ë transmitida por um mosquito e causada pela Wuchereria bancrofti que vive nos vasos linfáticos e linfonodos dos seres humanos de todas as idades e ambos os sexos. O substrato anátomo-patológico da doença é a linfangiectasia que leva a uma disfunção linfática produzindo o linfedema (elefantíase), a hidrocele, e as síndromes de fistulização (quilúria, quilocele e linfoescroto). O objetivo dessa investigação se foi estudar a relação entre o risco de desenvolvimento das síndromes fistulizantes e vários parâmetros, tais como a quantidade de gordura na dieta de pacientes atendidos no Núcleo de Ensino, Pesquisa e Assistência em Filariose – NEPAF, Centro de Ciências da Saúde, UFPE. O presente estudo foi realizado usando-se a teoria dos modelos lineares generalizados (MLGs) para ajustar um modelo logístico para os dados da doença usando o programa estatístico S-PLUS.
Previdelli, Isolde Terezinha Santos. "Estimadores corrigidos para modelos não-lineares generalizados superdispersados." Florianópolis, SC, 2005. http://repositorio.ufsc.br/handle/123456789/101639.
Full textMade available in DSpace on 2013-07-15T22:50:45Z (GMT). No. of bitstreams: 1 255756.pdf: 1044702 bytes, checksum: b3f24ffe41028beae6b1df464fb6a8a9 (MD5)
A teoria dos modelos lineares e não-lineares da família exponencial vem encontrando espaço cada vez maior entre pesquisadores que querem explorá-la tanto na aplicação quanto na melhoria dos métodos usuais e alternativos. Uma classe mais ampla é a dos modelos lineares e não-lineares generalizados superdispersados, nos quais se modelam os parâmetros da média e dispersão e que, além disso, incorpora a dispersão na função de variância. Essa classe tem sido utilizada de forma expressiva principalmente para dados onde haja superdispersão, isto é, onde a variância real seja maior que a predita pelo modelo. Os estimadores dos parâmetros desses modelos los têm vieses de O(n-1 ) e costumam ser ignorados. Entretanto, para amostras de tamanho moderado a pequeno, esses vieses podem ser significativos, podendo atingir o mesmo valor do respectivo erro-padrão. Dentro desse contexto, é plausível fazer melhorias nos estimadores em áreas de atuação onde nem sempre é possível obter grandes amostras, como, por exemplo, na produção industrial, no controle de qualidade, em segmentos de produção de animais, nas engenharias, na farmacologia, na saúde, entre outras. Neste estudo foram obtidas expressões para o viés de O(n-1 ) para corrigir os estimadores de máxima verossimilhança dos parâmetros dos modelos não-lineares generalizados superdispersados. Para validar essa correção, foram executadas simulações de Monte Carlo e aplicações de dados advindos da área de engenharia da produção. Os resultados mostraram que estimativas de O(n-2 ) devem ser utilizadas nos modelos, principalmente em amostras de tamanho pequeno a moderado, podendo-se evidenciar que, quanto menor o tamanho da amostra, maior a necessidade de se fazerem correções. Em termos práticos, isto é, do ponto de vista econômico e operacional, é altamente positivo, pois o fato de se trabalhar com modelos de maior precisão traz como resultado produtos mais uniformes e, consequentemente, redução significativa de custos. The theory of linear and nonlinear models of the exponential class has been growing among researchers who wish to explore it, either as to the application or as to the improvement of ordinary and alternative methods. One broader class is the overdispersed generalized linear and nonlinear models, in which the mean and dispersion parameters are molded, and the dispersion in function of the variance is also incorporated. This class has been significantly used, mainly for dispersion data, that is, where the real variance is higher than the one previewed by the model. odel. The parameters estimators of these models have O(n-1 ) biases and are commonly overlooked. However, for samples varying from moderate to small size, these biases may be significant, reaching the same value as the respective standard errors. In that context, it is plausible to improve the estimators, in the areas where large samples are not possible to be obtained, such as, in the industrial production, quality control, animal production sector, engineering, pharmacology, health, among others. In this study, expressions for the O(n-1 ) bias were obtained to correct the estimators maximum likelihood of the parameters of generalized overdispersed nonlinear models. In order to validate such correction, Monte Carlo simulations and data applications from the production engineering area were carried out. Results showed that the estimates of O(n-2 ) must be used in the models, mainly in the samples of small and moderate size, making clear that the smaller the size of the sample, the bigger the necessity of correction. In a practical view, that is, from the economical and operational point of view, working with more precise models is very positive, because it results in more uniform products and, consequently, significant reduction of costs.
ANDRADE, Thiago Alexandro Nascimento de. "Verossimilhança perfilada nos modelos lineares generalizados com superdispersão." Universidade Federal de Pernambuco, 2013. https://repositorio.ufpe.br/handle/123456789/12136.
Full textMade available in DSpace on 2015-03-12T13:25:58Z (GMT). No. of bitstreams: 2 CD- Dissertação Thiago A. N. de Andrade.pdf: 787795 bytes, checksum: eccb193488aebfede11aa4dd03b03587 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013
CNPq
A classe de Modelos Lineares Generalizados com Superdispersão (MLGSs) proposta por Dey et al. (1997), tem sido amplamente utilizada na modelagem de dados cuja variância da variável resposta excede o valor nominal predito no modelo. O principal objetivo da presente dissertação é a obtenção de um fator de correção de Bartlett, segundo a metodologia proposta por DiCiccio e Stern (1994), à estatística da razão de verossimilhanças perfiladas ajustadas proposta por Cox e Reid (1987) para o teste conjunto dos efeitos da dispersão nesta classe de modelos. Estudos de simulação de Monte Carlo foram realizados com o objetivo de avaliar os desempenhos dos testes baseados nas estatísticas da razão de verossimilhanças usual (LR), razão de verossimilhanças perfiladas ajustadas (LRpa) e razão de verossimilhanças perfiladas ajustadas corrigida (LRc pa), no que se refere a tamanho e poder em amostras finitas. Os resultados numéricos obtidos favorecem o teste proposto nesta dissertação.
Ramos, Anilzabel Costa dos. "Modelos unidimensionais para fluidos Newtonianos e Newtonianos generalizados." Master's thesis, Universidade de Évora, 2021. http://hdl.handle.net/10174/29820.
Full textJunior, Antonio Carlos Ricardo Braga. "Distribuições das classes Kumaraswamy generalizada e exponenciada: propriedades e aplicações." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-07062013-150103/.
Full textRecently, Cordeiro and de Castro (2011) showed a generalized class based on the Kumaraswamy distribution (Kw-G). This class of models has crescent risk forms, decrescent, unimodal and U or bathtub form. An important distribution belonging to this class the Kumaraswamy modified Weibull distribution (KwMW), proposed by Cordeiro; Ortega e Silva (2013). Thus this distribution was used to develop some new properties and bayesian analysis. Furthermore, we develop a new probability distribution from the generalized gamma geometric distribution (GGG) which it is called generalized gamma geometric exponentiated (GGGE) distribution. For the new distribution we calculate the moments, moment generating function, mean deviation, reliability and order statistics. We define a log-generalized gamma geometric exponentiated regression model. The methods used to estimate the model parameters are: maximum likelihood and bayesian. Finally, we illustrate the potentiality of the new distribution by means of an application to a real data set.
Urbano, Mariana Ragassi. "Melhoramento do resíduo de Wald em modelos lineares generalizados." Universidade de São Paulo, 2008. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-11022009-074818/.
Full textThe theory of generalized linear models is very used in statistics, not only for modeling data normally distributed, but in the modeling of data whose distribution belongs to the exponential family of distributions. Some examples are binomial, gamma and inverse Gaussian distribution, among others. After tting a model in order to check the adequacy of tting, diagnostic techniques are used. The properties of residuals in generalized linear models are not well known, and asymptotic results are the only recourse. This work aims to study the asymptotic properties of Wald residual, and to obtain corrections to make the distribution of the modied residuals closer to standard normal. An application of the corrections for Wald residuals was done to ve datasets. In two datasets the response variables were counts, and to model, was used the Poisson distribution. Other two datasets are provided from a completely randomized design with a continuous response, and to model, was used the normal distribution, and, in the last dataset the interest was to model the proportion and the binomial distribution was used. A Monte Carlo simulation, was performed showing that the distribution of the corrected Wald residuals, is more close to the standard normal distribution.
Fuina, Jamile Salim. "Formulações de modelos constitutivos de microplanos para contínuos generalizados." Universidade Federal de Minas Gerais, 2009. http://hdl.handle.net/1843/PASA-7SPFPR.
Full textEste trabalho refere-se a analise não-linear de meios parcialmente frágeis por meio do Método dos Elementos Finitos, procurando-se definir descrições cinemáticas e estáticas apropriadas para estes meios. Apontam-se as limitações da teoria do contínuo clássico, bem como as de modelos constitutivos locais, na representação de problemas onde ocorrem localização de deformações. Propõe-se formulações termodinamicamente consistentes que reúnem as vantagens do modelo de Microplanos em considerar o comportamento anisotrópico do material com aquelas dos Contínuos Generalizados, que possuem comprimentos característicos intrínsecos a sua concepção, sendo capazes de descrever materiais cuja microestrutura precisa ser evidenciada para o entendimento do comportamento estrutural. Inicialmente, o modelo constitutivo de microplanos e formulado para o contínuo de Cosserat e, numa segunda fase, apresenta-se um refinamento do modelo proposto, com a utilização do continuo com microexpansão. Discutem-se as implementações dos modelos constitutivos propostos, daqueles tomados como referencia e de todos os recursos necessários a completa solução do problema não-linear. Estas implementações são introduzidas no núcleo numérico do sistema computacional INSANE, desenvolvido no Departamento de Engenharia de Estruturas da UFMG, que utiliza a metodologia de programação orientada a objetos. Simulações numéricas são apresentadas. A análise dos resultados permite discutir a adequação das teorias clássicas e dos modelos propostos.
Rodrigues, Heloisa de Melo. "Técnicas de diagnóstico nos modelos lineares generalizados com superdispersão." Universidade Federal de Pernambuco, 2013. https://repositorio.ufpe.br/handle/123456789/12115.
Full textMade available in DSpace on 2015-03-12T12:27:53Z (GMT). No. of bitstreams: 2 DISSERTAÇÃO FINAL - HELOISA DE MELO RODRIGUES.pdf: 1188446 bytes, checksum: 6b747fae4929500c9d046035820f9da5 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013
CAPES
No contexto de modelos de regressão, em alguns casos é comum o fenô- meno da superdispersão, que ocorre quando a variância observada dos dados excede aquela prevista por um modelo. Assim, Dey et al. (1997) desenvolveram os modelos lineares generalizados com superdispersão (MLGSs), considerando um modelo de regressão adicional para o parâmetro de dispersão, que é incorporado na função de variância. Desta forma, os MLGSs permitem modelar, simultaneamente, a média e a dispersão no contexto dos modelos lineares generalizados (MLGs) de Nelder e Wedderburn, 1972. Além disso, os MLGSs caracterizam-se por ser uma classe de modelos mais geral que os modelos lineares generalizados duplos (Smyth, 1989). Nesta dissertação são propostas técnicas de diagnósticos para os MLGSs, sendo desenvolvidas as técnicas de alavancagem generalizada, análise de resíduos, in uência global, como também o método de in uência local, este avaliado sob três esquemas de perturbação. Por m, é apresentada uma análise grá ca por meio de dados simulados.
Gonzales, King-Keé Karin Cecilia. "Estimación por mínimos cuadrados ponderados en modelos lineales generalizados." Bachelor's thesis, Universidad Nacional Mayor de San Marcos, 2001. https://hdl.handle.net/20.500.12672/608.
Full text-- In this work the metod of weighted least squares is applied as an alternative for estimating parameters in the Generalized Linear Models, and particularly, for the case of response variable with multimomial and Poisson distributions using the theory developed by Grizzme, Starmer y Koch. Beginning with the General linear model it is introduced the Generalized linear models and it is stablished the funtion formations for the response variables with multinomial and poisson distributions.
Tesis
Sousa, Keliny Martins de Melo. "Modelos lineares generalizados e modelos de dispersão aplicados à modelagem de sinistros agrícolas." Universidade de São Paulo, 2010. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-16032010-163501/.
Full textThe main objective of this work is to use the generalized linear models and dispersion models in the agricultural insurance context. The Generalized Linear Model (GLM) are an extension of the multiple regression linear models presented by Nelder e Wedderburn (1972). This approach include situations in which the response variable can be included in exponencial the family. The GLM is composed of a randomized component, a sistematic component and the link functions. JÁrgensen (1997) extend the application of the GLM for a more general class of probability models, called dispersion models. Both approaches were applied in two insurance datasets for 15 citys in Rio Grande do Sul. The parameters estimation was based in the maximum likelihood method, in addition, because of the relatively small sample, the non-parametric Bootstrap method was used. This study show, using GLM, that only the accumulated rainfall was statistically significant . However, any of the covariates was significant when modelling the amount of claims. In the analysis using Bootstrap method the accumulated rainfall and average temperature were significant when modelling the number of insurance clains.
Rizzato, Fernanda Bührer. "Modelos de regressão log-gama generalizado com fração de cura." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-19032007-152443/.
Full textIn this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.
Pascoa, Marcelino Alves Rosa de. "Extensões da distribuição gama generalizada: propriedades e aplicações." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-30052012-091940/.
Full textThe generalized gamma (GG) distribution has as particular cases the Weibull, log-normal, gamma and Chi-square distributions, among others. For this reason, it is considered a exible distribution for tting data. In this paper, the idea of Cordeiro and Castro (2011) is used to develop two new probability distributions based on the GG distribution. The rst is called the generalized gamma Kumaraswamy (KumGG) and has ve parameters, while the other involves a modication of one of the shape parameters of the KumGG distribution and is called the extended generalized gamma Kumaraswamy (KumGGE). Based in these, we develop the extended generalized log-Kumaraswamy regression model. Besides this, we employ the idea regarding modifying distributions of Adamidis and Loukas (1998) for the GG distribution, calling this new distribution the geometric generalized gamma (GGG). The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets.
Zacharias, Daniela Rosa. "Modelos lineares generalizados na modelagem da fecundidade marital no Peru." [s.n.], 1994. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307042.
Full textDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação
Made available in DSpace on 2018-07-19T11:14:25Z (GMT). No. of bitstreams: 1 Zacharias_DanielaRosa_M.pdf: 2265587 bytes, checksum: 937ecfb49bc41611359bc5283b3d368a (MD5) Previous issue date: 1994
Resumo: Não informado
Abstract: Not informed
Mestrado
Mestre em Estatística
Baldoni, Pedro Luiz 1989. "Modelos lineares generalizados mistos multivariados para caracterização genética de doenças." [s.n.], 2014. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307180.
Full textDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação
Made available in DSpace on 2018-08-24T09:34:36Z (GMT). No. of bitstreams: 1 Baldoni_PedroLuiz_M.pdf: 4328843 bytes, checksum: 0ab04f375988e62ac31097716ac0eaa5 (MD5) Previous issue date: 2014
Resumo: Os Modelos Lineares Generalizados Mistos (MLGM) são uma generalização natural dos Modelos Lineares Mistos (MLM) e dos Modelos Lineares Generalizados (MLG). A classe dos MLGM estende a suposição de normalidade dos dados permitindo o uso de várias outras distribuições bem como acomoda a superdispersão frequentemente observada e também a correlação existente entre observações em estudos longitudiais ou com medidas repetidas. Entretanto, a teoria de verossimilhança para MLGM não é imediata uma vez que a função de verossimilhança marginal não possui forma fechada e envolve integrais de alta dimensão. Para solucionar este problema, diversas metodologias foram propostas na literatura, desde técnicas clássicas como quadraturas numéricas, por exemplo, até métodos sofisticados envolvendo algoritmo EM, métodos MCMC e quase-verossimilhança penalizada. Tais metodologias possuem vantagens e desvantagens que devem ser avaliadas em cada tipo de problema. Neste trabalho, o método de quase-verossimilhança penalizada (\cite{breslow1993approximate}) foi utilizado para modelar dados de ocorrência de doença em uma população de vacas leiteiras pois demonstrou ser robusto aos problemas encontrados na teoria de verossimilhança deste conjunto de dados. Além disto, os demais métodos não se mostram calculáveis frente à complexidade dos problemas existentes em genética quantitativa. Adicionalmente, estudos de simulação são apresentados para verificar a robustez de tal metodologia. A estabilidade dos estimadores e a teoria de robustez para este problema não estão completamente desenvolvidos na literatura
Abstract: Generalized Linear Mixed Models (GLMM) are a generalization of Linear Mixed Models (LMM) and of Generalized Linear Models (GLM). The class of models GLMM extends the normality assumption of the data and allows the use of several other probability distributions, for example, accommodating the over dispersion often observed and also the correlation among observations in longitudinal or repeated measures studies. However, the likelihood theory of the GLMM class is not straightforward since its likelihood function has not closed form and involves a high order dimensional integral. In order to solve this problem, several methodologies were proposed in the literature, from classical techniques as numerical quadrature¿s, for example, up to sophisticated methods involving EM algorithm, MCMC methods and penalized quasi-likelihood. These methods have advantages and disadvantages that must be evaluated in each problem. In this work, the penalized quasi-likelihood method (\cite{breslow1993approximate}) was used to model infection data in a population of dairy cattle because demonstrated to be robust in the problems faced in the likelihood theory of this data. Moreover, the other methods do not show to be treatable faced to the complexity existing in quantitative genetics. Additionally, simulation studies are presented in order to verify the robustness of this methodology. The stability of these estimators and the robust theory of this problem are not completely studied in the literature
Mestrado
Estatistica
Mestre em Estatística
Venezuela, Maria Kelly. ""Modelos lineares generalizados para análise de dados com medidas repetidas"." Universidade de São Paulo, 2003. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-07072006-122612/.
Full textIn this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
Damiani, Lucas Petri. "Técnicas de diagnóstico para modelos lineares generalizados com medidas repetidas." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-18072012-201751/.
Full textLiterature provides diagnostic methods to assess the fit of generalized linear models (GLM) for repeated measures based on generalized estimating equations (GEE). Still, such methods do not include the binomial distribution or databases with missing observations. This work generalizes the methods already developed for these two situations. A method for generating random variables with correlated marginal binomial distributions based on convolution of independent Poisson random variables has been proposed for the construction of half-normal probability plots. The diagnostic methods developed were applied to real and simulated data.
SILVA, Priscila Gonçalves da. "Inferência e diagnóstico em modelos não lineares Log-Gama generalizados." Universidade Federal de Pernambuco, 2016. https://repositorio.ufpe.br/handle/123456789/18637.
Full textMade available in DSpace on 2017-04-25T14:46:06Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) TESE VERSÃO FINAL (CD).pdf: 688894 bytes, checksum: fc5c0291423dc50d4989c1c2d8d4af65 (MD5) Previous issue date: 2016-11-04
Young e Bakir (1987) propôs a classe de Modelos Lineares Log-Gama Generalizados (MLLGG) para analisar dados de sobrevivência. No nosso trabalho, estendemos a classe de modelos propostapor Young e Bakir (1987) permitindo uma estrutura não linear para os parâmetros de regressão. A nova classe de modelos é denominada como Modelos Não Lineares Log-Gama Generalizados (MNLLGG). Com o objetivo de obter a correção de viés de segunda ordem dos estimadores de máxima verossimilhança (EMV) na classe dos MNLLGG, desenvolvemos uma expressão matricial fechada para o estimador de viés de Cox e Snell (1968). Analisamos, via simulação de Monte Carlo, os desempenhos dos EMV e suas versões corrigidas via Cox e Snell (1968) e através da metodologia bootstrap (Efron, 1979). Propomos também resíduos e técnicas de diagnóstico para os MNLLGG, tais como: alavancagem generalizada, influência local e influência global. Obtivemos, em forma matricial, uma expressão para o fator de correção de Bartlett à estatística da razão de verossimilhanças nesta classe de modelos e desenvolvemos estudos de simulação para avaliar e comparar numericamente o desempenho dos testes da razão de verossimilhanças e suas versões corrigidas em relação ao tamanho e poder em amostras finitas. Além disso, derivamos expressões matriciais para os fatores de correção tipo-Bartlett às estatísticas escore e gradiente. Estudos de simulação foram feitos para avaliar o desempenho dos testes escore, gradiente e suas versões corrigidas no que tange ao tamanho e poder em amostras finitas.
Young e Bakir (1987) proposed the class of generalized log-gamma linear regression models (GLGLM) to analyze survival data. In our work, we extended the class of models proposed by Young e Bakir (1987) considering a nonlinear structure for the regression parameters. The new class of models is called generalized log-gamma nonlinear regression models (GLGNLM). We also propose matrix formula for the second-order bias of the maximum likelihood estimate of the regression parameter vector in the GLGNLM class. We use the results by Cox and Snell (1968) and bootstrap technique [Efron (1979)] to obtain the bias-corrected maximum likelihood estimate. Residuals and diagnostic techniques were proposed for the GLGNLM, such as generalized leverage, local and global influence. An general matrix notation was obtained for the Bartlett correction factor to the likelihood ratio statistic in this class of models. Simulation studies were developed to evaluate and compare numerically the performance of likelihood ratio tests and their corrected versions regarding size and power in finite samples. Furthermore, general matrix expressions were obtained for the Bartlett-type correction factor for the score and gradient statistics. Simulation studies were conducted to evaluate the performance of the score and gradient tests with their corrected versions regarding to the size and power in finite samples.
Mendoza, Pinto Lizeth Mayra. "Regresión lineal con datos censurados por intervalos." Universidad Mayor de San Andrés. Programa Cybertesis BOLIVIA, 2008. http://www.cybertesis.umsa.bo:8080/umsa/2008/mendoza_pl/html/index-frames.html.
Full textBoaretto, Gilberto Oliveira. "Estimação de modelos DSGE usando verossimilhança empírica e mínimo contraste generalizados." Universidade de São Paulo, 2018. http://www.teses.usp.br/teses/disponiveis/96/96131/tde-29032018-161321/.
Full textThe objective of this work is to investigate the performance of moment-based estimators of the generalized empirical likelihood (GEL) and generalized minimum contrast (GMC) families in the estimation of dynamic stochastic general equilibrium (DSGE) models, focusing on the robustness analysis under misspecification, recurrent in this model. As benchmark we used generalized method of moments (GMM), maximum likelihood (ML) and Bayesian inference (BI). We work with a real business cycle (RBC) model that can be considered the core of DSGE models, presents similar difficulties and facilitates the analysis of results due to lower number of parameters. We verified, via Monte Carlo experiments, whether the studied estimators presented satisfactory results in terms of mean, median, bias, mean square error, mean absolute error and we verified the distribution of the estimates generated by each estimator. Among the main results are: (i) empirical likelihood (EL) estimator - as well as its version with smoothed moment conditions (SEL) - and Bayesian inference (BI) were, in that order, the ones that obtained the best performances, even in misspecification cases; (ii) continuous updating empirical likelihood (CUE), minimum Hellinger distance (HD), exponential tilting (ET) estimators and their smoothed versions exhibit intermediate comparative performance; (iii) performance of exponentially tilted empirical likelihood (ETEL), exponential tilting Hellinger distance (ETHD) and its smoothed versions was seriously compromised by atypical estimates; (iv) smoothed and non-smoothed GEL/GMC estimators exhibit very similar performances; (v) GMM, especially in the over-identified case, and ML estimators had lower performance than their competitors
Mentech, Guillermo Lazar. "Soluções auto-duais no modelo padrão estendido e em modelos generalizados." Universidade Federal do Maranhão, 2016. http://tedebc.ufma.br:8080/jspui/handle/tede/1234.
Full textMade available in DSpace on 2017-02-14T13:59:04Z (GMT). No. of bitstreams: 2 Guillermo Lazar.pdf: 2205132 bytes, checksum: 363a393990112a672995765317141d69 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-12-16
We study self-dual con gurations solutions for gauge models in the context of the Standard Model Extension and in abelian Higgs generalized models. First we approach the Maxwell- Higgs model provided with Lorentz symmetry violation (VL) terms in two situations: In the rst case, we add the Carroll-Field-Jackiw (CPT-odd) term into the gauge sector and another CPT-even term in the Higgs sector. In the second case, we add CPT-even terms in both sectors. For both cases the Lorentz symmetry breaking terms modi ed the kinetic part of the eld. The con gurations in the presence of the Carroll-Field-Jackiw (CFJ) term have non-zero total electric charge as well as proportional to the magnetic ux, while the con gurations containing only CPT-even terms have null electrical charge. However, the solutions obtained when we consider the gauge sector with CPT-even and parity-odd coe cients have non-zero electric eld. The implementation of the BPS formalism provides self-dual equations whose solutions have total energy proportional to the magnetic ux. We have studied in detail the axially symmetrical v ortices-like solutions using the appropriate ansatz. We note that the magnetic ux as well as being proportional to the winding number, also depends on the CPT-even coe cients of the Higgs sector. We show that there exist a sets of valuesfor the CPT-even coe cients of Higgs sector that reproduce the con gurations for the abelian Higgs models already studied in literature. Another important result is the existence of a set of parameters involving only the CPT-even case, in which the BPS (Bogomoln'yi-Prasad-Sommer eld) v ortices exhibit localized inversion of both magnetic and electric eld. In the second chapter, still in the context of Lorentz invariance symmetry violation, we study the self-dual con gurations in the O (3) nonlinear sigma model coupled to a gauge eld. The usual model is modi ed by introducing the CPT-odd term of CFJ in the gauge sector and a CPT-even term in the sigma sector, both modifying only the kinetic sectors. The con gurations have non-null total charge and are proportional to the magnetic ux. The BPS formalism provides the self-dual equations with con gurations having total energy proportional to the topological charge of the model. Then we study the axially symmetric v ortices solutions. These have total energy proportional to the winding number and depends on the Lorentz violation coe cients belonging to the sigma sector. This dependence is re ected in the topological charge and in the magnetic ux. Similarly to the previous case, there exist a set of values for the CPTeven coe cients of the sigma sector that interpolate the con gurations of usual O (3) nonlinear sigma models coupled to a gauge eld already found in literature. On the third and nal part of this manuscript we study the existence of self-dual con - gurations in models for abelian Higgs generalized models: Maxwell-Higgs, Born-Infeld-Higgs, Chern-Simons-Higgs and Maxwell-Chern-Simons-Higgs. The generalization modi es the kinetics of the elds by means of functions that depend only on the Higgs eld ( ). During the development of the implementation of the BPS formalism, naturally arises the explicit function that generalize the kinetic term of the Higgs eld, j j2 2; > 1. Thus, we are able to determined the self-dual potential and the corresponding rst order equations for each model. Among the self-dual con gurations, we study the vortex-like solutions and found that from a given value of the parameter the pro les begin to acquire a shape similar to the form of compactons-like solutions.
Estudamos as con gurafigurações auto-duais em modelos de gauge no contexto do Modelo Padrão Estendido e em modelos de Higgs abelianos generalizados. Primeiramente abordamos o modelo de Maxwell-Higgs provido com termos de violalação da invariância de Lorentz (VL) em duas situações: No primeiro caso, adicionamos o termo de Carroll-Field-Jackiw (CPT- mpar) ao setor de gauge e um outro termo CPT-par no setor de Higgs. No segundo caso, inserimos termos CPTpar em ambos os setores. Em todos os casos os termos da quebra de Lorentz modi cam a parte cin etica dos campos. As con gura c~oes na presen ca do termo de Carroll-Field-Jackiw (CFJ) tem carga el etrica total n~ao nula, al em de serem proporcionais ao uxo magn etico, enquanto que as con gura c~oes contendo somente termos CPT-par tem carga el etrica total nula. Contudo, as solu c~oes obtidas quando consideramos o setor de gauge com coe cientes CPT-par de paridade- mpar possuem campo el etrico n~ao nulo. A implementa c~ao do formalismo BPS prov^e equa c~oes auto-duais cujas solu c~oes tem energia total proporcional ao uxo magn etico. Estudamos em detalhe as solu c~oes tipo v ortices axialmente sim etricos usando o ansatz apropriado. Observamos que o uxo magn etico al em de ser proporcional ao n umero de vorticidade, tamb em depende dos coe cientes CPT-par do setor de Higgs. Mostramos que existem conjuntos de valores dos coe cientes CPT-par do setor de Higgs que reproduzem as con gura c~oes dos modelos de Higgs abelianos j a estudados na literatura. Um outro resultado importante e a exist^encia de um jogo de par^ametros envolvendo o caso puramente CPT-par cujos v ortices BPS (Bogomoln'yi- Prasad-Sommer eld) apresentam a invers~ao localizada tanto do campo magn etico como do campo el etrico. Ainda no contexto de VL, estudamos as con gura c~oes auto-duais num modelo n~ao abeliano: o modelo O(3) sigma n~ao-linear acoplado a um campo de gauge. O modelo usual e modi cado introduzindo o termo CPT- mpar de CFJ no setor de gauge e um termo CPT-par no setor sigma, ambos modi cando somente os setores cin eticos. As con gura c~oes tem carga total n~ao nula proporcional ao uxo magn etico. O formalismo BPS fornece as equa c~oes auto-duais com con gura c~oes possuindo energia total proporcional a carga topol ogica do modelo. Em seguida, estudamos as solu c~oes de v ortices axialmente sim etricos. Estes possuem energia total proporcional a vorticidade e depende dos coe cientes VL pertencentes ao setor sigma. Essa depend^encia e re etida na carga topol ogica e no uxo magn etico. Similarmente ao caso anterior, existem conjuntos de valores dos coe cientes CPT-par do setor de sigma permitem interpolar as con gura c~oes dos modelos O(3) sigma n~ao-linear acoplado a um campo de gauge encontrados na literatura. Finalmente, no contexto de teorias de campo invariantes de Lorentz, estudamos a exist^encia de con gura c~oes auto-duais nos modelos de Higgs abelianos generalizados: Maxwell-Higgs, Born-Infeld-Higgs, Chern-Simons-Higgs e Maxwell-Chern-Simons-Higgs. A generaliza c~ao modi- ca a parte cin etica dos campos por meio de fun c~oes que dependem somente do campo de Higgs ( ). Durante o desenvolvimento da implementa c~ao do formalismo BPS, naturalmente surge a forma expl cita da fun c~ao que generaliza o termo cin etico do campo de Higgs, j j2 2; > 1. Com isso, determinados os potenciais auto-duais e as correspondentes equa c~oes de primeira ordem para cada modelo. Dentre as con gura c~oes auto-duais, estudamos as solu c~oes tipo v ortice e encontramos que a partir de um determinado valor do par^ametro os per s come cam a adquirir forma semelhante as das solu c~oes do tipo-compactons.
Acorsi, Clédina Regina Lonardan. "Estimação do fator de condição para peixes utilizando modelos lineares generalizados." Florianópolis, SC, 2002. http://repositorio.ufsc.br/xmlui/handle/123456789/84246.
Full textMade available in DSpace on 2012-10-20T07:36:59Z (GMT). No. of bitstreams: 1 227556.pdf: 16402431 bytes, checksum: 26c45a95761f699b94c4996a7f13846e (MD5)
Neste trabalho descreve-se a construção de um fator de condição do peixe, representado por K. Tal fator é determinado a partir de uma relação peso-comprimento construída segundo a teoria dos Modelos Lineares Generalizados. O estudo compreende uma amostra de 15.175 indivíduos das espécies Trachydoras paraguayensis, Liposarcus anisiti, Raphiodon vulpinus, Serrasalmus marginatus e Leporinus friderice, capturadas na planície de inundação do Alto Rio Paraná. A primeira etapa da pesquisa consiste em verificar a significância do fator espécie e a construção de um modelo geral. Na segunda etapa constrói-se um modelo individual para cada espécie de acordo com o sexo do animal, quando este fator for significativo para a construção do modelo. O processo de validação dos modelos obtidos é feito comparando-os a outros modelos que já são aceitos no meio científico como adequados para relatar o peso do animal em função do seu comprimento. A etapa final é encontrar uma equação que represente o fator de condição do peixe a partir do modelo construído.
do, Carmo Soares de Lima Maria. "Aperfeiçoamento de testes nos modelos séries de potência não-lineares generalizados." Universidade Federal de Pernambuco, 2012. https://repositorio.ufpe.br/handle/123456789/6648.
Full textConselho Nacional de Desenvolvimento Científico e Tecnológico
Essa dissertação tem dois objetivos. O primeiro consiste na obtenção de um fator de correção tipo-Bartlett para a estatística escore nos modelos em série de potência não-lineares generalizados. O segundo é comparar o desempenho dos testes baseados nas seguintes estatísticas, a saber: escore e suas versões corrigidas, razão de verossimilhanças e suas versões corrigidas e a gradiente, no que tange ao tamanho e ao poder. Finalmente apresentamos uma aplicação a dados reais
Lima, Maria do Carmo Soares de. "APERFEIÇOAMENTO DE TESTES NOS MODELOS SÉRIES DE POTÊNCIA NÃO-LINEARES GENERALIZADOS." Universidade Federal de Pernambuco, 2012. https://repositorio.ufpe.br/handle/123456789/10825.
Full textMade available in DSpace on 2015-03-05T17:36:58Z (GMT). No. of bitstreams: 2 ML.pdf: 506400 bytes, checksum: e9f5ea43d7905d4b2ce5b74712cf8183 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2012-02
CNPq
Essa dissertação tem dois objetivos. O primeiro consiste na obtenção de um fator de correção tipo-Bartlett para a estatística escore nos modelos em série de potência não-lineares generalizados. O segundo é comparar o desempenho dos testes baseados nas seguintes estatísticas, a saber: escore e suas versões corrigidas, razão de verossimilhanças e suas versões corrigidas e a gradiente, no que tange ao tamanho e ao poder. Finalmente apresentamos uma aplicação a dados reais.
Esquivel, Segura Henry John. "Modelo de regresión semiparamétrico robusto." Master's thesis, Pontificia Universidad Católica del Perú, 2018. http://hdl.handle.net/20.500.12404/19051.
Full textSILVA, Débora Karollyne Xavier. "Análise de diagnóstico para o modelo de regressão Log-Birnbaum-Saunders generalizado." Universidade Federal de Campina Grande, 2013. http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1391.
Full textMade available in DSpace on 2018-08-08T21:14:19Z (GMT). No. of bitstreams: 1 DÉBORA KAROLLYNE XAVIER SILVA - DISSERTAÇÃO PPGMAT 2013..pdf: 5676823 bytes, checksum: 10779ac6b54c624585a998fed783af51 (MD5) Previous issue date: 2013-12
Capes
A distribuição Birnbaum-Saunders surgiu em 1969 com aplicações fortemente ligadas à engenharia e se expandiu nas últimas décadas a diversas áreas. Na literatura, além de tomar um papel de destaque na análise de sobrevivência, podemos destacar o surgimento de várias generalizações. Neste trabalho apresentaremos uma dessas generalizações, a qual foi formulada por Mentainis em 2010. Primeiramente, faremos uma breve explanação sobre a distribuição Birnbaum-Saunders cl´assica e sobre a generaliza¸c˜ao que foi proposta por Mentainis (2010), a qual chamaremos de distribuição Birnbaum-Saunders generalizada. Em seguida, discorreremos sobre a distribuição senh-normal, a qual possui uma importante relação com a distribuição Birnbaum-Saunders. Numa outra etapa, apresentaremos alguns métodos de diagnóstico para o modelo de regressão log-Birnbaum-Saunders generalizado e investigaremos testes de homogeneidade para os correspondentes parˆametros de forma e escala. Por fim, analisamos um conjunto de dados para ilustrar a teoria desenvolvida.
The Birnbaum-Saunders distribution emerged in 1969 motivated by problems in engineering. However, its field of application has been extended beyond the original context of material fatigue and reliability analysis. In the literature, it has made an important role in survival analysis. Moreover, many generalizations of it have been considered. In this work we present one of these generalizations, which was formulated by Mentainis in 2010. First, we provide a brief explanation of the classical Birnbaum-Saunders distribution and its generalization proposed by Mentainis (2010), which we name as the generalized Birnbaum-Saunders distribution. Thereafter, we discuss the sinh-normal distribution, which has an important relationship with the Birnbaum-Saunders distribution. In a further part of this work, we present some diagnostic methods for generalized log-Birnbaum-Saunders regression models and investigate tests of homogeneity for the corresponding shape and scale parameters. Finally, an application with real data is presented.
Delgado, Carlos Alberto Cardozo. "Semi-parametric generalized log-gamma regression models." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15032018-185352/.
Full textO objetivo central do trabalho é proporcionar ferramentas estatísticas para modelos de regressão semiparamétricos quando os erros seguem distribução log-gamma generalizada na presença de observações censuradas ou não censuradas. A estimação paramétrica e não paramétrica são realizadas através dos procedimentos Newton - Raphson, escore de Fisher e Backfitting (Gauss - Seidel). As propriedades assintóticas dos estimadores de máxima verossimilhança penalizada são estudadas em forma analítica, bem como através de simulações. Alguns procedimentos de diagnóstico são desenvolvidos, tais como resíduos tipo componente do desvio e resíduo quantílico, bem como medidas de influ\\^encia local sob alguns esquemas usuais de perturbação. Todos procedimentos do presente trabalho são implementados no ambiente computacional R, o pacote sglg é desenvolvido, assim como algumas aplicações a dados reais são apresentadas.
Melo, Martínez Sandra Esperanza. "Análisis de datos longitudinales y multivariantes mediante distancias con modelos lineales generalizados." Doctoral thesis, Universitat de Barcelona, 2012. http://hdl.handle.net/10803/101150.
Full textLONGITUDINAL AND MULTIVARIATE DATA ANALYSIS THROUGH DISTANCES WITH GENERALIZED LINEAR MODELS We are introducing new methodologies for the analysis of longitudinal data with continuous responses (univariate, multivariate for growth curves and with non-normal response using generalized linear models) based on distances between observations (or individuals) on the explicative variables. In all cases, after adding new components of the principal coordinate matrix, we observe a prediction improvement with respect to the classic models, thus providing an alternative prediction methodology to them. It was proven that both the distance based MANOVA model and the univariate longitudinal models are as robust as the classical counterparts using restricted maximum likelihood and weighted minimum squares under normality assumptions. The parameters of the distance based univariate model were estimated using restricted maximum likelihood and generalized minimum squares. For the distance based MANOVA we used minimum squares under normality conditions. We also showed how to perform inference on the model parameters on large samples. We indicated a methodology for the analysis of longitudinal data using generalized linear models and distances between the explanatory variables, where the results were similar to the classical approach. However, our approach allowed us to model continuous, non-normal responses in the time. As well as presenting the model and the motivational ideas, we indicate how to estimate the parameters and hypothesis test on them. For this purpose we use generalized estimating equations (EEG). We present an application case in each chapter for illustration purposes. The models were fit and validated. After performing some simulations, we found small differences in the distance based method with respect to the classical one for mixed data, particularly in the small sample setting (about 50 individuals). Using simulation we found that for some sample sizes, the distance based models improve the traditional ones when explanatory variables are mixed and Gower distance is used. This is the case for small samples, regardless of the correlation, autocorrelation structure, the variance, and the number of periods when using both the Akaike (AIC) and Bayesian (BIC) Information Criteria. Moreover, for these small samples, we found greater efficiency (>1) in our model with respect to the classical one. Our models also provide better fits in large samples (100 or 200) with high correlations (0.5 and 0.9), high variance (50) and larger number of time measurements (7 and 10). We proved that the new and the classical models coincide when explanatory variables are all either continuous or categorical (or binary). We also created programs in R for the analysis of the data considered in the different chapters of this thesis in both models, the classical and the newly proposed one, which are attached in a CD. We are currently working to create a public, accessible R package. The main advantages of these methods are that they allow for time predictions, the modelization of the autocorrelation structure, and the analysis of data with mixed variables (continuous, categorical and binary). In such cases, as opposed to the classical approach, the independency of the components principal coordinate matrix can always be guaranteed. Finally, the proposed models allow for good missing data estimation: adding extra components to the model with respect to the original variables improves the fit without changing the information original. This is particularly important in the longitudinal data analysis and for those researchers whose main interest resides in obtaining good predictions.
Nava, Daniela Trentin. "Modelos lineares generalizados e processos pontuais em Análise espacial de dados agrícolas." Universidade Estadual do Oeste do Paraná, 2018. http://tede.unioeste.br/handle/tede/3768.
Full textMade available in DSpace on 2018-06-18T14:36:28Z (GMT). No. of bitstreams: 2 Daniela_Nava2018.pdf: 3424820 bytes, checksum: 89e78787f114c44f669182c6285080ae (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-02-02
This tesis aimed at studying spatial discrete distributions based on two different points of view, that are, spatial point processes and spatial correlated binomial distribution. The data set came from an experiment setted in an agricultural commercial area in Cascavel city Paraná State, cropped with corn. The experimental area was subdivided into 40 georeferenced patch of land and the number of plants infected by Spodoptera frugiperda was observed within each patch of land. Thus, it is assumed that the data set have a binomial distribution. A study of first order local influence was proposed in order to verify possible influential points. The results suggest that the presence of influential observations in the data set have changed the statistical inference, the predicted values and the respective maps. In a second study, our interest was the spatial distribution of the fall armyworm in the experimental area. In order to do that, we used spatial point processes, where each plant infected by the insect within the experimental area was considered as an event of interest. An anisotropy study was carried out using different point process techniques, such as K directional function and wavelet test. The results show that the spatial distribution of the fall armyworm follow a Poisson cluster process with an evident anisotropy, mainly due to the shape of the experimental area.
O objetivo deste trabalho foi discutir distribuições discretas espaciais utilizando pontos de vista distintos, a saber, processos pontuais espaciais e distribuição binomial para dados espacialmente correlacionados. Os dados utilizados são provenientes de um experimento agrícola implantado em uma área comercial agrícola no município de Cascavel, estado do Paraná, cultivada com a cultura do milho. Subdividiu-se a área experimental em 40 parcelas georeferenciadas e observou-se o número de plantas atacadas pela lagarta do cartucho, do total de plantas de cada parcela. Para tal, assumiu-se que os dados possuem distribuição binomial. Propôs-se um estudo de análise de influência local de primeira ordem com o interesse em verificar possíveis pontos influentes. Os resultados obtidos sugerem que a presença de observações influentes nos dados modificam a inferência estatística, os valores preditos e os respectivos mapas. Em um segundo estudo, que teve como interesse a distribuição espacial da lagarta do cartucho na área experimental, utilizou-se de ferramentais de estatística espacial pontual. Para tal, cada planta infectada pelo inseto dentro da área experimental foi considerada como um evento de interesse. Realizou-se um estudo de anisotropia a partir de diferentes técnicas de processos pontuais, como K direcional e teste de ondaletas. Os resultados mostraram que a distribuição espacial da lagarta segue um processo pontual de Poisson agrupado com evidente anisotropia principalmente devido à forma da área experimental.