Log in

Relevant bibliographies by topics / Dados censurados / Dissertations / Theses

To see the other types of publications on this topic, follow the link: Dados censurados.

Dissertations / Theses on the topic 'Dados censurados'

Author: Grafiati

Published: 4 June 2021

Last updated: 12 February 2022

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 43 dissertations / theses for your research on the topic 'Dados censurados.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Santos, Daiane de Souza. "Comparações múltiplas para dados censurados." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11072013-143209/.

Full text

Abstract:

O objetivo deste trabalho é estudar a performance de alguns métodos de comparações múltiplas (MCMs) que ajustam o valor-p quando as estatísticas empregadas nos testes são a log-rank e a Cramér-von Mises, ambas não paramétricas e com estrutura de dependência. A vantagem dos MCMs que ajustam o valor-p é que eles controlam as taxas de erro tipo I e tipo II para cada hipótese, afim de atingir um poder estatístico elevado, mantendo a taxa de erro da família dos testes (FWER) menor ou igual ao nível de significância escolhido. Trabalhamos com o procedimento clássico de Bonferroni e com outros métodos vistos como seu melhoramento, com especial atenção a certos procedimentos derivados do método de Simes que permitem realizar inferências sob as hipóteses individuais. Foi verificado teoricamente que a estatística log-rank pertence à classe multivariada totalmente positiva de ordem 2 (\'MTP IND. 2\'), uma vez que o método de Simes garante o controle da FWER quando as estatísticas dependentes assumem esta condição. O controle da FWER empregando a estatística de Cramér-von Mises foi observado apenas por meio de simulações. Os MCMs foram analisados através de estudos computacionais em modelos discretos e contínuos sob censura com foco no problema de comparar um tratamento versus controle
The aim of this work is to study the performance of some Multiple Comparison Methods (MCMs) that adjust the p-value when the log-rank-type and Cramér-von Mises statistics are used, both nonparametric and with dependency structure. The advantage of these methods is that they control the error rates of type I and type II for each hypothesis in order to achieve high statistical power while keeping the Family Wise Error Rate (FWER) lower or equal than a given significance level. The classical Bonferroni procedure is used as well as others seen as its improvement, with special attention to certain procedures derived from Simes\' method for making inferences on individual hypothesis. It is theoretically proved that the weighted Log-Rank statistics belongs to the multivariate totally positive of order 2 (\'MTP IND. 2\') class, which is needed in order to apply Simes\' method, that guarantees control of the FWER of dependent statistics in this case. The control of the FWER when the Cramér-von Mises statistics is used is only veried by means of computational simulations. The MCMs are also analyzed by means of computational experiments with discrete and continuous data under censoring with focus on the problem of comparisons of treatment versus a control

APA, Harvard, Vancouver, ISO, and other styles

2

Rasteiro, Louise Rossi. "Regressão quantílica para dados censurados." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-09072017-141021/.

Full text

Abstract:

A regressão quantílica para dados censurados é uma extensão dos modelos de regressão quantílica que, por levar em consideração a informação das observações censuradas na modelagem, e por apresentar propriedades bastante satisfatórias, pode ser vista como uma abordagem complementar às metodologias tradicionais em Análise de Sobrevivência, com a vantagem de permitir que as conclusões inferenciais sejam tomadas facilmente em relação aos tempos de sobrevivência propriamente ditos, e não em relação à taxa de riscos ou a uma função desse tempo. Além disso, em alguns casos, pode ser vista também como metodologia alternativa aos modelos clássicos quando as suposições destes são violadas ou quando os dados são heterogêneos. Apresentam-se nesta dissertação três técnicas para modelagem com regressão quantílica para dados censurados, que se diferenciam em relação às suas suposições e forma de estimação dos parâmetros. Um estudo de simulação para comparação das três técnicas para dados com distribuição normal, Weibull e log-logística é apresentado, em que são avaliados viés, erro padrão e erro quadrático médio. São discutidas as vantagens e desvantagens de cada uma das técnicas e uma delas é aplicada a um conjunto de dados reais do Instituto do Coração do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo.
Censored quantile regression is an extension of quantile regression, and because it incorporates information from censored data in the modelling, and presents quite satisfactory properties, this class of models can be seen as a complementary approach to the traditional methods in Survival Analysis, with the advantage of allowing inferential conclusions to be made easily in terms of survival times rather than in terms of risk rates or as functions of survival time. Moreover, in some cases, it can also be seen as an alternative methodology to the classical models when their assumptions are violated or when modelling heterogeneity of the data. This dissertation presents three techniques for modelling censored quantile regression, which differ by assumptions and parameter estimation method. A simulation study designed with normal, Weibull and loglogistic distribution is presented to evaluate bias, standard error and mean square error. The advantages and disadvantages of each of the three techniques are then discussed and one of them is applied to a real data set from the Heart Institute of Hospital das Clínicas, University of São Paulo.

APA, Harvard, Vancouver, ISO, and other styles

3

Argenton, Juliana Luz Passos 1984. "Árvore de regressão para dados censurados e correlacionados." [s.n.], 2013. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307181.

Full text

Abstract:

Orientador: Hildete Prisco Pinheiro
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica
Made available in DSpace on 2018-08-24T02:10:38Z (GMT). No. of bitstreams: 1 Argenton_JulianaLuzPassos_M.pdf: 2087574 bytes, checksum: b6014c3478501f5128fd13ddf952e6dd (MD5) Previous issue date: 2013
Resumo: O objetivo deste trabalho é apresentar uma metodologia de árvore de regressão para dados censurados e correlacionados. O conjunto de dados analisado foi obtido a partir de uma pesquisa realizada entre Dezembro de 2005 e Janeiro de 2006, que entrevistou 119 famílias (1712 indivíduos) que vivem no pequeno vilarejo de Baependi, no Estado de Minas Gerais. São apresentadas duas metodologias com base no modelo de riscos proporcionais, a primeira desconsidera a possível correlação existente entre os indivíduos de uma mesma família e usa a primeira iteração da estimativa da verossimilhança completa nas divisões dos nós. Na segunda metodologia apresentada, a correlação entre os indivíduos de uma mesma família é incorporada no modelo de riscos proporcionais através de uma variável de fragilidade com distribuição Gama, neste caso o valor da estatística Escore é usado para escolher a melhor divisão dos nós. O objetivo da análise é avaliar as variáveis que aumentam o risco de apresentar hipertensão, diabetes tipo II e colesterol alto, que são os três principais fatores que aumentam o risco de doenças no coração. As variáveis respostas são as idades de diagnóstico desses fatores de risco. A censura é definida de acordo com a observação da idade do indivíduo no momento do diagnóstico da doença e a idade do indivíduo no momento da pesquisa. Desta forma, uma idade de diagnóstico maior que a idade no momento da pesquisa caracteriza a censura.
Abstract: The objective of this work is to present methods of regression trees for censored and correlated data. The dataset analyzed was obtained from a survey, in which 119 families (1712 individuals) living in Baependi village, in the Brazilian state of Minas Gerais, were interviewed. Two methodologies based on the proportional hazard model are presented. The first disregards the possible correlation among the individuals of the same family, using the first step of a full likelihood estimation procedure for splitting nodes. In the second methodology, the correlation among the individuals of the same family is incorporated in the proportional hazard model through a frailty variable with Gamma distribution. In this case, the value of the Score statistic is used for choosing the best splitting node. The main purpose of the analysis is to evaluate the variables that increase the risk of hypertension, type II diabetes and high cholesterol, which are the top three main factors that increase the risk of heart conditions. The response variables are the age-of-onset of these risk factors. Censoring is defined by observing the individual's age-of-onset at the moment of diagnosis and also at the moment of the survey. This way, an age-of-onset higher than the age at the moment of the survey indicates censoring.
Mestrado
Estatistica
Mestra em Estatística

APA, Harvard, Vancouver, ISO, and other styles

4

Janeiro, Vanderly. "Modelagem de dados contínuos censurados, inflacionados de zeros." Universidade de São Paulo, 2010. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-20092010-090511/.

Full text

Abstract:

Muitos equipamentos utilizados para quantificar substâncias, como toxinas em alimentos, freqüentemente apresentam deficiências para quantificar quantidades baixas. Em tais casos, geralmente indicam a ausência da substância quando esta existe, mas está abaixo de um valor pequeno \'ksi\' predeterminado, produzindo valores iguais a zero não necessariamente verdadeiros. Em outros casos, detectam a presença da substância, mas são incapazes de quantificá-la quando a quantidade da substância está entre \'ksai\' e um valor limiar \'tau\', conhecidos. Por outro lado, quantidades acima desse valor limiar são quantificadas de forma contínua, dando origem a uma variável aleatória contínua X cujo domínio pode ser escrito como a união dos intervalos, [ómicron, \"ksai\'), [\"ksai\', \'tau\' ] e (\'tau\', ?), sendo comum o excesso de valores iguais a zero. Neste trabalho, são propostos modelos que possibilitam discriminar a probabilidade de zeros verdadeiros, como o modelo de mistura com dois componentes, sendo um degenerado em zero e outro com distribuição contínua, sendo aqui consideradas as distribuições: exponencial, de Weibull e gama. Em seguida, para cada modelo, foram observadas suas características, propostos procedimentos para estimação de seus parâmetros e avaliados seus potenciais de ajuste por meio de métodos de simulação. Finalmente, a metodologia desenvolvida foi ilustrada por meio da modelagem de medidas de contaminação com aflatoxina B1, observadas em grãos de milho, de três subamostras de um lote de milho, analisados no Laboratório de Micotoxinas do Departamento de Agroindústria, Alimentos e Nutrição da ESALQ/USP. Como conclusões, na maioria dos casos, as simulações indicaram eficiência dos métodos propostos para as estimações dos parâmetros dos modelos, principalmente para a estimativa do parâmetro \'delta\' e do valor esperado, \'Epsilon\' (Y). A modelagem das medidas de aflatoxina, por sua vez, mostrou que os modelos propostos são adequados aos dados reais, sendo que o modelo de mistura com distribuição de Weibull, entretanto, ajustou-se melhor aos dados.
Much equipment used to quantify substances, such as toxins in foods, is unable to measure low amounts. In cases where the substance exists, but in an amount below a small fixed value \'ksi\' , the equipment usually indicates that the substance is not present, producing values equal to zero. In cases where the quantity is between \'\'ksi\' and a known threshold value \'tau\', it detects the presence of the substance but is unable to measure the amount. When the substance exists in amounts above the threshold value ?, it is measure continuously, giving rise to a continuous random variable X whose domain can be written as the union of intervals, [ómicron, \"ksai\'), [\"ksai\', \'tau\' ] and (\'tau\', ?), This random variable commonly has an excess of zero values. In this work we propose models that can detect the probability of true zero, such as the mixture model with two components, one being degenerate at zero and the other with continuous distribution, where we considered the distributions: exponential, Weibull and gamma. Then, for each model, its characteristics were observed, procedures for estimating its parameters were proposed and its potential for adjustment by simulation methods was evaluated. Finally, the methodology was illustrated by modeling measures of contamination with aflatoxin B1, detected in grains of corn from three sub-samples of a batch of corn analyzed at the laboratory of of Mycotoxins, Department of Agribusiness, Food and Nutrition ESALQ/USP. In conclusion, in the majority of cases the simulations indicated that the proposed methods are efficient in estimating the parameters of the models, in particular for estimating the parameter ? and the expected value, E(Y). The modeling of measures of aflatoxin, in turn, showed that the proposed models are appropriate for the actual data, however the mixture model with a Weibull distribution fits the data best.

APA, Harvard, Vancouver, ISO, and other styles

5

Garay, Aldo William Medina. "Modelos de regressão para dados censurados sob distribuições simétricas." Universidade de São Paulo, 2014. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15062014-000915/.

Full text

Abstract:

Este trabalho tem como objetivo principal apresentar uma abordagem clássica e Bayesiana dos modelos lineares com observações censuradas, que é uma nova área de pesquisa com grandes possibilidades de aplicações. Aqui, substituimos o uso convencional da distribuição normal para os erros por uma família de distribuições mais flexíveis, o que nos permite lidar de forma mais adequada com observações censuradas na presença de outliers. Esta família é obtida através de um mecanismo de fácil construção e possui como casos especiais as distribuições t de Student, Pearson tipo VII, slash, normal contaminada e, obviamente, a normal. Para o caso de respostas correlacionadas e censuradas propomos um modelo de regressão linear robusto baseado na distribuição t de Student, desenvolvendo um algoritmo tipo EM que depende dos dois primeiros momentos da distribuição t de Student truncada.
This work aims to present a classical and Bayesian approach to linear models with censored observations, which is a new area of research with great potential for applications. Here, we replace the conventional use of the normal distribution for the errors of a more flexible family of distributions, which deal in more appropriately with censored observations in the presence of outliers. This family is obtained through a mechanism easy to construct and has as special cases the distributions Student t, Pearson type VII, slash, contaminated normal, and obviously normal. For the case of correlated and censored responses we propose a model of robust linear regression based on Student\'s t distribution and we developed an EM type algorithm based on the first two moments of the truncated Student\'s t distribution.

APA, Harvard, Vancouver, ISO, and other styles

6

Costa, Denise Reis 1985. "Estimação robusta em modelos de variáveis latentes para dados censurados." [s.n.], 2013. http://repositorio.unicamp.br/jspui/handle/REPOSIP/306683.

Full text

Abstract:

Orientador: Víctor Hugo Lachos Dávila
Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica
Made available in DSpace on 2018-08-24T00:22:53Z (GMT). No. of bitstreams: 1 Costa_DeniseReis_D.pdf: 5095534 bytes, checksum: 5bb05e15edf36db32e78eff601b757db (MD5) Previous issue date: 2013
Resumo: Modelos de variáveis latentes são amplamente utilizados por psicometristas, econometristas e pesquisadores da área de ciencias sociais para modelar variáveis que não podem ser medidas diretamente, conhecidas como construtos ou efeitos aleatórios (Skrondal e Rabe-Hesketh, 2004). Na literatura, é muito comum verificar a utilização da distribuição normal para a modelagem dessas variáveis, contudo tal suposição pode ser inadequada, especialmente na presença de valores discrepantes. Preocupados com a sensibilidade das inferências sob a presença de potenciais pontos discrepantes ou com dados provenientes de distribuições com caudas pesadas, nesta tese propomos métodos de inferência robusta, utilizando a distribuição t de Student multivariada, para dois tipos de modelos de variáveis latentes: o modelo linear generalizado misto para respostas binárias (GLMM) e o modelo de análise fatorial Tobit (TCFA) para respostas contínuas e censuradas. Para a estimação dos parâmetros dos modelos estudados, um algoritmo do tipo EM foi proposto e este apresenta expressões fechadas no passo E que utiliza os dois primeiros momentos de uma distribuição multivariada t truncada. Adicionalmente apresentamos uma abordagem via análise Bayesiana e propomos medidas de diagnóstico de influência para dados censurados sob o modelo TCFA quando a suposição de normalidade é assumida. Para avaliação dos métodos propostos, foram realizados alguns estudos simulados, além da aplicação a conjuntos de dados reais.
Abstract: Latent variable models are broadly used by psychometrists, econometrists and social science researchers to model variables that cannnot be directly measured, known as constructs or random effects (Skrondal and Rabe-Hesketh, 2004). In the literature, such variables are commonly modeled with a normal distribution, but such assumption may be inadequate, especially when there are outliers. Concerned with the sensitivity of the inferences under the presence of potential outliers or data derived from heavy-tailed distributions, this thesis proposes robust inference models, using the mutivariate t-Student distribution, for two types of latent variable models: the Generalized Linear Mixed Model for correlated binary data (GLMM) and the Tobit Confirmatory Factor Analysis (TCFA) for continuous and censored data. In order to estimate the parameters of the studied models, an EM-type algorithm was proposed. This algorithm presents closed expressions on the E-step which use the two first moments of a multivariate truncated t-distribution. Moreover, we present a Bayesian approach and propose measures of influence diagnostics for censored data under the TCFA model when normality is assumed. In order to evaluate the proposed methods, simulated studies were carried out, as well as the application on real datasets.
Doutorado
Estatistica
Doutor em Estatística

APA, Harvard, Vancouver, ISO, and other styles

7

Melo, Brian Alvarez Ribeiro de. "Análise Bayesiana de modelos de mistura finita com dados censurados." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-11052017-163847/.

Full text

Abstract:

Misturas finitas são modelos paramétricos altamente flexíveis, capazes de descrever diferentes características dos dados em vários contextos, especialmente na análise de dados heterogêneos (Marin, 2005). Geralmente, nos modelos de mistura finita, todas as componentes pertencem à mesma família paramétrica e são diferenciadas apenas pelo vetor de parâmetros associado a essas componentes. Neste trabalho, propomos um novo modelo de mistura finita, capaz de acomodar observações censuradas, no qual as componentes são as densidades das distribuições Gama, Lognormal e Weibull (mistura GLW). Essas densidades são reparametrizadas, sendo reescritas em função da média e da variância, uma vez que estas quantidades são mais difundidas em diversas áreas de estudo. Assim, construímos o modelo GLW e desenvolvemos a análise de tal modelo sob a perspectiva bayesiana de inferência. Essa análise inclui a estimação, através de métodos de simulação, dos parâmetros de interesse em cenários com censura e com fração de cura, a construção de testes de hipóteses para avaliar efeitos de covariáveis e pesos da mistura, o cálculo de medidas para comparação de diferentes modelos e estimação da distribuição preditiva de novas observações. Através de um estudo de simulação, avaliamos a capacidade da mistura GLW em recuperar a distribuição original dos tempos de falha utilizando testes de hipóteses e estimativas do modelo. Os modelos desenvolvidos também foram aplicados no estudo do tempo de seguimento de pacientes com insuficiência cardíaca do Instituto do Coração da Faculdade de Medicina da Universidade de São Paulo. Nesta aplicação, os resultados mostram uma melhor adequação dos modelos de mistura em relação à utilização de apenas uma distribuição na modelagem dos tempos de seguimentos. Por fim, desenvolvemos um pacote para o ajuste dos modelos apresentados no software R.
Finite mixtures are highly flexible parametric models capable of describing different data features and are widely considered in many contexts, especially in the analysis of heterogeneous data (Marin, 2005). Generally, in finite mixture models, all the components belong to the same parametric family and are only distinguished by the associated parameter vector. In this thesis, we propose a new finite mixture model, capable of handling censored observations, in which the components are the densities from the Gama, Lognormal and Weibull distributions (the GLW finite mixture). These densities are rewritten in such a way that the mean and the variance are the parameters, since the interpretation of such quantities is widespread in various areas of study. In short, we constructed the GLW model and developed its analysis under the bayesian perspective of inference considering scenarios with censorship and cure rate. This analysis includes the parameter estimation, wich is made through simulation methods, construction of hypothesis testing to evaluate covariate effects and to assess the values of the mixture weights, computatution of model adequability measures, which are used to compare different models and estimation of the predictive distribution for new observations. In a simulation study, we evaluated the feasibility of the GLW mixture to recover the original distribution of failure times using hypothesis testing and some model estimated quantities as criteria for selecting the correct distribution. The models developed were applied in the study of the follow-up time of patients with heart failure from the Heart Institute of the University of Sao Paulo Medical School. In this application, results show a better fit of mixture models, in relation to the use of only one distribution in the modeling of the failure times. Finally, we developed a package for the adjustment of the presented models in software R.

APA, Harvard, Vancouver, ISO, and other styles

8

Couto, Epaminondas de Vasconcellos. "Modelo de regressão log-gama generalizado exponenciado com dados censurados." Universidade de São Paulo, 2010. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-16032010-112500/.

Full text

Abstract:

No presente trabalho, e proposto um modelo de regressão utilizando a distribuição gama generalizada exponenciada (GGE) para dados censurados, esta nova distribuição e uma extensão da distribuição gama generalizada. A distribuição GGE (CORDEIRO et al., 2009) que tem quatro parâmetros pode modelar dados de sobrevivência quando a função de risco tem forma crescente, decrescente, forma de U e unimodal. Neste trabalho apresenta-se uma expansão natural da distribuição GGE para dados censurados, esta distribuição desperta o interesse pelo fato de representar uma família paramétrica que possui como casos particulares outras distribuições amplamente utilizadas na analise de dados de tempo de vida, como as distribuições gama generalizada (STACY, 1962), Weibull, Weibull exponenciada (MUDHOLKAR et al., 1995, 1996), exponencial exponenciada (GUPTA; KUNDU, 1999, 2001), Rayleigh generalizada (KUNDU; RAKAB, 2005), dentre outras, e mostra-se útil na discriminação entre alguns modelos probabilísticos alternativos. Considerando dados censurados, e abordado o método de máxima verossimilhança para estimar os parâmetros do modelo proposto. Outra proposta deste trabalho e introduzir um modelo de regressão log-gama generalizado exponenciado com efeito aleatório. Por fim, são apresentadas três aplicações para ilustrar a distribuição proposta.
In the present study, we propose a regression model using the exponentiated generalized gama (EGG) distribution for censored data, this new distribution is an extension of the generalized gama distribution. The EGG distribution (CORDEIRO et al., 2009) that has four parameters it can model survival data when the risk function is increasing, decreasing, form of U and unimodal-shaped. In this work comes to a natural expansion of the EGG distribution for censored data, is awake distribution the interest for the fact of representing a parametric family that has, as particular cases, other distributions which are broadly used in lifetime data analysis, as the generalized gama (STACY, 1962), Weibull, exponentiated Weibull (MUDHOLKAR et al., 1995, 1996), exponentiated exponential (GUPTA; KUNDU, 1999, 2001), generalized Rayleigh (KUNDU; RAKAB, 2005), among others, and it is shown useful in the discrimination among some models alternative probabilistics. Considering censored data, the maximum likelihood estimator is considered for the proposed model parameters. Another proposal of this work was to introduce a log-exponentiated generalized gamma regression model with random eect. Finally, three applications were presented to illustrate the proposed distribution.

APA, Harvard, Vancouver, ISO, and other styles

9

Oyata, Victor Manuel Maehara. "Regressão para dados censurados sob mistura da distribuição gaussiana inversa com sua reciproca complementar." [s.n.], 1994. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307308.

Full text

Abstract:

Orientador: Jonathan Biele
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação
Made available in DSpace on 2018-07-19T11:13:04Z (GMT). No. of bitstreams: 1 Oyata_VictorManuelMaehara_M.pdf: 3446432 bytes, checksum: 916d516447f43d45ce2ff93ebe5fddb7 (MD5) Previous issue date: 1994
Resumo: Não informado
Abstract: Not informed
Mestrado
Mestre em Estatística

APA, Harvard, Vancouver, ISO, and other styles

10

Massuia, Monique Bettio 1989. "Modelos para dados censurados sob a classe de distribuições misturas de escala skew-normal." [s.n.], 2015. http://repositorio.unicamp.br/jspui/handle/REPOSIP/306680.

Full text

Abstract:

Orientador: Víctor Hugo Lachos Dávila
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica
Made available in DSpace on 2018-08-26T19:55:07Z (GMT). No. of bitstreams: 1 Massuia_MoniqueBettio_M.pdf: 2926597 bytes, checksum: 2a1154c0a61b13f369e8390159fc4c3e (MD5) Previous issue date: 2015
Resumo: Este trabalho tem como objetivo principal apresentar os modelos de regressão lineares com respostas censuradas sob a classe de distribuições de mistura de escala skew-normal (SMSN), visando generalizar o clássico modelo Tobit ao oferecer alternativas mais robustas à distribuição Normal. Um estudo de inferência clássico é desenvolvido para os modelos em questão sob dois casos especiais desta família de distribuições, a Normal e a t de Student, utilizando o algoritmo EM para obter as estimativas de máxima verossimilhança dos parâmetros dos modelos e desenvolvendo métodos de diagnóstico de influência global e local com base na metodologia proposta por Cook (1986) e Poom & Poon (1999). Sob o enfoque Bayesiano, o modelo de regressão para respostas censuradas é estudado sob alguns casos especiais da classe SMSN, como a Normal, a t de Student, a skew-Normal, a skew-t e a skew-Slash. Neste caso, o amostrador de Gibbs é a principal ferramenta utilizada para a inferência sobre os parâmetros do modelo. Apresentamos também alguns estudos de simulação para avaliar a metodologia desenvolvida que, por fim, é aplicada em dois conjuntos de dados reais. Os pacotes SMNCensReg, CensRegMod e BayesCR para o software R dão suporte computacional aos desenvolvimentos deste trabalho
Abstract: This work aims to present the linear regression model with censored response variable under the class of scale mixture of skew-normal distributions (SMSN), generalizing the well known Tobit model as providing a more robust alternative to the normal distribution. A study based on classic inference is developed to investigate these censored models under two special cases of this family of distributions, Normal and t-Student, using the EM algorithm for obtaining maximum likelihood estimates and developing methods of diagnostic based on global and local influence as suggested by Cook (1986) and Poom & Poon (1999). Under a Bayesian approach, the censored regression model was studied under some special cases of SMSN class, such as Normal, t-Student, skew-Normal, skew-t and skew-Slash. In these cases, the Gibbs sampler was the main tool used to make inference about the model parameters. We also present some simulation studies for evaluating the developed methodologies that, finally, are applied on two real data sets. The packages SMNCensReg, CensRegMod and BayesCR implemented for the software R give computational support to this work
Mestrado
Estatistica
Mestra em Estatística

APA, Harvard, Vancouver, ISO, and other styles

11

Ramos, Jose de Sousa. "A utilização da transformação do tempo total em teste na analise de dados censurados." [s.n.], 1990. http://repositorio.unicamp.br/jspui/handle/REPOSIP/305881.

Full text

Abstract:

Orientador: Manuel Folledo
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação
Made available in DSpace on 2018-07-13T23:26:05Z (GMT). No. of bitstreams: 1 Ramos_JosedeSousa_M.pdf: 2305512 bytes, checksum: b39437c1a9f2985c51589e82dbb402be (MD5) Previous issue date: 1990
Resumo: Não informado.
Abstract: Not informed.
Mestrado
Mestre em Estatística

APA, Harvard, Vancouver, ISO, and other styles

12

Zappa, Eugênio. "Uma sistemática para utilização de dados censurados de garantia para obtenção da confiabilidade automotiva /." Guaratinguetá, 2019. http://hdl.handle.net/11449/190771.

Full text

Abstract:

Orientador: Messias Borges Silva
Resumo: Com um mercado cada vez mais veloz, competitivo e com consumidores mais exigentes que não toleram falhas de produtos, que são amparados por legislações de proteção e defesa do consumidor, as empresas necessitam se esforçar no aprimoramento da qualidade de seus produtos. Entretanto, mesmo com a aplicação de tecnologias no desenvolvimento e fabricação de produtos, as falhas ainda acontecem. Para que um produto possa desempenhar sua função sem falhas num determinado tempo desejável, nas mais diversas condições reais as quais são submetidos, deve-se conhecer e aumentar a sua confiabilidade. Embora os dados de garantia que as empresas possuam dos seus produtos sejam fontes de informações valiosas para a obtenção da confiabilidade de um produto, estes dados ainda são insuficientes, imprecisos ou incompletos para uso direto, sendo necessário o uso de métodos apropriados ainda não muito disseminados. Este trabalho visa aplicar o método de censura por taxa de uso que viabiliza o uso de dados de garantia em análises mais precisas de confiabilidade para que as empresas possam aprimorar os seus produtos. Por meio de uma revisão da literatura e com o uso de dados de garantia, verificou-se a viabilidade da aplicação do método proposto. Com comprovação estatística, o método proposto de modelagem dos dados de garantia atingiu os resultados do estudo de referência adotado. Conclui-se que o método proposto com o objetivo de conhecer com precisão a confiabilidade do produto é aplicável e não ex... (Resumo completo, clicar acesso eletrônico abaixo)
Abstract: With an ever faster, more competitive market, and more demanding consumers who cannot tolerate product failures that are backed by consumer protection and protection laws, companies need to strive to improve the quality of their products. However, even with the application of technologies in product development and manufacturing, failures still occur. For a product to be able to perform its function without fail in a certain desirable time, under the most diverse real conditions to which it is submitted, its reliability must be known and increased. Although the assurance data that companies have of their products is a valuable source of information for the reliability of a product, this data is still insufficient, inaccurate or incomplete for direct use, and appropriate methods not yet widely disseminated are required. . This work aims to apply the usage rate censored method that enables the use of warranty data in more accurate reliability analyzes so that companies can improve their products. Through a literature review and the use of guarantee data, the feasibility of applying the proposed method was verified. With statistical proof, the proposed guarantee data modeling method reached the results of the adopted reference study. It is concluded that the proposed method with the objective of knowing precisely the product reliability is applicable and does not require specialized reliability software for its execution. Therefore, its application can contribute to the developm... (Complete abstract click electronic access below)
Mestre

APA, Harvard, Vancouver, ISO, and other styles

13

Costa, Edson Vinicius. "Modelos bayesianos multicaracterísticos para dados censurados na avaliação genética de características reprodutivas em bovinos nelore." Universidade Federal de Viçosa, 2017. http://www.locus.ufv.br/handle/123456789/20161.

Full text

Abstract:

Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-06-15T16:22:42Z No. of bitstreams: 1 texto completo.pdf: 889393 bytes, checksum: 7b1030782ba032d798740f086c89d5f9 (MD5)
Made available in DSpace on 2018-06-15T16:22:42Z (GMT). No. of bitstreams: 1 texto completo.pdf: 889393 bytes, checksum: 7b1030782ba032d798740f086c89d5f9 (MD5) Previous issue date: 2017-08-31
As características reprodutivas estão entre as mais importantes no sistema produtivo de carne bovina, dentre elas, a idade ao primeiro parto (IPP) é de fácil mensuração e não onera o sistema produtivo para a sua obtenção. Todavia, esta característica apresenta herdabilidade de baixa magnitude, uma das razões, pode ser o fato de serem analisadas apenas informações de fêmeas consideradas férteis no momento da avaliação. Registros de fêmeas que não apresentam fenótipo devido a falhas reprodutivas, erro de manejo ou por registros inconsistentes são denominados censurados e não são analisados na avaliação genética ao utilizar modelos tradicionais. Alguns estudos têm sugerido a inclusão das informações censuradas para evitar distorções nas inferências e melhoria na predição dos valores genéticos. Outra característica reprodutiva importante economicamente para o sistema produtivo é stayability (STAY), esta característica tem relação direta com custos anuais de reposição de vacas, logo, quanto maior o custo, mais importante se torna a característica. Assim como IPP, STAY apresenta herdabilidade de baixa magnitude, além disso, sua observação fenotípica é obtida tardiamente. O perímetro escrotal (PE) é uma característica de fácil e precoce mensuração e apresenta associação fenotípica favorável com aspectos da qualidade do sêmen. Estudos têm apontado PE como importante critério de seleção para precocidade sexual em ambos os sexos. No primeiro capítulo o objetivo foi analisar metodologias para tratamento de dados censurados sob enfoque Bayesiano e compará-las através da validação cruzada e analisar a influência das informações censuradas de idade ao primeiro parto (IPP) nas estimativas de parâmetros genéticos para IPP e STAY. Foram utilizados dados reprodutivos de fêmeas (STAY e IPP) e genealogia da raça Nelore oriundos da região Centro-Oeste armazenados na Associação Brasileira dos Criadores de Zebu (ABCZ). Os dados foram analisados utilizando quatro diferentes modelos: Modelo linear – limiar (MLL), Modelo linear – limiar – limiar (MLLL), Modelo de penalização - limiar (MPL) e Modelo de penalização modificado - limiar (MPML). A capacidade preditiva de cada modelo foi verificada através de validações cruzadas utilizando como população de validação os animais mais jovens com ambos os pais conhecidos e informações fenotípicas de IPP. Foram analisadas na população de validação as correlações de Person entre os valores genéticos preditos com e sem as informações fenotípicas. Além disso, foram calculadas as porcentagens de animais em comum selecionados nos diferentes percentis 1% e 10%. Em geral, as médias a posteriori das estimativas de herdabilidades para IPP e STAY foram de baixa magnitude e variaram de 0,02 (MPL e MPML) a 0,07 (MLL) para IPP e de 0,09 (MLL, MPL e MPML) a 0,016 (MLLL) para STAY. As correlações genéticas estimadas entre as características IPP e STAY variaram de -0,23 a -0,51, sendo a correlação de maior magnitude observada no modelo MPML. O maior coeficiente de correção entre os valores genéticos preditos para a população de validação com e sem o fenótipo foi obtido no modelo MLL (0,89) e o menor no MPML (0,76). Em ambos os percentis, as maiores concordâncias foram observadas entre os modelos MLL e MLLL. A inclusão de informações censuradas na análise de idade ao primeiro parto acarretou aumento das variâncias residuais. As correlações genéticas entre as características analisadas não foram substancialmente influenciadas. Além disso, o modelo linear sem considerar censura dos dados obteve a melhor capacidade preditiva, sendo este o modelo recomendado para avaliação genética de idade ao primeiro parto. No segundo capítulo, objetivou-se estimar parâmetros genéticos para as características reprodutivas idade ao primeiro parto (IPP), stayability (STAY) e perímetro escrotal aos 365 dias de idade (PE365) a fim de sugerir critérios de seleção para eficiência reprodutiva em bovinos Nelore. Os dados da raça Nelore foram provenientes do Serviço de Registro Genealógico das Raças Zebuínas da Associação Brasileira dos Criadores de Zebu (ABCZ) oriundos da região Centro-Oeste, sendo eles, 66.986 registros de PE365, 374.665 registros de IPP e 385.225 registros de STAY. Os componentes de (co)variâncias foram estimados por meio da Inferência Bayesiana via modelo animal bicaracterístico linear para as características PE365 e IPP, para as características PE365 e STAY e para IPP e STAY, foi utilizado modelo bicaracterístico linear-limiar, de forma que o limiar diz respeito a característica binária STAY. Também foram calculadas as eficiências relativas da seleção indireta (ERS) entre as características analisadas. As estimativas (médias a posteriori) das herdabilidades foram de 0,29, 0,08 e 0,09 para PE365, IPP e STAY, respectivamente. A característica PE365 apresentou correlações genéticas favoráveis com IPP e STAY (-0,45 e 0,12, respectivamente), assim como a correlação entre IPP e STAY(-0,32). As eficiências relativas da seleção indireta mostraram que a seleção para qualquer uma das características ocasionaria mudanças favoráveis nas outras, entretanto, a seleção indireta mostrou-se mais eficiente que a direta para IPP (ERS = 1,87) quando selecionou-se para PE365. Com base nas herdabilidades e correlações genéticas estimadas para as características estudadas, pode-se concluir que o perímetro escrotal aos 365 dias de idade apresentou-se como potencial critério de seleção para desempenho reprodutivo da raça Nelore.
Reproductive performance are among the most important traits in beef cattle production system. Some of these traits such as age at first calving (AFC) are easy to measure and the data collection do not increase production cost. However, AFC show low heritability probably because the fact that only information from females considered fertile at the time of evaluation are analyzed. Records of females that do not have phenotype due to reproductive failures, management error or inconsistent records are denominated censored. These information are not included in the genetic evaluation analysis using traditional models. Some studies have been suggested the inclusion of censored information in the genetic evaluation to avoid distortions in inferences and improve the prediction of breeding values. Another reproductive trait economically important to the productive system is stayability (STAY), which is directly associated with annual cost of cow replacement. Thus, the higher the replacement cost, more important STAY trait becomes. As well as IPP, STAY shows low heritability. In addition, their phenotypic observation is obtained late. The scrotal circumference (SC) is a trait of easy and early measurement. Moreover, it shows a favorable phenotypic association with semen quality traits. Studies have been pointed SC as an important selection criterion for sexual precocity in both sexes. In the first chapter of this thesis, the aim was compare models for handle with censored records through Bayesian Inference and analyze the influence of age at first calving (AFC) censored records in the estimative of genetic parameters for AFC and stayablity (STAY). The data and pedigree of Nellore cattle from Central-West region of Brazil stored by Brasilian Association of Zebu Breeders were used in the analysis. Four models were evaluated: Linear- threshold model (LTM), penalty-threshold model (PTM), modified penalty-threshold model (MPTM) and linear-threshold-threshold model (LTTM). The predictive capacity of the models were compared using cross-validation. The validation population was composed by the youngest individuals with both parents known and phenotyped for AFC. Pearson correlations between predict breeding values of the validation population with and without phenotypic information were computed. In addition, the percentages of common animals selected in the percentiles 1% and 10% were calculated. In general, posteriori means estimates of heritability for AFC presented low magnitude and ranged from 0.02 (PTM and NPTM) to 0.07 (LTM), as well as the heritability estimates for STAY (0.09 to 0.16). The genetic correlations between AFC and STAY ranged from -0.23 to -0.51 and the highest correlation was observed in the NPTM. The highest Pearson correlation in the cross validation was observed for LTM (0.89) and the lowest in MPTM (0.76). The higher concordance in both percentiles were observed between LTM and LTTM. The inclusion of censored information in the genetic evaluation of age at first calving increased the residual variances. Genetic correlations between traits analyzed were not substantially influenced by the inclusion of censored data. In addition, the linear model without considering censored data had the best predictive capacity, thus this model is recommended for genetic evaluation of age at first calving. In the second chapter, we aimed to estimate genetic parameters for the reproductive traits age at first calving (AFC), stayability (STAY) and scrotal circumference at 365 days of age (SC365) in order to suggest a selection criteria for reproductive efficiency in Nellore cattle. The data set was provided by Brazilian Association of Zebu Breeders and included data from Central-West region of Brazil. The data was composed by 66,986 records of SC365, 374,665 records of AFC and 385,225 records of STAY. The variance components were estimated using Bayesian Inference. A bi-trait linear animal model was used for SC365 and AFC, whereas for SC365 and STAY and for AFC and STAY it was used a bi-trait linear-threshold animal model, in which the threshold relates to the binary trait STAY. The relative efficiency of indirect selection (RES) among all traits were calculated. The heritabilities estimates were 0.29, 0.08 and 0.09 for SC365, AFC and STAY, respectively. The genetic correlations between SC365 and AFC and between SC365 and STAY were favorable (-0,45 and 0,12, respectively), as well as the correlation between AFC and STAY (-0,32). The relative efficiency of indirect selection showed that selection for any trait would lead to favorable changes in the others. However, the indirect selection was more efficient than direct selection for AFC when selecting in SC365 (RES = 1,87). Based on the heritability and genetic correlations estimates, we can conclude that scrotal circumference at 365 days of age is a potential selection criteria for reproductive performance in Nellore breed.

APA, Harvard, Vancouver, ISO, and other styles

14

Hashimoto, Elizabeth Mie. "Modelo de regressão para dados com censura intervalar e dados de sobrevivência grupados." Universidade de São Paulo, 2009. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-10022009-093638/.

Full text

Abstract:

Neste trabalho foi proposto um modelo de regressão para dados com censura intervalar utilizando a distribuição Weibull-exponenciada, que possui como característica principal a função de taxa de falha que assume diferentes formas (unimodal, forma de banheira, crescente e decrescente). O atrativo desse modelo de regressão é a sua utilização para discriminar modelos, uma vez que o mesmo possui como casos particulares os modelos de regressão Exponencial, Weibull, Exponencial-exponenciada, entre outros. Também foi estudado um modelo de regressão para dados de sobrevivência grupados na qual a abordagem é fundamentada em modelos de tempo discreto e em tabelas de vida. A estrutura de regressão representada por uma probabilidade é modelada adotando-se diferentes funções de ligação, tais como, logito, complemento log-log, log-log e probito. Em ambas as pesquisas, métodos de validação dos modelos estatísticos propostos são descritos e fundamentados na análise de sensibilidade. Para detectar observações influentes nos modelos propostos, foram utilizadas medidas de diagnóstico baseadas na deleção de casos, denominadas de influência global e medidas baseadas em pequenas perturbações nos dados ou no modelo proposto, denominada de influência local. Para verificar a qualidade de ajuste do modelo e detectar pontos discrepantes foi realizada uma análise de resíduos nos modelos propostos. Os resultados desenvolvidos foram aplicados a dois conjuntos de dados reais.
In this study, a regression model for interval-censored data were developed, using the Exponentiated- Weibull distribution, that has as main characteristic the hazard function which assumes different forms (unimodal, bathtub shape, increase, decrease). A good feature of that regression model is their use to discriminate models, that have as particular cases, the models of regression: Exponential, Weibull, Exponential-exponentiated, amongst others. Also a regression model were studied for grouped survival data in which the approach is based in models of discrete time and in life tables, the regression structure represented by a probability is modeled through the use of different link function, logit, complementary log-log, log-log or probit. In both studies, validation methods for the statistical models studied are described and based on the sensitivity analysis. To find influential observations in the studied models, diagnostic measures were used based on case deletion, denominated as global influence and measures based on small perturbations on the data or in the studied model, denominated as local influence. To verify the goodness of fitting of the model and to detect outliers it was performed residual analysis for the proposed models. The developed results were applied to two real data sets.

APA, Harvard, Vancouver, ISO, and other styles

15

Fachini, Juliana Betini. "Análise de influência local nos modelos de riscos múltiplos." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-02102007-085202/.

Full text

Abstract:

Neste trabalho, é apresentado vários métodos de diagnóstico para modelos de riscos múltiplos. A vantagem desse modelo é sua flexibilidade em relação aos modelos de risco simples, como, os modelos Weibull e log-logístico, pois acomoda uma grande classe de funções de risco, função de risco não-monótona, por exemplo, forma de "banheira" e curvas multimodal. Alguns métodos de influência, assim como, a influência local, influência local total de um indivíduo são calculadas, analizadas e discutidas. Uma discussão computacional do método do afastamento da verossimilhança, bem como da curvatura normal em influência local são apresentados. Finalmente, um conjunto de dados reais é usado para ilustrar a teoria estudada. Uma análise de resíduo é aplicada para a seleção do modelo apropriado.
In this paperwork is present various diagnostic methods for polyhazard models. Polyhazard models are a flexible family for fitting lifetime data. Their main advantage over the single hazard models, such as the Weibull and the log-logistic models, is to include a large amount of nonmonotone hazard shapes, as bathtub and multimodal curves. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. A discussion of the computation of the likelihood displacement as well as the normal curvature in the local influence method are presented. Finally, an example with real data is given for illustration. A residual analysis is performed in order to select an appropriate model.

APA, Harvard, Vancouver, ISO, and other styles

16

Santos, Carlos Aparecido dos. "Dados de sobrevivência multivariados na presença de covariáveis e observações censuradas: uma abordagem bayesiana." Universidade Federal de São Carlos, 2010. https://repositorio.ufscar.br/handle/ufscar/4483.

Full text

Abstract:

Made available in DSpace on 2016-06-02T20:04:51Z (GMT). No. of bitstreams: 1 3028.pdf: 7339557 bytes, checksum: 16711c2271b754604bfa0b0fba30290b (MD5) Previous issue date: 2010-03-04
In this work, we introduce a Bayesian Analysis for survival multivariate data in the presence of a covariate vector and censored observations. Different frailties or latent variables are considered to capture the correlation among the survival times for the same individual. We also introduce a Bayesian analysis for some of the most popular bivariate exponential distributions introduced in the literature. A Bayesian analysis is also introduced for the Block & Basu bivariate exponential distribution using Markov Chain Monte Carlo (MCMC) methods and considering lifetimes in presence of covariates and censored data. In another topic, we introduce a Bayesian Analysis for bivariate lifetime data in the presence of covariates and censoring data assuming different bivariate Weibull distributions derived from some existing copula functions. A great computational simplification to simulate samples for the joint posterior distribution is obtained using the WinBUGS software. Numerical illustrations are introduced considering real data sets considering every proposed methodology.
Nesta tese introduzimos uma an´alise Bayesiana para dados de sobreviv encia multivariados, na presen¸ca de um vetor de covari´aveis e observa¸c oes censuradas. Diferentes fragilidades ou vari´aveis latentes s ao consideradas para capturar a correla¸c ao existente entre os tempos de sobreviv encia, para o mesmo indiv´ıduo. Tamb´em apresentamos uma an´alise Bayesiana para algumas das mais populares distribui¸c oes exponenciais bivariadas introduzidas na literatura. Uma an´alise Bayesiana tamb´em ´e introduzida para a distribui¸c ao exponencial bivariada de Block & Basu, usando m´etodos MCMC (Monte Carlo em Cadeias de Markov) e considerando os tempos de sobreviv encia na presen¸ca de covari´aveis e dados censurados. Em outro t´opico, introduzimos uma an´alise Bayesiana para dados de sobreviv encia bivariados na presen¸ca de covari´aveis e observa¸c oes censuradas, assumindo diferentes distribui¸c oes bivariadas Weibull derivadas de algumas fun¸c oes c´opulas existentes. Uma grande simplifica¸c ao computacional para simular amostras da distribui¸c ao a posteriori conjunta de interesse ´e obtida usando o software WinBUGS. Ilustra¸c oes num´ericas s ao introduzidas considerando conjunto de dados reais, para cada uma das metodologias propostas.

APA, Harvard, Vancouver, ISO, and other styles

17

Fachini, Juliana Betini. "Modelos de regressão com e sem fração de cura para dados bivariados em análise de sobrevivência." Universidade de São Paulo, 2011. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-12092011-170753/.

Full text

Abstract:

Neste trabalho são reunidos diferentes modelos e técnicas para representar situações experimentais ou observacionais de análise de sobrevivência. Para modelar respostas bivariadas e covariáveis foi proposto o modelo de regressão Kumaraswamy-Weibull bivariado. A presen»ca de indivíduos curados foi considerada sob duas diferentes abordagens, originando o modelo de regressão com fração de cura para dados bivariados por meio de cópulas e o modelo de regressão log-linear bivariado com fração de cura. Os parâmetros dos modelos foram esti- mados pelo método de máxima verossimilhança sujeito a restriçãoo nos parâmetros por meio da função barreira adaptada. Adaptou-se uma análise de sensibilidade de forma a considerar as metodologias de Influência Global, Influência Local e Influência Local Total para verificar vários aspectos que envolvem a formulação e ajuste dos modelos propostos. Utilizou-se um conjunto de dados de insuficiência renal e retinopatia diabética são utilizados para exemplificar a aplicação dos modelos propostos.
This work brought together di®erent models and techniques to represent expe- rimental or observational situations in survival analysis. To model bivariate responses and covariates was proposed Kumaraswamy Weibull bivariate regression model. The presence of cured individuals was considered under two di®erent approaches originating the regression model with a cured fraction for bivariate data through copulas and the log-linear bivariate regression model with cured fraction. The parameters of the models were estimated by ma- ximum likelihood method subject to the restriction on the parameters through the adapted barrier function. A sensitivity analysis was adapted considering the methodologies of Global In°uence, Local In°uence and Total Local In°uence to check various aspects of the formulation and adjustment of the models proposed. Data set of renal failure and diabetic retinopathy are used to exemplify the application of the proposed models.

APA, Harvard, Vancouver, ISO, and other styles

18

ROCHA, Sérgio Parente Vieira da. "Um modelo integrado de inferência Bayesiana e processos Markovianos para análise de sistemas reparáveis sujeitos a reparo imperfeito via processo de renovação generalizado." Universidade Federal de Pernambuco, 2006. https://repositorio.ufpe.br/handle/123456789/5751.

Full text

Abstract:

Made available in DSpace on 2014-06-12T17:41:40Z (GMT). No. of bitstreams: 2 arquivo7328_1.pdf: 3505785 bytes, checksum: 08ba0b4fd9e921becd50bfdf276c052f (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2006
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Esta dissertação trata de sistemas reparáveis que sofrem reparo imperfeito, utilizando uma classe de modelos de processos estocásticos conhecida como Processo de Renovação Generalizado (PRG), a qual permite inserir uma maior flexibilidade quanto ao tratamento de diversos níveis de reparo. Para tanto, é proposto um modelo utilizando processos Markovianos não homogêneos para analisar o comportamento dinâmico de sistemas complexos, utilizando o PRG para modelar as probabilidades de transição para estados falhos. Os parâmetros destas distribuições são estimados a partir de um outro modelo proposto de inferência Bayesiana para solução das equações do PRG, considerando a situação de escassez de dados de falha, com múltiplos modos de falha, tempos incertos de ocorrência de falha e censura na amostra. Os modelos propostos permitiram obter diversos indicadores de desempenho de confiabilidade, como disponibilidade, níveis de incerteza acerca dos parâmetros do PRG, além permitir quantificar a eficácia da manutenção em seus reparos, por exemplo. Como exemplo de aplicação dos modelos propostos, foram coletados dados reais de operação de uma válvula do tipo PCV, situada em diferentes estações de redução de pressão de gás natural, sujeita à manutenção corretiva e preventiva

APA, Harvard, Vancouver, ISO, and other styles

19

Sánchez, Luis Enrique Benites. "Finite mixture of regression models." Universidade de São Paulo, 2018. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-10052018-131627/.

Full text

Abstract:

This dissertation consists of three articles, proposing extensions of finite mixtures in regression models. Here we consider a flexible class of both univariate and multivariate distributions, which allow adequate modeling of asymmetric data that have multimodality, heavy tails and outlying observations. This class has special cases such as skew-normal, skew-t, skew-slash and skew normal contaminated distributions, as well as symmetric cases. Initially, a model is proposed based on the assumption that the errors follow a finite mixture of scale mixture of skew-normal (FM-SMSN) distribution rather than the conventional normal distribution. Next, we have a censored regression model where we consider that the error follows a finite mixture of scale mixture of normal (SMN) distribution. Next, we propose a censored regression model where we consider that the error follows a finite mixture of scale mixture of normal (SMN) distribution. Finally, we consider a finite mixture of multivariate regression where the error has a multivariate SMSN distribution. For all proposed models, two R packages were developed, which are reported in the appendix.
Esta tese composta por três artigos, visa propor extensões das misturas finitas nos modelos de regressão. Aqui vamos considerar uma classe flexível de distribuições tanto univariada como multivariada, que permitem modelar adequadamente dados assimmétricos, que presentam multimodalidade, caldas pesadas e observações atípicas. Esta classe possui casos especiais tais como as distribuições skew-normal, skew-t, skew slash, skew normal contaminada, assim como os casos simétricos. Inicialmente, é proposto um modelo baseado na suposição de que os erros seguem uma mistura finita da distribuição mistura de escala skew-normal (SMSN) ao invés da convencional distribuição normal. Em seguida, temos um modelo de regressão censurado onde consideramos que o erro segue uma mistura finita da distribuição da mistura de escala normal (SMN). E por último, é considerada um mistura finita de regressão multivariada onde o erro tem uma distribuição SMSN multivariada. Para todos os modelos propostos foram desenvolvidos dois pacotes do software R, que estão exemplificados no apêndice.

APA, Harvard, Vancouver, ISO, and other styles

20

Carrasco, Jalmar Manuel Farfán. "Modelo de regressão log-Weibull modificado e a nova distribuição Weibull modificada generalizada." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-29022008-151018/.

Full text

Abstract:

Neste trabalho propomos um modelo de regress~ao utilizando a distribuição Weibull modificado, esta distribuição pode ser usada para modelar dados de sobrevivência quando a de função de risco tem forma de U ou banheira. Assumindo dados censurados, é considerado os estimadores de máxima verossimilhança e Jackknife para os parâmetros do modelo proposto. Foram derivadas as matrizes apropriadas para avaliar influiência local sobre os parâmetros estimados considerando diferentes peturbações e também é apresen- tada alguma medidas de influência global. Para diferentes parâmetros fixados, tamanhos de amostra e porcentagem de censuras, varia simulações foram feitas para avaliar a distribuição empírica do resíduo deviance modificado e comparado coma distribuição normal padrão. Esses estudos sugerem que a distribuição empírica do resíduo devianve modificado para o modelo de regressão log-Weibull modificado com dados censurados aproxima-se de uma dis- tribuição normal padrão. Finalmente analisamos um conjunto de dados utilizando o modelo de regressão log-Weibull modificado. Uma nova distribuição de quatro parâmetros é definida para modelar dados de tempo de vida. Algumas propriedades da distribuição é discutida, assim como ilustramos com exemplos a aplicação dessa nova distribuição. Palavras-chaves: Modelo de regressão; Distribuição Weibull modificada; Distribuição weibull modificada generalizada; Análise de sensibilidade; Dados censurados; Análise de resíduo
In this paperwork are proposed a regression model considering the modified Weibull distribution. This distribution can be used to model bathtub-shaped failure rate functions. Assuming censored data, we consider a classic and Jackknife estimator for the parameters of the model. We derive the appropriate matrices for assessing local influence on the parameter estimates under diferent perturbation schemes and we also present some ways to perform global influence. Besides, for diferent parameter settings, sample sizes and censoring percentages, various simulations are performed and the empirical distribution of the deviance modified residual is displayed and compared with the standard normal distribution. These studies suggest that the residual analysis usually performed in normal linear regression models can be straightforwardly extend for a martingale-type residual in log-modifiedWeibull regression models with censored data. Finally, we analyze a real data set under log-modified Weibull regression models. A diagnostic analysis and a model checking based on the deviance modified residual are performed to select an appropriate model. A new four-parameter distribution is introduced. Various properties the new distribution are discussed. Illustrative examples based on real data are also given.

APA, Harvard, Vancouver, ISO, and other styles

21

Martins, Camila Bertini. "Metanálise caso a caso sob a perspectiva bayesiana." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-10122013-190238/.

Full text

Abstract:

O papel da metanálise de sumarizar estudos publicados de mesmo objetivo, por meio da estatística, torna-se cada dia mais fundamental em razão do avanço da ciência e do desejo de usar o menor número de seres humanos em ensaios clínicos, desnecessários, em vários casos. A síntese das informações disponíveis facilita o entendimento e possibilita conclusões robustas. O aumento de estudos clínicos, por exemplo, promove um crescimento da necessidade de metanálises, fazendo com que seja necessário o desenvolvimento de técnicas sofisticadas. Desse modo, o objetivo deste trabalho foi propor uma metodologia bayesiana para a realização de metanálises. O procedimento proposto consiste na mistura das distribuições a posteriori do parâmetro de interesse de cada estudo pertencente à metanálise; ou seja, a medida metanalítica proposta foi uma distribuição de probabilidade e não uma simples medida-resumo. A metodologia apresentada pode ser utilizada com qualquer distribuição a priori e qualquer função de verossimilhança. O cálculo da medida metanalítica pode ser utilizado, desde problemas simples até os mais sofisticados. Neste trabalho, foram apresentados exemplos envolvendo diferentes distribuições de probabilidade e dados de sobrevivência. Em casos, em que se há uma estatística suficiente disponível para o parâmetro em questão, a distribuição de probabilidade a posteriori depende dos dados apenas por meio dessa estatística e, assim, em muitos casos, há a redução de dimensão sem perda de informação. Para alguns cálculos, utilizou-se o método de simulação de Metropolis-Hastings. O software estatístico utilizado neste trabalho foi o R.
The meta-analysis role of using Statistics to summarize published studies that have the same goal becomes more essential day by day, due to the improvement of Science and the desire of using the least possible number of human beings in clinical trials, which in many cases is unnecessary. By match the available information it makes the understanding easier and it leads to more robust conclusions. For instance, the increase in the number of clinical researches also makes the need for meta-analysis go higher, arising the need for developing sophisticated techniques. Then our goal in this work is to propose a Bayesian methodology to conduct meta-analysis. The proposed procedure is a blend of posterior distributions from interest parameters of each work we are considering when doing meta-analysis. As a consequence, we have a probability distribution as a meta-analytic measure, rather than just a statistical summary. The methodology we are presenting can be used with any prior probability distribution and any likelihood function. The calculation of the meta-analytic measure has its uses from small to more complex problems. In this work we present some examples that consider various probability distributions and also survival data. There is a sufficient statistic available for the parameter of interest, the posterior probability distribution depends on the data only through this statistic and thus, in many cases, we can reduce our data without loss of information. Some calculations were performed through Metropolis-Hastings simulation algorithm. The statistical software used in this work was the R.

APA, Harvard, Vancouver, ISO, and other styles

22

Rizzato, Fernanda Bührer. "Modelos de regressão log-gama generalizado com fração de cura." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-19032007-152443/.

Full text

Abstract:

Neste trabalho considera-se uma reparametrização no modelo log-gama generalizado para a inclusão de dados com sobreviventes de longa duração. Os modelos tentam estimar separadamente os efeitos das covariáveis na aceleração ou desaceleração no tempo e na fração de sobreviventes que é a proporção da população para o qual o evento não ocorre. A função logística é usada para o modelo de regressão com fração de cura. Os parâmetros do modelo, serão estimados através do método de máxima verossimilhança. Alguns métodos de influência, como a influência local e a influência local total de um indivíduo, serão introduzidos, calculados, analisados e discutidos. Finalmente, um conjunto de dados médicos será analisado sob o modelo log-gama generalizado com fração de cura. Uma análise de resíduos será executada para verificar a qualidade de ajuste do modelo.
In this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.

APA, Harvard, Vancouver, ISO, and other styles

23

Mendoza, Pinto Lizeth Mayra. "Regresión lineal con datos censurados por intervalos." Universidad Mayor de San Andrés. Programa Cybertesis BOLIVIA, 2008. http://www.cybertesis.umsa.bo:8080/umsa/2008/mendoza_pl/html/index-frames.html.

Full text

Abstract:

Las observaciones intervalo censuradas se presentan en estudios donde no se puede precisar exactamente la observación, solamente se conoce un rango de ocurrencia, dentro del cual se supone recae la información, como por ejemplo, datos de estudios médicos, económicos, etc. En este documento se consideran modelos de regresión lineal en los cuales la variable respuesta es intervalo censurada y/o la variable covariante. El uso de un método ad hoc de análisis para dichos datos, como el que emplea los puntos medios de los intervalos de las variables intervalo censuradas en mínimos cuadrados ordinarios para la estimación de parámetros, no es válido en general, pues da lugar a estimaciones sesgadas. En este documento se emplea, una aproximación de máxima verosimilitud semiparamétrica, junto a un algoritmo condicional de dos fases, para estimar conjuntamente los coeficientes de regresión así como la distribución marginal de la covariante intervalo censurada. El método se aplica a la estimación del Gasto familiar en alimentación dependiente del Gasto total familiar, tomando datos censurados por intervalos. Se comparan las estimaciones obtenidas por el método con las estimaciones obtenidas por el procedimiento que emplea puntos medios, para analizar las bondades del método propuesto.

APA, Harvard, Vancouver, ISO, and other styles

24

Pascoa, Marcelino Alves Rosa de. "Extensões da distribuição gama generalizada: propriedades e aplicações." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-30052012-091940/.

Full text

Abstract:

A distribuição gama generalizada (GG) possui, como casos particulares, distribuição Weibull, log-normal, gama, qui-quadrado, entre outras. Por essa razão, ela e considerada uma distribuição exvel no ajuste dos dados. A ideia de Cordeiro e Castro (2011) foi utilizada para o desenvolvimento de duas novas distribuições de probabilidade a partir da distribuição GG. Uma delas e denominada de Kumaraswamy gama generalizada (KumGG) e possui cinco parâmetros; a outra distribuição e uma modificação de um dos parmetros de forma da distribuição KumGG e foi denominada de distribuição Kumaraswamy gama generalizada estendida (KumGGE). Desenvolveu-se o modelo de regressão log-Kumaraswamy gama generalizada estendida. Alem disso, a ideia de Adamidis e Loukas (1998) para modicar distribuições foi utilizada para a distribuição GG; essa nova distribuição foi nomeada de gama generalizada geometrica (GGG). A vantagem desses novos modelos reside na capacidade de acomodar varias formas da função risco eles tambem se mostraram uteis na discriminação de modelos. Para cada um dos modelos foram calculados os momentos, função geradora de momentos, os desvios medios, a conabilidade e a função densidade de probabilidade da estatistica de ordem. Para a estimação dos parâmetros, foram utilizados os metodos de maxima verossimilhanca e bayesiano e, finalmente, para ilustrar a aplicação das novas distribuições foram analisados alguns conjuntos de dados reais.
The generalized gamma (GG) distribution has as particular cases the Weibull, log-normal, gamma and Chi-square distributions, among others. For this reason, it is considered a exible distribution for tting data. In this paper, the idea of Cordeiro and Castro (2011) is used to develop two new probability distributions based on the GG distribution. The rst is called the generalized gamma Kumaraswamy (KumGG) and has ve parameters, while the other involves a modication of one of the shape parameters of the KumGG distribution and is called the extended generalized gamma Kumaraswamy (KumGGE). Based in these, we develop the extended generalized log-Kumaraswamy regression model. Besides this, we employ the idea regarding modifying distributions of Adamidis and Loukas (1998) for the GG distribution, calling this new distribution the geometric generalized gamma (GGG). The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets.

APA, Harvard, Vancouver, ISO, and other styles

25

Lanjoni, Beatriz Rezende. "O modelo Burr XII geométrico: propriedades e aplicações." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-17122013-085812/.

Full text

Abstract:

No presente trabalho são propostos dois modelos para dados censurados baseados na mistura da distribuição geométrica e na distribuição Burr XII considerando duas ativações latentes, máximo e mínimo. A distribuição Burr XII tem três parâmetros e é uma generalização da distribuição log-logística. Por sua vez a distribuição Burr XII Geométrica tipo I e tipo II tem quatro parâmetros e são generalizações da distribuição Burr XII relacionados as ativações latentes do mínimo e máximo respectivamente. Foram apresentadas algumas propriedades das duas novas distribuições tais como momentos, assimetria, curtose, função geradora de momentos e desvio médio. Além disso, foi intriduzido os modelos de regressão correspondentes, log Burr XII Geométrica tipo I e log Burr XII Geométrica tipo II. Adicionalmente foi desenvolvido um modelo de sobrevivência com fração de cura assumindo que o número de causas competitivas do evento de interesse segue a distribuição geométrica e o tempo do evento segue a distribuição Burr XII. Para todos os modelos desenvolvidos foi utilizado o método da máxima verossimilhança para estimar os parâmetros, que possibilita a construção de intervalos de confiança e testes de hipóteses. Por fim, são apresentadas três aplicações para ilustrar os modelos propostos.
In this paper are proposed two models for censored data based on the mixture of geometric distribution and Burr XII distribution considering two latent activations, maximum and minimum. The Burr XII distribution has three parameters and is a generalization of the log-logistic distribution. On the other hand Burr XII Geometric type I distribution and type II has four parameters and are a generalization of the Burr XII distribution related to minimum and maximum activations respectively. It were presented some properties of the news distributions such as moments, skewness, kurtosis, moment generating function and mean deviation. Furthermore, it was introduced two regression models, the log Burr XII Geometric type I and the log Burr XII Geometric type II. Additionally a new cure rate survival was formulated by assuming that the number of competing causes of the event of interest has the geometric distribution and the time to this event follows Burr XII distribution. For all models was developed the maximum likelihood method to estimate the parameters, which allows the construction of confidence intervals and hypothesis testing. Finally, three applications are presented to illustrate the proposed models.

APA, Harvard, Vancouver, ISO, and other styles

26

Paranaíba, Patrícia Ferreira. "Caracterização e extensões da distribuição Burr XII: propriedades e aplicações." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-29102012-085146/.

Full text

Abstract:

A distribuição Burr XII (BXII) possui, como casos particulares, as distribuições normal, log-normal, gama, logística, valor extremo tipo I, entre outras. Por essa razão, ela é considerada uma distribuição flexível no ajuste dos dados. As ideias de Eugene; Lee e Famoye (2002) e Cordeiro e Castro (2011) foram utilizadas para o desenvolvimento de duas novas distribuições de probabilidade a partir da distribuição BXII. Uma delas é denominada beta Burr XII (BBXII) e possui cinco parâmetros. Desenvolveu-se o modelo de regressão log-beta Burr XII (LBBXII). A outra distribuição é denominada de Kumaraswamy Burr XII (KwBXII) e possui cinco parâmetros. A vantagem desses novos modelos reside na capacidade de acomodar várias formas da função risco, além disso, eles também se mostraram úteis na discriminação de modelos. Para cada um dos modelos foram calculados os momentos, função geradora de momentos, os desvios médios, a confiabilidade e a função densidade de probabilidade da estatística de ordem. Foi realizado um estudo de simulação para avaliar o desempenho desses modelos. Para a estimação dos parâmetros, foram utilizados os métodos de máxima verossimilhança e bayesiano e, finalmente, para ilustrar a aplicação das novas distribuições foram analisados alguns conjuntos de dados reais.
The Burr XII (BXII) distribution has as particular cases the normal, lognormal, gamma, logistic and extreme-value type I distributions, among others. For this reason, it is considered a flexible distribution for fitting data. In this paper, the ideas of Eugene; Lee e Famoye (2002) and Cordeiro and Castro (2011) is used to develop two new probability distributions based on the BBXII distribution. The first is called beta Burr XII (BBXII) and has five parameters. Based in these, we develop the extended generalized log-beta Burr XII regression model. The other distribution is called Kumaraswamy Burr XII (KwBXII) and has five parameters. The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. A simulation study was conducted to evaluate the performance of these models. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets.

APA, Harvard, Vancouver, ISO, and other styles

27

Frazão, Italo Marcus da Mota. "Modelos com sobreviventes de longa duração paramétricos e semi-paramétricos aplicados a um ensaio clínico aleatorizado." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-13032013-093628/.

Full text

Abstract:

Diversos modelos têm sido propostos na literatura com o objetivo de analisar dados de sobrevivência em que a população sob estudo é assumida ser uma mistura de indivíduos suscetíveis (em risco) e não suscetíveis a um específico evento de interesse. Tais modelos são usualmente denominados modelos com sobreviventes de longa duração ou modelos com fração de cura. Neste trabalho, diversos desses modelos (nos contextos paramétrico e semi-paramétrico) foram considerados para analisar os dados de um ensaio clínico aleatorizado conduzido com o objetivo de comparar três estratégias terapêuticas (cirurgia, angioplastia e medicamentoso) utilizadas no tratamento de pacientes com doença coronariana multiarterial. Em todos os modelos, as funções de ligação logito e complemento log-log foram utilizadas para modelar a proporção de sobreviventes de longa duração (indivíduos não suscetíveis). Quanto à função de sobrevivência dos indivíduos suscetíveis, foram utilizados os modelos de Weibull e de Cox. Covariáveis foram consideradas tanto na proporção de sobreviventes de longa duração quanto na função de sobrevivência dos indivíduos suscetíveis. De modo geral, os modelos considerados se mostraram adequados para analisar os dados do ensaio clínico aleatorizado, indicando a cirurgia como a estratégia terapêutica mais eficiente. Indicaram também, que as covariáveis idade, hipertensão e diabetes mellitus exercem influência na ocorrência do óbito cardíaco, mas não no tempo até a ocorrência deste óbito nos pacientes suscetíveis.
Several models have been proposed in the literature with the aim of analyzing survival data when the population under study is assumed to be a mixture of susceptible (at risk) and not susceptible individuals to a specific event of interest. Such models are usually called long-term survivors models or cure rate models. In this work, several of these models (under both parametric and semi-parametric approaches) were considered to analyze the data from a randomized clinical trial conducted in order to compare three therapeutic strategies (surgery, angioplasty and medicine) used in the treatment of patients with multivessel coronary artery disease. For all models the logit and complementary log-log link functions were used to model the proportion of long-term survivors (not susceptible individuals). In regards to the survival function of the susceptible individuals, the Weibull and Cox models were used. Covariates were considered both in the proportion of longterm survivors and in the survival function of the susceptible individuals. Overall, the models considered were suitable for analyzing the data from the randomized clinical trial indicating surgery as the most effective therapeutic strategy. They also indicated that the covariates age, hypertension and diabetes mellitus exhibit influence on the occurrence of cardiac death, but not on the time to the occurrence of this death in susceptible patients.

APA, Harvard, Vancouver, ISO, and other styles

28

Gomes, Eduardo Monteiro de Castro. "Análise de sensibilidade e resíduos em modelos de regressão com respostas bivariadas por meio de cópulas." Universidade de São Paulo, 2008. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-25032008-151751/.

Full text

Abstract:

Neste trabalho são apresentados modelos de regressão com respostas bivariadas obtidos através de funções cópulas. O objetivo de utilizar estes modelos bivariados é modelar a correlação entre eventos e captar nos modelos de regressão a influência da associação entre as variáveis resposta na presença de censura nos dados. Os parâmetros dos modelos, são estimados por meio dos métodos de máxima verossimilhança e jackknife. Alguns métodos de análise de sensibilidade como influência global, local e local total de um indivíduo, são introduzidos e calculados considerando diferentes esquemas de perturbação. Uma análise de resíduos foi proposta para verificar a qualidade do ajuste dos modelos utilizados e também foi proposta novas medidas de resíduos para respostas bivariadas. Métodos de simulação de Monte Carlo foram conduzidos para estudar a distribuição empírica dos resíduos marginais e bivariados propostos. Finalmente, os resultados são aplicados à dois conjuntos de dados dsponíveis na literatura.
In this work bivariate response regression models are presented with the use of copulas. The objective of this approach is to model the correlation between events and capture the influence of this correlation in the regression parameters. The models are used in the context of survival analysis and are ¯tted to two data sets available in the literature. Inferences are obtained using maximum likelihood and Jackknife methods. Sensitivity techniques such as local and global in°uence are proposed and calculated. A residual analysis is proposed to check the adequacy of the models and simulation methods are used to asses the empirical distribution of the marginal univariate and bivariate residual measures proposed.

APA, Harvard, Vancouver, ISO, and other styles

29

Hashimoto, Elizabeth Mie. "Modelo de regressão gama-G em análise de sobrevivência." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-26042013-095312/.

Full text

Abstract:

Dados de tempo de falha são caracterizados pela presença de censuras, que são observações que não foram acompanhadas até a ocorrência de um evento de interesse. Para estudar o comportamento de dados com essa natureza, distribuições de probabilidade são utilizadas. Além disso, é comum se ter uma ou mais variáveis explicativas associadas aos tempos de falha. Dessa forma, o objetivo geral do presente trabalho é propor duas novas distribuições utilizando a função geradora de distribuições gama, no contexto de modelos de regressão em análise de sobrevivência. Essa função possui um parâmetro de forma que permite criar famílias paramétricas de distribuições que sejam flexíveis para capturar uma ampla variedade de comportamentos simétricos e assimétricos. Assim, a distribuição Weibull e a distribuição log-logística foram modificadas, dando origem a duas novas distribuições de probabilidade, denominadas de gama-Weibull e gama-log-logística, respectivamente. Consequentemente, os modelos de regressão locação-escala, de longa-duração e com efeito aleatório foram estudados, considerando as novas distribuições de probabilidade. Para cada um dos modelos propostos, foi utilizado o método da máxima verossimilhança para estimar os parâmetros e algumas medidas de diagnóstico de influência global e local foram calculadas para encontrar possíveis pontos influentes. No entanto, os resíduos foram propostos apenas para os modelos locação-escala para dados com censura à direita e para dados com censura intervalar, bem um estudo de simulação para verificar a distribuição empírica dos resíduos. Outra questão explorada é a introdução dos modelos: gama-Weibull inflacionado de zeros e gama-log-logística inflacionado de zeros, para analisar dados de produção de óleo de copaíba. Por fim, diferentes conjunto de dados foram utilizados para ilustrar a aplicação de cada um dos modelos propostos.
Failure time data are characterized by the presence of censoring, which are observations that were not followed up until the occurrence of an event of interest. To study the behavior of the data of that nature, probability distributions are used. Furthermore, it is common to have one or more explanatory variables associated to failure times. Thus, the goal of this work is given to the generating of gamma distributions function in the context of regression models in survival analysis. This function has a shape parameter that allows create parametric families of distributions that are flexible to capture a wide variety of symmetrical and asymmetrical behaviors. Therefore, through the generating of gamma distributions function, the Weibull distribution and log-logistic distribution were modified to give two new probability distributions: gamma-Weibull and gammalog-logistic. Additionally, location-scale regression models, long-term models and models with random effects were also studied, considering the new distributions. For each of the proposed models, we used the maximum likelihood method to estimate the parameters and some diagnostic measures of global and local influence were calculated for possible influential points. However, residuals have been proposed for data with right censoring and interval-censored data and a simulation study to verify the empirical distribution of the residuals. Another issue explored is the introduction of models: gamma-Weibull inflated zeros and gamma-log-logistic inflated zeros, to analyze production data copaiba oil. Finally, different data set are used to illustrate the application of each of the models.

APA, Harvard, Vancouver, ISO, and other styles

30

Santos, Bruno Ramos dos. "Extensões dos modelos de regressão quantílica bayesianos." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-03072016-000933/.

Full text

Abstract:

Esta tese visa propor extensões dos modelos de regressão quantílica bayesianos, considerando dados de proporção com inflação de zeros, e também dados censurados no zero. Inicialmente, é sugerida uma análise de observações influentes, a partir da representação por mistura localização-escala da distribuição Laplace assimétrica, em que as distribuições a posteriori das variáveis latentes são comparadas com o intuito de identificar possíveis observações aberrantes. Em seguida, é proposto um modelo de duas partes para analisar dados de proporção com inflação de zeros ou uns, estudando os quantis condicionais e a probabilidade da variável resposta ser igual a zero. Além disso, são propostos modelos de regressão quantílica bayesiana para dados contínuos com um componente discreto no zero, em que parte dessas observações é suposta censurada. Esses modelos podem ser considerados mais completos na análise desse tipo de dados, uma vez que a probabilidade de censura é verificada para cada quantil de interesse. E por último, é considerada uma aplicação desses modelos com correlação espacial, para estudar os dados da eleição presidencial no Brasil em 2014. Nesse caso, os modelos de regressão quantílica são capazes de incorporar essa informação espacial a partir do processo Laplace assimétrico. Para todos os modelos propostos foi desenvolvido um pacote do software R, que está exemplificado no apêndice.
This thesis aims to propose extensions of Bayesian quantile regression models, considering proportion data with zero inflation, and also censored data at zero. Initially, it is suggested an analysis of influential observations, based on the location-scale mixture representation of the asymmetric Laplace distribution, where the posterior distribution of the latent variables are compared with the goal of identifying possible outlying observations. Next, a two-part model is proposed to analyze proportion data with zero or one inflation, studying the conditional quantile and the probability of the response variable being equal to zero. Following, Bayesian quantile regression models are proposed for continuous data with a discrete component at zero, where part of these observations are assumed censored. These models may be considered more complete in the analysis of this type of data, as the censoring probability varies with the quantiles of interest. For last, it is considered an application of these models with spacial correlation, in order to study the data about the last presidential election in Brazil in 2014. In this example, the quantile regression models are able to incorporate spatial dependence with the asymmetric Laplace process. For all the proposed models it was developed a R package, which is exemplified in the appendix.

APA, Harvard, Vancouver, ISO, and other styles

31

Sousa, Mário Fernando de. "Two essays on Birnbaum-Saunders regression models for censored data." Universidade Federal de Goiás, 2016. http://repositorio.bc.ufg.br/tede/handle/tede/7235.

Full text

Abstract:

Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-05-02T15:17:50Z No. of bitstreams: 2 Dissertação - Mário Fernando de Sousa - 2016.pdf: 645506 bytes, checksum: d6fd190570fce6feeb390cfeaf50032f (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-05-02T15:18:06Z (GMT) No. of bitstreams: 2 Dissertação - Mário Fernando de Sousa - 2016.pdf: 645506 bytes, checksum: d6fd190570fce6feeb390cfeaf50032f (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Made available in DSpace on 2017-05-02T15:18:06Z (GMT). No. of bitstreams: 2 Dissertação - Mário Fernando de Sousa - 2016.pdf: 645506 bytes, checksum: d6fd190570fce6feeb390cfeaf50032f (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-12-06
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
This work aims to fill a gap in the literature on modeling asymmetric and censored data. The main objective is to provide a contribution by developing two models, which will be presented in two papers, respectively. In the first paper, we develop the tobit-Birnbaum-Saunders model, a variation of the standard tobit model. We discuss estimation based on the maximum likelihood method, residuals, diagnostic techniques and an empirical application. In the second paper, we propose the use of a mixture between the Birnbaum-Saunders and Bernoulli distributions. The objective is to generalize the tobit-Birnbaum-Saunders model in order to consider the possibility of partial observations below a cutoff point. For the mixture model, we carry out a Monte Carlo simulation study and an empirical application. The results show that, in both cases, the Birnbaum-Saunders distribution provides the best results.
Este trabalho visa preencher uma lacuna existente na literatura pertinente à modelagem de dados assimétricos e censurados. O objetivo principal é oferecer uma contribuição via o desenvolvimento de dois modelos, os quais serão apresentados em dois artigos. No primeiro artigo é proposto o modelo tobit-Birnbaum-Saunders, ou seja, uma variação do modelo tobit clássico, com estimação baseada no método de máxima verossimilhança, resíduos, técnicas de diagnóstico e uma aplicação a dados reais. No segundo artigo é abordada a utilização de um modelo de mistura entre as distribuições Birnbaum-Saunders e Bernoulli, de modo a generalizar o modelo tobit-Birnbaum-Saunders e considerar a possibilidade de observações parciais abaixo do ponto de corte. Para o modelo de mistura são realizadas simulações de Monte Carlo e uma aplicação a dados reais. Os resultados mostram que, em ambos os casos, a distribuição Birnbaum-Saunders oferece os melhores resultados.

APA, Harvard, Vancouver, ISO, and other styles

32

Marchi, Vitor Alex Alves de. "Uma nova abordagem para análise de dependência bivariada." Universidade Federal de São Carlos, 2010. https://repositorio.ufscar.br/handle/ufscar/4543.

Full text

Abstract:

Made available in DSpace on 2016-06-02T20:06:04Z (GMT). No. of bitstreams: 1 3023.pdf: 2559668 bytes, checksum: 9cf8ca3c2627a6f2d69856b231e8a0a4 (MD5) Previous issue date: 2010-04-23
Financiadora de Estudos e Projetos
In this dissertation we describe and implement procedures for nonparametric estimation of copulas and Sibuya function, and also procedures for bivariate analysis of dependence based on the behavior of their contours plot. Besisdes, we describe and implement the chiplot procedure and as well as a procedure for analising bivariate dependence in presence of censoring in the sample. Particularly, we propose a way to use it in a local correlation analysis. The performance of the proposed procedures are illustrated and evaluated in cases of very simple correlation, but also in a more complex correlation schemes.
Nesta dissertação descrevemos e implementamos procedimentos para estimação paramétrica da cópula e da função de Sibuya, e também procedimentos para análise de dependência bivariada, baseados no comportamento das suas curvas de nível. Também, descrevemos e implementamos o procedimento chi-plot e um procedimento para a análise de dependência bivariada com presença de censura na amostra. Particularmente, propomos formas de usá-los em análise de correlação local. O desempenho dos procedimentos propostos são ilustrados e avaliados em casos de estruturas de correlação simples, mas também em esquemas de correlação mais complexa.

APA, Harvard, Vancouver, ISO, and other styles

33

Mendoza, Natalie Verónika Rondinel. "A distribuição log-logística exponenciada geométrica: dupla ativação." Universidade de São Paulo, 2012. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-26102012-150929/.

Full text

Abstract:

Neste trabalho é proposta uma nova distribuição de quatro parâmetros denominada distribuição log-logística exponenciada geométrica, baseada em um mecanismo de dupla ativação para modelar dados de tempo de vida. Para esta nova distribuição, foi realizado um estudo da função de densidade de probabilidade, da função de distribuição acumulada, da função de sobrevivência e da função de taxa de falha, a qual apresenta formas que podem modelar dados de tempo de vida, tais como: forma crescente, decrescente, unimodal, bimodal e forma de U. Obteve-se expansões da função de densidade, expressões para os momentos de probabilidade ponderada, função geradora de momentos, desvios médios e as curvas de Bonferroni e de Lorenz. Considerando dados censurados, foi utilizado o método de máxima verossimilhança para estimação dos parâmetros. Analogamente também é proposto um modelo de regressão baseado no logaritmo da distribuição log-logística exponenciada geométrica com dupla ativação, que é uma extensão dos modelos de regressão logística exponenciada e logística. Este modelo pode ser usado na análise de dados reais, por fornecer um melhor ajuste que os modelos de regressão particulares, logística exponenciada e logística. Finalmente, são apresentados duas aplicações para ilustrar a utilização da nova distribuição.
In this work, we propose a new distribution with four parameters the so called exponentiated log-logistic geometric distribution based on a double mechanism of activation for modeling lifetime data. For this new distribution, we study the density function, cumulative distribution, survival function and the failure rate function which allows major harzad rates: increasing, decreasing, bathtub, unimodal and bimodal failure rates. We also obtain the density function expansions and the expressions for the probability-weighted moments, moment generating function, mean deviation and Bonferroni and Lorenz curves. Considering censored data, we use the maximum likelihood method for estimating the parameters. Similarly, we also propose the regression model based on the logarithm of the exponentiated log-logistic geometric distribution with double activation, which is an extension of the exponential logistic and logistic regression models. This new model could be widely used in the analysis of real data to provide a better fit than exponetial logistic and logistic regression models. Finally, two applications are presented to illustrate the application of the new distribution.

APA, Harvard, Vancouver, ISO, and other styles

34

Silva, Giovana Oliveira. "Modelos de regressão quando a função de taxa de falha não é monótona e o modelo probabilístico beta Weibull modificada." Universidade de São Paulo, 2009. http://www.teses.usp.br/teses/disponiveis/11/11134/tde-10032009-094918/.

Full text

Abstract:

Em aplicações na área de análise de sobrevivência, é freqüente a ocorrência de função de taxa de falha em forma de U ou unimodal, isto e, funções não-monótonas. Os modelos de regressão comumente usados para dados de sobrevivência são log-Weibull, função de taxa de falha monótona, e log-logística, função de taxa de falha decrescente ou unimodal. Um dos objetivos deste trabalho e propor os modelos de regressão, em forma de locação e escala, log-Weibull estendida que apresenta função de taxa de falha em forma de U e log- Burr XII que tem como caso particular o modelo de regressão log-logística. Considerando dados censurados, foram utilizados três métodos para estimação dos parâmetros, a saber, máxima verossimilhança, bayesiana e jackkinife. Para esses modelos foram calculadas algumas medidas de diagnósticos de influência local e global. Adicionalmente, desenvolveu-se uma análise de resíduos baseada no resíduo tipo martingale. Para diferentes parâmetros taxados, tamanhos de amostra e porcentagens de censuras, várias simulações foram feitas para avaliar a distribuição empírica do resíduo tipo martingale e compará-la com a distribuição normal padrão. Esses estudos sugerem que a distribuição empírica do resíduo tipo martingale para o modelo de regressão log-Weibull estendida com dados censurados aproxima-se de uma distribuição normal padrão quando comparados com outros resíduos considerados neste estudo. Para o modelo de regressão log-Burr XII, foi proposta uma modificação no resíduo tipo martingale baseada no estudo de simulação para obter concordância com a distribuição normal padrão. Conjuntos de dados reais foram utilizados para ilustrar a metodologia desenvolvida. Também pode ocorrer que em algumas aplicações a suposição de independência dos tempos de sobrevivência não é válida. Assim, outro objetivo deste trabalho é introduzir um modelo de regressão log-Burr XII com efeito aleatório para o qual foi proposto um método de estimação para os parâmetros baseado no algoritmo EM por Monte Carlo. Por fim, foi desenvolvido um novo modelo probabilístico denominado de beta Weibull modificado que apresenta cinco parâmetros. A vantagem desse novo modelo é a flexibilidade em acomodar várias formas da função de taxa de falha, por exemplo, U e unimodal, e mostrou-se útil na discriminação entre alguns modelos probabilísticos alternativos. O método de máxima verossimilhança e proposto para estimar os parâmetros desta distribuição. A matriz de informação observada foi calculada. Um conjunto de dados reais é usado para ilustrar a aplicação da nova distribuição
In survival analysis applications, the failure rate function may have frequently unimodal or bathtub shape, that is, non-monotone functions. The regression models commonly used for survival studies are log-Weibull, monotone failure rate function shape, and log-logistic, decreased or unimodal failure rate function shape. In the first part of this thesis, we propose location-scale regression models based on an extended Weibull distribution for modeling data with bathtub-shaped failure rate function and on a Burr XII distribution as an alternative to the log-logistic regression model. Assuming censored data, we consider a classical analysis, a Bayesian analysis and a jackknife estimator for the parameters of the proposed models. For these models, we derived the appropriate matrices for assessing the local influence on the parameter estimates under diferent perturbation schemes, and we also presented some ways to perform global influence. Additionally, we developed residual analy- sis based on the martingale-type residual. For di®erent parameter settings, sample sizes and censoring percentages, various simulation studies were performed and the empirical distribution of the martingale-type residual was displayed and compared with the standard normal distribution. These studies suggest that the empirical distribution of the martingale-type residual for the log-extended Weibull regression model with data censured present a high agreement with the standard normal distribution when compared with other residuals considered in these studies. For the log-Burr XII regression model, it was proposed a change in the martingale-type residual based on some studies of simulation in order to obtain an agreement with the standard normal distribution. Some applications to real data illustrate the usefulness of the methodology developed. It can also happen in some applications that the assumption of independence of the times of survival is not valid, so it was added to the log-Burr XII regression model of random exects for which an estimate method was proposed for the parameters based on the EM algorithm for Monte Carlo simulation. Finally, a five- parameter distribution so called the beta modified Weibull distribution is defined and studied. The advantage of that new distribution is its flexibility in accommodating several forms of the failure rate function, for instance, bathtub-shaped and unimodal shape, and it is also suitable for testing goodness-of-fit of some special sub-models. The method of maximum likelihood is used for estimating the model parameters. We calculate the observed information matrix. A real data set is used to illustrate the application of the new distribution.

APA, Harvard, Vancouver, ISO, and other styles

35

Gianfelice, Paulo Roberto de Lima. "Bayesian and classical inference for extensions of Geometric Exponential distribution with applications in survival analysis under the presence of the data covariated and randomly censored /." Presidente Prudente, 2020. http://hdl.handle.net/11449/192924.

Full text

Abstract:

Orientador: Fernando Antonio Moala
Abstract: This work presents a study of probabilistic modeling, with applications to survival analysis, based on a probabilistic model called Exponential Geometric (EG), which o ers great exibility for the statistical estimation of its parameters based on samples of life time data complete and censored. In this study, the concepts of estimators and lifetime data are explored under random censorship in two cases of extensions of the EG model: the Extended Geometric Exponential (EEG) and the Generalized Extreme Geometric Exponential (GE2). The work still considers, exclusively for the EEG model, the approach of the presence of covariates indexed in the rate parameter as a second source of variation to add even more exibility to the model, as well as, exclusively for the GE2 model, a analysis of the convergence, hitherto ignored, it is proposed for its moments. The statistical inference approach is performed for these extensions in order to expose (in the classical context) their maximum likelihood estimators and asymptotic con dence intervals, and (in the bayesian context) their a priori and a posteriori distributions, both cases to estimate their parameters under random censorship, and covariates in the case of EEG. In this work, bayesian estimators are developed with the assumptions that the prioris are vague, follow a Gamma distribution and are independent between the unknown parameters. The results of this work are regarded from a detailed study of statistical simulation applied to... (Complete abstract click electronic access below)
Resumo: Este trabalho apresenta um estudo de modelagem probabilística, com aplicações à análise de sobrevivência, fundamentado em um modelo probabilístico denominado Exponencial Geométrico (EG), que oferece uma grande exibilidade para a estimação estatística de seus parâmetros com base em amostras de dados de tempo de vida completos e censurados. Neste estudo são explorados os conceitos de estimadores e dados de tempo de vida sob censuras aleatórias em dois casos de extensões do modelo EG: o Exponencial Geom étrico Estendido (EEG) e o Exponencial Geométrico Extremo Generalizado (GE2). O trabalho ainda considera, exclusivamente para o modelo EEG, a abordagem de presença de covariáveis indexadas no parâmetro de taxa como uma segunda fonte de variação para acrescentar ainda mais exibilidade para o modelo, bem como, exclusivamente para o modelo GE2, uma análise de convergência até então ignorada, é proposta para seus momentos. A abordagem da inferência estatística é realizada para essas extensões no intuito de expor (no contexto clássico) seus estimadores de máxima verossimilhança e intervalos de con ança assintóticos, e (no contexto bayesiano) suas distribuições à priori e posteriori, ambos os casos para estimar seus parâmetros sob as censuras aleatórias, e covariáveis no caso do EEG. Neste trabalho os estimadores bayesianos são desenvolvidos com os pressupostos de que as prioris são vagas, seguem uma distribuição Gama e são independentes entre os parâmetros desconhecidos. Os resultad... (Resumo completo, clicar acesso eletrônico abaixo)
Mestre

APA, Harvard, Vancouver, ISO, and other styles

36

Faria, Rodrigo. "Intervalos de confiança para dados com presença de eventos recorrentes e censuras." Universidade Federal de São Carlos, 2003. https://repositorio.ufscar.br/handle/ufscar/4576.

Full text

Abstract:

Made available in DSpace on 2016-06-02T20:06:09Z (GMT). No. of bitstreams: 1 DissRF.pdf: 61430 bytes, checksum: 98abe5764051c2697adcbd0c9cfcd965 (MD5) Previous issue date: 2003-05-23
In survival analysis and reliability is common that the population units in study presents recurrence events and censoring ages, besides, is possible to exist a cost related to each event that happens. The objectives of this dissertation consists in display a methodology that makes possible the direct obtaining of confidence intervals baseds in asymptotic theory for nonparametric estimates to the mean cumulative number or cost events per unit. Some simulation studies are also showed and the objectives are check if there is some sample size's influence in the asymptotics confidence interval's precision. One of the great advantages from the methodology presented in this dissertation is the validity for it’s application in several areas of the knowledge. There's two examples considered here. One of them consists in coming data from engineering. This example contains a ‡eet of machines in analysis. The interest is to obtain punctual estimates with the respective confidence intervals for the mean cumulative number and cost repairs per machine. The other example comes from the medical area and it treats of a study accomplished with two groups of patients with bladder can- cer, each one submitted in a di¤erent treatment type. The application of the methodology in this example seeks the obtaining of confidence intervals for the mean cumulative number of tumors per patient and gain estimates that compare these two di¤erents treatments informing, statistically, which presents better results.
Em análise de sobrevivência e confiabilidade, é comum que as unidades populacionais em estudo apresentem eventos recorrentes e presença de censuras, sendo possível a atribuição de um custo relacionado a cada evento que ocorra. Os objetivos deste trabalho consistem na apresentação de uma metodologia que possibilita a obtenção direta de estimativas intervalares não-paramétricas, baseadas na teoria assintótica, para o número ou custo médio de eventos acumulados por unidade. São também realizados alguns estudos de simulação que verificam a influência do tamanho da amostra na precisão dos intervalos de confiança assintóticos obtidos. Uma das grandes vantagens da metodologia estudada, e apresentada neste trabalho, é a possibilidade de sua aplicação em diversas áreas do conhecimento. Dois exemplos são considerados. Um deles consiste em dados provenientes da área de engenharia, no qual um conjunto de motores é analisado. Neste, o interesse é obter estimativas pontuais com os respectivos intervalos de confiança para o número e custo médio de reparos acumulados por motor. O outro exemplo provém da área médica e trata de um estudo realizado com dois grupos de pacientes com câncer de bexiga, cada qual submetido a um diferente tipo de tratamento. A aplicação da metodologia neste exemplo visa, além da obtenção de intervalos de confiança para o número médio de tumores acumulados por paciente, também obter estimativas que levem à comparação dos dois tratamentos, no sentido de informar estatisticamente qual deles apresenta melhores resultados.

APA, Harvard, Vancouver, ISO, and other styles

37

Gonçalves, José Henrique Dias. "Estimação de Modelos de sobrevivência para tempos entre a prestação e a cobrança de serviços de regulação." Master's thesis, Instituto Superior de Economia e Gestão, 2010. http://hdl.handle.net/10400.5/2149.

Full text

Abstract:

Mestrado em Decisão Económica e Empresarial
No presente estudo, foram aplicados vários modelos para estimar a função de sobrevivência relativa aos tempos decorridos entre a prestação de um serviço e a sua cobrança. O estudo envolveu dados experimentais, obtidos através da base de dados dos Órgãos de Comunicação Social notificados para pagar a Taxa de Regulação e Supervisão à Entidade Reguladora para a Comunicação Social. Antes de proceder à estimação dos modelos propostos, foi introduzida uma análise detalhada dos dados, baseada em estatísticas descritivas e cruzamentos de variáveis. Ao nível da estimação, considerou-se os seguintes modelos: 1) Kaplan-Meier; 2) Modelo de Cox com hazard proporcional; 3) Exponencial; 4) Weibull; 5) Log-Logístico. Numa última fase, foi feita uma análise de resíduos utilizando a metodologia de Cox-Snell. Os resultados permitem concluir que as variáveis Valor a pagar e Ano têm um contributo importante na explicação do tempo entre a prestação de um serviço de regulação e a sua cobrança.

APA, Harvard, Vancouver, ISO, and other styles

38

Vigas, Valdemiro Piedade. "Extensões dos modelos de sobrevivência referente a distribuição Weibull." Universidade Federal de São Carlos, 2014. https://repositorio.ufscar.br/handle/ufscar/4579.

Full text

Abstract:

Made available in DSpace on 2016-06-02T20:06:09Z (GMT). No. of bitstreams: 1 5822.pdf: 1106242 bytes, checksum: 613a82d7af4c6f40b60637e4c7122121 (MD5) Previous issue date: 2014-03-07
Financiadora de Estudos e Projetos
In this dissertation, two models of probability distributions for the lifetimes until the occurrence of the event produced by a specific cause for elements in a population are reviewed. The first revised model is called the Weibull-Poisson (WP) which has been proposed by Louzada et al. (2011a). This model generalizes the exponential-Poisson distributions proposed by Kus (2007) and Weibull. The second, called long-term model, has been proposed by several authors and it considers that the population is not homogeneous in relation to the risk of event occurence by the cause studied. The population has a sub-population that consists of elements who are not liable do die by the specific cause in study. These elements are considered as immune or cured. In relation to the elements who are at risk the minimum value of time of the event accurance is observed. In the review of WP the expressions of the survival function, quantile function, probability density function, and of the hazard function, as well the expression of the non-central moments of order k and the distribution of order statistics are detailed. From this review we propose, in an original way, studies of the simulation to analyze the paramenters of frequentist properties of maximum likelihood estimators for this distribution. And also we also present results related to the inference about the parameters of this distribution, both in the case in which the data set consists of complete observations of lifetimes, and also in the case in which it may contain censored observations. Furthermore, we present in this paper, in an original way a regression model in a form of location and scale when T has WP distribution. Another original contribution of this dissertation is to propose the distribution of long-term Weibull-Poisson (LWP). Besides studying the LWP in the situation in which the covariates are included in the analysis. We also described the functions that characterize this distribution (distribution function, quantile function, probability density function and the hazard function). Moreover we describe the expression of the moment of order k, and the density function of a statistical order. A study by simulation viii of this distribution is made through maximum likelihood estimators. Applications to real data set illustrate the applicability of the two considered models.
Nesta dissertação são revistos dois modelos de distribuições de probabilidade para os tempos de vida até a ocorrência do evento provocado por uma causa específica para elementos em uma população. O primeiro modelo revisto é o denominado Weibull-Poisson (WP) que foi proposto por Louzada et al. (2011a), esse modelo generaliza as distribuições exponencial Poisson proposta por Kus (2007) e Weibull. O segundo, denominado modelo de longa duração, foi proposto por vários autores e considera que a população não é homogênea em relação ao risco de ocorrência do evento pela causa em estudo. A população possui uma sub-população constituída de elementos que não estão sujeitos ao evento pela causa especifica em estudo, sendo considerados como imunes ou curados. Em relação à parcela dos elementos que estão em risco observa-se o valor mínimo dos tempos da ocorrência do evento. Na revisão sobre a WP são detalhadas as expressões da função de sobrevivência, da função quantil, da função densidade de probabilidade e da função de risco, bem como a expressão dos momentos não centrais de ordem k e a distribuição de estatísticas de ordem. A partir desta revisão, é proposta de forma original, estudos de simulação com o objetivo de analisar as propriedades frequentistas dos estimadores de máxima verossimilhança dos parâmetros desta distribuição. E apresenta-se resultados relativos à inferência sobre os parâmetros desta distribuição, tanto no caso em que o conjunto de dados consta de observações completas de tempos de vida, como no caso em que ele possa conter observações censuradas. Alem disso, apresentamos de forma original neste trabalho um modelo de regressão na forma de locação e escala quando T tem distribuição WP. Outra contribuição original dessa dissertação é propor a distribuição de longa duração Weibull-Poisson (LWP), alem de estudar a LWP na situação em que as covariáveis são incluídas na análise. Realizou-se também a descrição das funções que caracterizam essa distribuição (função distribuição, função quantil, função densidade de probabilidade e função de risco). Assim como a descrição da expressão do momento de ordem k e da função densidade da estatística de ordem. É feito um estudo por simulação desta distribuição via máxima verossimilhança. Aplicações à conjuntos de dados reais ilustram a utilidade dos dois modelos considerados.

APA, Harvard, Vancouver, ISO, and other styles

39

Dias, Teresa Cristina Martins. "TESTES ACELERADOS ASSUMINDO UM MODELO DE LEI DE POTÊNCIA INVERSA E DADOS COM CENSURAS DO TIPO II." Universidade de São Paulo, 1992. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21092018-143402/.

Full text

Abstract:

Nesta dissertação de mestrado, alguns resultados sobre análise estatística de testes de sobrevivência acelerados são apresentados. Em particular, um modelo de teste de vida acelerado, Modelo de Lei de Potência Inversa, é considerado assumindo uma distribuição Exponencial para os tempos de sobrevivência dos componentes, com censuras do Tipo II. Análises clássica e Bayesiana são apresentadas para fazer inferências a respeito dos parâmetros de interesse. Na análise clássica, estimadores pontuais e intervalos de confiança são encontrados usando métodos assintáticos. Na análise Bayesiana, partindo de uma priori de Jeffreys, densidades a posteriori marginais para os parâmetros de interesse e intervalos de credibilidade são determinados, utilizando o Método de Laplace para aproximações de integrais. Uma análise Bayesiana é desenvolvida também, quando os tempos de falha seguem uma distribuição de Weibull. Também são apresentados, alguns métodos de Planejamento de Experimentos e uma aplicação de densidades preditivas em Controle de Qualidade. Os métodos propostos são ilustrados através de dois exemplos.
In this dissertation, we present some results on the statistical analysis of accelerated life tests. In particular, we consider the Inverse Power Model, assuming an Exponential distribution for the lifetimes of the components with censored data under a type II censoring mechanism. Classical and bayesian analysis are presented to get inferences about the parameters of interest. In the classical analysis, point estimates and confidence intervals are obtained using asymptotics methods. In the Bayesian analysis, assuming a noninformative Jeffreys prior density, marginal posterior densities for the parameters of interest and credible intervals are obtained using the Laplace\'s method for the approximation of integrals. Bayesian analysis is also considered when the failure times follow a Weibull distribution. Some methods for design of experiments are developed an applications of predictives densities in Quality Control is presented. The proposed methods are illustrated with two numerical examples.

APA, Harvard, Vancouver, ISO, and other styles

40

Icuma, Tatiana Reis. "Uso de métodos bayesianos na análise de dados de sobrevida para pacientes com câncer na mama na presença de censuras, fração de cura e covariáveis." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/17/17139/tde-29082016-142353/.

Full text

Abstract:

Introdução: A maior causa de mortes no mundo é devido ao câncer, cerca de 8,2 milhões em 2012 (World Cancer Report, 2014). O câncer de mama é a forma mais comum de câncer entre as mulheres e a segunda neoplasia mais frequente, seguida do câncer de pele não melanoma, representando cerca de 25% de todos os tipos de cânceres diagnosticados. Modelos estatísticos de análise sobrevivência podem ser úteis para a identificação e compreensão de fatores de risco, fatores de prognóstico, bem como na comparação de tratamentos. Métodos: Modelos estatísticos de análise de sobrevivência foram utilizados para evidenciar fatores que afetam os tempos de sobrevida livre da doença e total de um estudo retrospectivo realizado no Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo, Ribeirão Preto, referente a 54 pacientes com câncer de mama localmente avançado com superexpressão do Her-2 que iniciaram a quimioterapia neoadjuvante associada com o medicamento Herceptin® (Trastuzumabe) no período de 2008 a 2012. Utilizaram-se modelos univariados com distribuição Weibull sem e com a presença de fração de cura sob o enfoque frequentista e bayesiano. Utilizou-se modelos assumindo uma estrutura de dependência entre os tempos observados baseados na distribuição exponencial bivariada de Block Basu, na distribuição geométrica bivariada de Arnold e na distribuição geométrica bivariada de Basu-Dhar. Resultados: Resultados da análise univariada sem a presença de covariáveis, o modelo mais adequado às características dos dados foi o modelo Weibull com a presença de fração de cura sob o enfoque bayesiano. Ao incorporar nos modelos as covariáveis, observou-se melhor ajuste dos modelos com fração de cura, que evidenciaram o estágio da doença como um fator que afeta a sobrevida livre da doença e total. Resultados da análise bivariada sem a presença de covariáveis estimam médias de tempo de sobrevida livre da doença para os modelos Block e Basu, Arnold e Basu-Dhar de 108, 140 e 111 meses, respectivamente e de 232, 343, 296 meses para o tempo de sobrevida total. Ao incorporar as covariáveis, os modelos evidenciam que o estágio da doença afeta a sobrevida livre da doença e total. No modelo de Arnold a covariável tipo de cirurgia também se mostrou significativa. Conclusões: Os resultados do presente estudo apresentam alternativas para a análise de sobrevivência com tempos de sobrevida na presença de fração de cura, censuras e várias covariaveis. O modelo de riscos proporcionais de Cox nem sempre se adequa às características do banco de dados estudado, sendo necessária a busca de modelos estatísticos mais adequados que produzam inferências consistentes.
Introduction: The leading worldwide cause of deaths is due to cancer, about 8.2 million in 2012 (World Cancer Report, 2014). Breast cancer is the most common form of cancer among women and the second most common cancer, followed by non-melanoma skin cancer, accounting for about 25% of all diagnosed types of cancers. Statistical analysis of survival models may be useful for the identification and understanding of risk factors, prognostic factors, and the comparison treatments. Methods: Statistical lifetimes models were used to highlight the important factors affecting the disease-free times and the total lifetime about a retrospective study conducted at the Hospital das Clinicas, Faculty of Medicine, University of São Paulo, Ribeirão Preto, referring to 54 patients with locally advanced breast cancer with Her-2 overexpression who started neoadjuvant chemotherapy associated with the drug Herceptin® (Trastuzumab) in the time period ranging from years 2008 to 2012. It was used univariate models assuming Weibull distribution with and without the presence of cure fraction under the frequentist and Bayesian approaches. It was also assumed models assuming a dependence structure between the observed times based on the bivariate Block-Basu exponential distribution, on the bivariate Arnold geometric distribution and on the bivariate Basu-Dhar geometric distribution. Results: From the results of the univariate analysis without the presence of covariates, the most appropriate model for the data was the Weibull model in presence of cure rate under a Bayesian approach. By incorporating the covariates in the models, there was best fit of models with cure fraction, which showed that the stage of the disease was a factor affecting disease-free survival and overall survival. From the bivariate analysis results without the presence of covariates, the estimated means for free survival time of the disease assuming the Block- Basu, Arnold and Basu-Dhar models were respectively given by 108, 140 and 111; for the overall survival times the means were given respectively by, 232, 343, 296 months. In presence of covariates, the models showed that the stage of the disease affects the disease-free survivals and the overall survival times. Assuming the Arnold model, the covariate type of surgery also was significant. Conclusions: The results of this study present alternatives for the analysis of survival times in the presence of cure fraction, censoring and covariates. The Cox proportional hazards model not always is apropriate to the database characteristics studied, which requires the search for more suitable statistical models that produce consistent inferences.

APA, Harvard, Vancouver, ISO, and other styles

41

Bhering, Felipe Lunardi. "Confiabilidade em sistemas coerentes: um modelo bayesiano Weibull." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-01122013-155316/.

Full text

Abstract:

O principal objetivo desse trabalho é introduzir um modelo geral bayesiano Weibull hierárquico para dados censurados que estima a função de confiabilidade de cada componente para sistemas de confiabilidade coerentes. São introduzidos formas de estimação mais sólidas, sem a inserção de estimativas médias nas funções de confiabilidade (estimador plug-in). Através desse modelo, são expostos e solucionados exemplos na área de confiabilidade como sistemas em série, sistemas em paralelo, sistemas k-de-n, sistemas bridge e um estudo clínico com dados censurados intervalares. As soluções consideram que as componentes tem diferentes distribuições, e nesse caso, o sistema bridge ainda não havia solução na literatura. O modelo construído é geral e pode ser utilizado para qualquer sistema coerente e não apenas para dados da área de confiabilidade, como também na área de sobrevivência, dentre outros. Diversas simulações com componentes com diferentes proporções de censura, distintas médias, três tipos de distribuições e tamanhos de amostra foram feitas em todos os sistemas para avaliar a eficácia do modelo.
The main purpose of this work is to introduce a general bayesian Weibull hierarchical model for censored data which estimates each reliability components function from coherent systems. Its introduced estimation procedures which do not consider plug-in estimators. Also, its exposed and solved with this model examples in reliability area such as series systems, parallel systems, k-out-of-n systems, bridge systems and a clinical study with interval censoring data. The problem of bridge system hadnt a solution before for the case of each component with different distribution. Actually, this model is general and can be used to analyse any kind of coherent system and censored data, not only reliability ones, but also survival data and others. Several components simulations with different censored proportions, distinct means, three kinds of distributions and sample size were made in all systems to evaluate model efficiency.

APA, Harvard, Vancouver, ISO, and other styles

42

Marcelino, Joana Lopes. "Survival analysis as a tool to model Little Bustard mortality rates in the Iberian Peninsula." Master's thesis, 2014. http://hdl.handle.net/10451/18002.

Full text

Abstract:

Tese de mestrado, Bioinformática e Biologia Computacional (Biologia computacional), Universidade de Lisboa, Faculdade de Ciências, 2014
O modelo de Cox proportional hazards é um modelo de sobrevivência semi-paramétrico utilizado em análise de regressão para dados censurados. O modelo original tem sofrido alterações, com a inclusão de novas extensões que permitem maior flexibilidade e a análise de um conjunto mais alargado de dados. Entre as recentes extensões, incluem-se: a análise de variáveis dependentes do tempo, múltiplas observações de eventos, tied events e estratificação de variáveis dependentes do tempo. A sobrevivência é um fator determinante na ecologia de populações e na biologia da conservação. Este tipo de estudos só é possível com recurso a técnicas de telemetria, que tornam possível a aquisição de informação contínua. Existem vários problemas associados a este tipo de análise quando aplicada a animais em estado selvagem, muitas vezes ignorados pelos investigadores. Os mais típicos consistem na influência que o equipamento de seguimento tem no animal e no stress induzido pela marcação. Estes e outros problemas tornam a análise de sobrevivência de animais selvagens um desafio. O sisão (Tetrax tetrax) é uma ave ameaçada na Península Ibérica classificada como Vulnerável (Cabral et al., 2005; Madroño et al., 2004) em Portugal e catalogada como Near Threatened pela International Union for Conservation of Nature (IUCN) a nível global (Collar et al., 1994). Tem estado em declínio acentuado na Europa, especialmente em Itália, França e Espanha, apresentando uma tendência desconhecida em Portugal. Trata-se de uma ave estepária adaptada a meios agrícolas abertos extensivos e a pastagens. Entre os principais fatores de ameaça à espécie, destacam-se: a perda e fragmentação do habitat devido à intensificação agrícola nos solos mais produtivos, o abandono agrícola nos solos menos produtivos, a construção de infraestruturas (linhas elétricas, vedações, estradas) e as alterações climáticas. Neste contexto, a identificação e análise da forma como diferentes fatores influenciam a mortalidade do sisão e a distinção entre as diferentes causas de mortalidade constitui um contributo relevante para o desenvolvimento e aplicação de medidas que promovam a conservação desta espécie. Com este trabalho pretendeu-se aplicar a análise de sobrevivência – normalmente utilizada em estudos de medicina, engenharia, economia e sociologia – a um estudo ecológico, usando software estatístico comum, geralmente utilizado por investigadores desta área. Neste trabalho foi utilizada uma amostra de 143 indivíduos capturados e seguidos na Península Ibérica, com o objectivo de: (1) identificar as principais causas de mortalidade natural e antropogénica e quantificar a sua importância relativa; (2) modelar o efeito de quatro variáveis: sexo, uso do solo, época e região bioclimática na sobrevivência do sisão, usando o estimador de Kaplan-Meier e o Modelo Extended Cox Proportional Hazards Model for Time-Dependent Variables. A mortalidade antropogénica teve uma prevalência maior do que seria expectável para uma espécie protegida. Cerca de 17% da população ibérica morre anualmente devido a causas humanas, uma maior percentagem que a morte anual por causas naturais (15%). Estes valores de mortalidade antropogénica, associados a uma fraca produtividade do sisão, mais nítida em áreas com pior estado de conservação de habitat, levam à falta de sustentabilidade da espécie, pondo em risco a sobrevivência de uma ave com estatuto de Quase Ameaçada. A colisão com linhas elétricas foi, até hoje, a causa de mortalidade antropogénica com maior destaque. Com este estudo, concluímos que cerca de 4% da população da Península Ibérica morre anualmente por colisão com linhas elétricas e cerca de 1% por atropelamento. Para a população de Portugal, tinha sido estimada anteriormente uma mortalidade anual de 1,5% por linhas elétricas (Silva et al., 2010b). No entanto, a causa de morte antropogénica com maior prevalência foi a caça, com cerca de 12% da população a morrer anualmente por esta causa. Não foram evidenciadas diferenças entre a proporção de mortes dentro e fora da época de caça, sugerindo que esta variável não influencia a proporção de mortalidade por cada uma das causas. Não foi encontrada uma relação entre o sexo e a morte dentro ou fora da época venatória. Dentro da morte por causas naturais, foi apenas identificada a morte por predação. Mamíferos e rapinas tendem a predar o sisão aproximadamente na mesma proporção, ainda que tenham sido identificados 5% de casos em que o predador não foi identificado. Aplicámos com sucesso o modelo de Cox a um objeto de estudo ecológico, conseguindo eliminar o máximo de bias associado e identificar os principais fatores que influenciam a sobrevivência do sisão. A região bioclimática revelou-se o fator com maior influência na mortalidade da espécie. Regiões mais secas e quentes tendem a ter um maior risco de mortalidade, provavelmente devido à escassez de vegetação e insetos em épocas de seca, desencadeando uma menor disponibilidade de alimento. Concluímos que fêmeas de sisão têm um maior risco de mortalidade que os machos. Estas são as únicas responsáveis pelos cuidados parentais, despendendo energia tanto na postura como na alimentação das crias. Este é, portanto, um período de grande vulnerabilidade para as fêmeas, que se pode estender após a época de reprodução, e que pode afetar o seu fitness de inverno. Uma vez que a intensificação agrícola é o fator mais associado à ameaça da espécie, seria expectável observar um impacto negativo deste uso do solo na mortalidade do sisão. Contudo, tal não se verificou, tendo este factor apresentado pouca influência em comparação com a região bioclimática e o sexo. Sobretudo durante os anos de seca, o sisão está mais dependente de culturas intensivas (com maior disponibilidade de alimento) durante a época de pós-reprodução e inverno, havendo registos de movimento dos mesmos de áreas extensivas para áreas intensivas durante estas épocas do ano. Assim, admite-se a existência de uma relação entre o uso do solo e a época, que influencie o comportamento destas variáveis. A época foi a variável com menor impacto na mortalidade do sisão. O nosso trabalho demonstra quão mal compreendidas e desconhecidas eram algumas ameaças à população do sisão na Península Ibérica. Uma redução da mortalidade antropogénica terá um grande impacto na viabilidade desta espécie, particularmente em zonas com menor produtividade da mesma. Alterações na legislação das épocas venatórias e medidas de sensibilização poderiam reduzir o problema de caça associado, sendo um fator que afeta anualmente quase 12% da população. A adaptação da rede elétrica em termos de localização e design de linhas também deve ser considerada prioritária. A análise de sobrevivência usando o modelo de Cox foi aplicada com sucesso a um caso de estudo ecológico, e revelou ser capaz de acomodar os problemas associados ao seguimento de animais selvagens. Foi igualmente aplicada com sucesso a análise de causas específicas de mortalidade para esta espécie, utilizando o estimador de Heisey e Fuller, o que possibilitou o cálculo das taxas de mortalidade anuais para causas de morte de origem natural e antropogénica. Devem ser tomadas medidas para orientar o trabalho de campo especificamente para este tipo de análise, principalmente no que diz respeito à obtenção de uma data de mortalidade mais precisa. Um maior esforço de identificação de carcaças, juntamente com o uso de emissores que permitam medir parâmetros fisiológicos para determinar o estado do indivíduo, seriam soluções que contribuiriam para atenuar este problema. Neste trabalho conseguimos testar a influência do peso dos emissores e do tipo de tecnologia de seguimento na sobrevivência do sisão e verificámos que emissores com peso abaixo de 6,76% do peso corporal não tiveram influência significativa na sobrevivência. O uso de diferentes tecnologias de seguimento também não teve influência ao nível da mortalidade.
The Cox proportional hazards model has become the most widely used method for regression analysis for censored data and is frequently used to model survival data. The introduction of new extensions to the original model like time-dependent covariates, multiple observations, multiple time-scales, tied events and time-dependent strata improved it and made it more widely applicable. Survival estimation is an important aspect of population ecology and conservation biology, with telemetry making possible the acquisition of continuous survival information. There are often problems associated with this type of analysis in ecological studies of free-ranging animals, that are frequently disregarded by researchers, such as the influences of the transmitter's weight, induced stress in handling the species, or interval-censored death dates, which make survival studies on free ranging animals a challenge. In this study, we aim to apply survival analysis - frequently used in medicine, engineering, economics and sociology - to an ecological study, using a standard statistical software, widely used by researchers of this area. We have successfully applied this approach to a case study and managed to address potential bias sources and identify the main factors that influence Little Bustard's (Tetrax tetrax) survival. Furthermore, we have also computed cause-specific mortality rates for this species, using the Heisey and Fuller estimator.

APA, Harvard, Vancouver, ISO, and other styles

43

"Intervalos de confiança para dados com presença de eventos recorrentes e censuras." Tese, Biblioteca Digital de Teses e Dissertações da Universidade Federal de São Carlos, 2003. http://www.bdtd.ufscar.br/tde_busca/arquivo.php?codArquivo=654.

Full text

APA, Harvard, Vancouver, ISO, and other styles

We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!