Dissertations / Theses on the topic 'Estatística descritiva e multivariada'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Estatística descritiva e multivariada.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Seibel, Tiago Luis Cesa. "Análise do grau de alinhamento das estratégias de tecnologia da informação e de negócios em uma cooperativa do agronegócio." reponame:Repositório Institucional da UNIJUI, 2012. http://bibliodigital.unijui.edu.br:8080/xmlui/handle/123456789/1926.
Full text177 f.
Chioveto, Marinês Orlandi Taveira. "Desenvolvimento rural no Mato Grosso e seus biomas." Universidade Estadual do Oeste do Parana, 2014. http://tede.unioeste.br:8080/tede/handle/tede/2166.
Full textThis study aimed to analyze the profile of the rural development occurred in the Mato Grosso, in the biomes of the Cerrado, Pantanal and Amazon in the first decade of 2000. Based on the case study, this research descriptive and deductive, presents as method the experimental-explanatory model, of quality quantitative character. In this study, first, it used descriptive statistics to expose the data by means of figures, tables, graphs and maps in order to analyze the social, environmental and economic aspects of the municipalities in the biomes of Cerrado, Amazon and Pantanal of the Mato Grosso. After, it used multivariate statistical with factorial analysis by Principal Component Analysis (PCA) and its use has confirmatory character, to support the qualitative research analysis. With acquisition of the factors by the PCA, it calculated the Gross Index and from this identified the Rural Development Index (RDI) for Mato Grosso and its biomes, classifying municipalities into five stages of development: very high, high, medium, low and very low. The results revealed that the process of rural development occurred differently and not homogeneous in the territories, however, prevailed RDIs in the lower grades. The Cerrado Matogrossense presented municipalities with better rural development in concentration of the islands by the State and the municipalities of the Amazon biome were identified most with the lowest rating of RDI (Low and Very Low). Became evident that the degrees of development rural of municipalities are strongly induced by the economic aspects of the territory, which interferes in the social aspects of the space. Regions with strong presence of farming activities in exportable monocultures such as soy, corn and sugarcane showed better living conditions for the rural population, even though this is lower in rural areas; however this level of development is highlighted also by the existence of agribusiness in the region. Environmental issues showed a strong impact on rural development, also influencing the quality of life of people of Mato Grosso.
Esta pesquisa objetivou analisar o perfil do desenvolvimento rural no Mato Grosso e dos municípios dos biomas Cerrado, Amazônia e Pantanal. A pesquisa, de cunho descritivo, dedutivo, apresenta como método o modelo experimental-explicativo, de caráter qualiquantitativo, a partir de dados da primeira década de 2000. Neste estudo, utilizou-se, primeiramente, a estatística descritiva para expor os dados por meio de figuras, tabelas, gráficos e mapas, a fim de analisar os aspectos sociais, ambientais e econômicos dos municípios nos biomas Cerrado, Amazônia e Pantanal de Mato Grosso. Após, utilizou-se a estatística multivariada pela análise fatorial por meio da Análise dos Componentes Principais (ACP) sendo sua utilização de caráter confirmatória, respaldando a análise qualitativa da pesquisa. Com a obtenção dos fatores pela ACP, calculou-se o Índice Bruto e a partir deste identificou o Índice de Desenvolvimento Rural (IDR) no Mato Grosso, classificando os municípios em cinco graus de desenvolvimento: muito alto, alto, médio, baixo e muito baixo. Os resultados revelaram que o processo de desenvolvimento rural ocorreu de forma diferenciada e não homogênea nos territórios, contudo, prevaleceu os IDRs em graus mais baixos. Enquanto o Cerrado matogrossense apresentou municípios com melhor desenvolvimento rural em ilhas de concentração pelo Estado, os municípios do bioma Amazônia foram identificados em maior número de municípios com menor classificação de IDR (Baixo e Muito Baixo). Evidenciaram-se que os graus de desenvolvimento rural dos municípios são fortemente induzidos pelos aspectos econômicos do território, o qual interfere nos aspectos sociais do espaço. Regiões com forte atuação de atividades de lavoura em monoculturas exportáveis, como soja, milho e cana de açúcar apresentaram condições de vida para a população rural, mesmo está sendo baixa na área rural, porém esse grau de desenvolvimento se destacou também pela existência de agroindústria na região. As questões ambientais apresentaram forte impacto no desenvolvimento rural, com influência também na qualidade de vida da população de Mato Grosso.
Cherinda, Nilsa Adelaide Issufo Enoque Pondja. "O ensino e aprendizagem online da estatística descritiva." Doctoral thesis, Universidade de Aveiro, 2012. http://hdl.handle.net/10773/9953.
Full textTendo em conta que a Universidade Eduardo Mondlane é a primeira instituição, em Moçambique, a oferecer cursos completamente baseados na Web, o presente estudo constitui uma das primeiras investigações com a qual se pretende perceber qual o impacto de um módulo assente na compreensão de conceitos e na resolução de tarefas, fortemente apoiadas por uma Folha de Cálculo, estruturado numa lógica de webquest e lecionado a distância, rentabilizando-se potencialidades da plataforma virtual Aulanet, no desenvolvimento de competências tecnológicas e de conhecimentos, capacidades e atitudes relacionados com a Estatística descritiva. Para dar resposta às questões de investigação formuladas, optou-se por uma abordagem qualitativa e por uma estratégia de estudo de caso que se desenvolveu num contexto próximo da lógica da investigação - ação. Os principais participantes foram alunos do Curso de Licenciatura em Gestão de Negócios da UEM em Moçambique, a frequentar a disciplina de Estatística Aplicada. Para a recolha de dados, privilegiaram-se as técnicas da inquirição, análise documental e observação direta e participante, e diversos instrumentos como questionários e entrevistas, produções dos alunos, intervenções no fórum de debate, no Chat, testes e trabalhos, diário de bordo e notas de campo, com vista à triangulação metódica. A análise estatística e de conteúdo dos dados recolhidos permite constatar que a aprendizagem, à distância, de Estatística Descritiva, explorando-se meios tecnológicos de informação e de comunicação online e folha de cálculo Excel, inscritos numa estratégia de webquest ,potencia o desenvolvimento de competências tecnológicas e de conhecimentos, capacidades e atitudes relacionados com o tema. Paralelamente, permitiu refletir sobre as condições de ensino e de aprendizagem que podem favorecer tais práticas.
Given that the Eduardo Mondlane University is the first institution in Mozambique to offer completely Web-based courses, this study is one of the first investigations which aims to understand the impact of a module based on understanding of concepts and solving tasks, strongly supported by Spreadsheet, a structured logic webquest and taught at a distance, maximizing the potential of the virtual platform Aulanet in the development of technological skills and knowledge, capabilities and attitudes related to descriptive statistics. To respond to research questions raised, we chose a qualitative approach and a case study strategy developed in a context around the logic of action inquiry. The main participants were students of the Bachelor of Business Management of EMU in Mozambique, attending the discipline of Applied Statistics. For data collection, were favored the techniques of inquiry, document analysis, direct and participant observation, and various instruments such as questionnaires and interviews, students' productions, interventions in the discussion forum, Chat, work and tests, the logbook and field notes, with a view to methodical triangulation. Statistical analysis and content analysis of the data collected demonstrates that learning, at distance, of Descriptive Statistics, exploring technological means of information and communication online and Excel spreadsheet, entered on a webquest strategy, encourages the development of technological skills and knowledge, capabilities and attitudes related to the topic. In parallel, it allowed to reflect on the conditions of teaching and learning that can promote such practices.
Rodrigues, Vivienne do Val. "Ensinando estatística descritiva : um projeto para o ensino médio /." Bauru, 2019. http://hdl.handle.net/11449/181908.
Full textBanca: Prescila Glaucia Christianinni Buzolin
Banca: Wladimir Seixas
Resumo: É fato que alunos, de uma maneira geral, não são motivados a analisar tabelas e gráficos nas resoluções de exercícios durante as aulas. Assim informações e entendimento de situações exploradas nestas formas, são analisadas de maneira superficial, ocultando a real necesidade pelo qual foram criados. Este trabalho tem o objetivo de apresentar ao aluno como as tabelas e gráficos são gerados, utilizando para isso a Estatística Descritiva através da coleta e tratamento dos dados, análise de tabelas e gráficos. Para isso foi desenvolvido o trabalho prático com os alunos do 1º ano A do Ensino Médio, tendo a intensão de torná-los mais próximos destes conteúdos, incentivando-os a se empenharem mais nas análises de tabelas e gráficos no seu dia a dia. No decorrer deste período os alunos realizaram a pesquisa, analisaram os dados, criaram as tabelas e gráficos e após todo esse desenvolvimento o resultado foi exposto na escola para que os alunos da comunidade escolar tivessem uma resposta do questionário que foi respondido por cada um deles. Com este trabalho pôde-se perceber que os alunos conseguiram realizar as atividades, assimilando como as fases devem ser executadas para que se consiga atingir o objetivo esperado no final de todo o trabalho. O resultado do trabalho foi encaminhado à coordenação da escola onde alguns pontos relevantes foram analisados e esta pôde informar como a escola está ou irá trabalhar em relação as mudanças necessárias de acordo com a situação colocada pelos...
Abstract: It is a fact that students, in general, are not motivated to analyze tables and graphs in the resolutions of exercises during the classes. Thus information and understanding of situations explored in these forms are analyzed in a superficial way, hiding the real necessity for which they were created. This work aims to present to the student how the tables and graphs are generated, using Descriptive Statistics through the collection and treatment of data, analysis of tables and graphs. For this, the practical work was developed with the students of the 1st year A of the High School, with the intention of making them closer to these contents, encouraging them to engage more in the analysis of tables and graphs in their day to day. During this period the students performed the research, analyzed the data, created the tables and graphs and after all this development the result was exposed in the school so that the students of the school community had a response of the questionnaire that was answered by each of them. With this work it was realized that the students were able to carry out the activities, assimilating how the phases must be executed in order to achieve the expected objective at the end of all the work. The result of the work was sent to the coordination of the school where some relevant points were analyzed and it could inform how the school is or will work in relation to the necessary changes according to the situation placed by the students when answering the ...
Mestre
Rios, Evandro de Moura. "Estatística descritiva, probabilidade e estimação: noções para o ensino básico." Universidade Federal de Goiás, 2014. http://repositorio.bc.ufg.br/tede/handle/tede/4365.
Full textApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-03-27T10:41:05Z (GMT) No. of bitstreams: 2 Dissertação - Evandro de Moura Rios - 2014.pdf: 4832237 bytes, checksum: e90ddc9df15563d7f0235b4ced6a6bd7 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Made available in DSpace on 2015-03-27T10:41:05Z (GMT). No. of bitstreams: 2 Dissertação - Evandro de Moura Rios - 2014.pdf: 4832237 bytes, checksum: e90ddc9df15563d7f0235b4ced6a6bd7 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-09-26
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
In this paper we describe all the descriptive statistic and much of statistical inference. After this theoretical framework, we try to draw a paralled between what is studied since ekementary school, and what is done graduations. We conclude with some descriptions of practical lessons that worked some basic concepts of statistical inference.
Neste trabalho descrevemos toda a estatística descritiva e boa parte da estatística inferencial. Após este referencial teórico, procuramos fazer um paralelo entre o que é estudado desde o ensino fundamental e o que é feito nas graduações. Concluímos com algumas descrições de aulas práticas que trabalham alguns conceitos básicos da inferência estatística.
Nogueira, Fabio Esteves. "Modelos de regressão multivariada." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/45/45133/tde-25062007-163150/.
Full textMultivariate Linear Regression Models are not frequently used although they are very useful. Working with this kind of model, it is possible to analyse correlated response variables jointly. In this dissertation, we dedicate initially to describe the inferencial methods in Multivariate Linear Regression models. Further, we describe some measures of diagnostics and methods of variable selection in this model. Finally, some of the describe procedures are applied in a real data set.
Oliveira, Karlson Bernardo de. "Aplicação da estatística multivariada para apoiar a avaliação organizacional." Universidade de Fortaleza, 2008. http://dspace.unifor.br/handle/tede/77195.
Full textA new approach was dened to support organizational software assessment in the software organizations using PCA (Principal Component Analysis) model, a multivariate statistics model. This new approach was evaluated in a case study applied to an organization, using data collected from thirteen software projects over a year. Each evaluated project has ve indicators that are analyzed and compared. Moreover, a virtual project was created, using reference values of the ve indicators. This project is a baseline project and allows to how know the gap between each project and the expected by the organization. The PCA model transforms the ve indicators in a single score used to rank the software projects and then it is done an analysis on the data collected, getting results such as the extraction of lessons learned and propositions of organizational improvements. KEYWORDS: Organizatioal assessment, Multivariate Statistics, Measurement Process.
Neste trabalho, foi definida uma abordagem para apoiar a avaliação organizacional em empresas de software utilizando o modelo PCA (Análise de Componente Principal) da estatística multivariada. Esta nova abordagem foi avaliada em um estudo de caso aplicado a uma organização, utilizando dados coletados de treze projetos de software ao longo de mais de um ano. Cada projeto avaliado possui cinco indicadores que são analisados e comparados. Além disso, um projeto virtual é criado utilizando-se valores de referência para os cinco indicadores. Este projeto virtual serve de balizador para os demais, sendo possível saber o desnível dos projetos em relação ao esperado pela organização. O modelo PCA transforma os cinco indicadores em apenas um escore que serve para ordenar os projetos de software e em seguida é feito uma análise sobre os dados coletados, obtendo como resultado a extração de lições aprendidas e proposição de melhorias organizacionais.
Carneiro, Joel Camilo Souza. "Análise estatística multivariada aplicada à avaliação sensorial de alimentos." Universidade Federal de Viçosa, 2005. http://www.locus.ufv.br/handle/123456789/9129.
Full textMade available in DSpace on 2016-11-09T17:19:25Z (GMT). No. of bitstreams: 1 texto completo.pdf: 358209 bytes, checksum: 61f4de5dff5a2bd890da3557c1342c03 (MD5) Previous issue date: 2005-11-24
Fundação de Amparo à Pesquisa do Estado da Bahia
Os dados experimentais obtidos por YOKOTA (2005), referentes a 14 cachaças envelhecidas, avaliadas quanto a 13 atributos sensoriais pelo método Análise Descritiva Quantitativa (ADQ), foram submetidos à análise estatística pelas técnicas multivariadas: variáveis canônicas, análise de componentes principais e análise de fatores. Apresentou-se os programas necessários para execução dos procedimentos estatísticos no sistema Statistical Analysis System (SAS) e enfatizou-se, além dos referidos procedimentos, a interpretação e discussão dos resultados. O objetivo do presente trabalho foi detalhar a aplicação das referidas técnicas multivariadas na análise de dados provenientes da avaliação sensorial descritiva. O texto desta tese foi redigido em três artigos, cada um ilustra uma das técnicas e apresenta os programas para execução das análises no SAS, independentemente. A conclusão de cada artigo relaciona os resultados obtidos com os dos outros artigos. Observou-se, pelos resultados, que as três técnicas foram eficientes, pois permitiram a redução no conjunto de informação de 13 atributos para um número bem menor de dimensões e estas retiveram a maior proporção da variância total dos dados originais. Em variáveis canônicas foram necessárias apenas duas dimensões (duas variáveis canônicas) que retiveram 91,58% da variância. Em componentes principais e análise de fatores houve a redução para quatro dimensões (componentes ou fatores) que retiveram 88,69% da variância. Foi possível, também, avaliar a importância ou influência dos atributos sobre as primeiras dimensões consideradas na caracterização e comparação entre as cachaças. Nas três análises, a primeira e a segunda dimensão foram influenciadas por atributos relacionados à madeira e ao teor alcoólico, respectivamente. Ficou, então, evidenciado que os resultados das três técnicas foram equivalentes e que o teor alcoólico e as características atribuídas pela madeira são importantes na avaliação de cachaça envelhecida. A análise por variáveis canônicas apresentou algumas vantagens em relação aos componentes principais, ou seja, as primeiras variáveis canônicas retiveram maior proporção da varAnálise estatística multivariada aplicada à avaliação sensorial de alimentosiância do que os primeiros componentes e o agrupamento entre as cachaças similares foi mais consistente. Portanto, recomenda-se que para avaliar dados obtidos por Análise Descritiva Quantitativa, em que as informações são obtidas com repetições, seja utilizada preferencialmente a análise por variáveis canônicas. Já a análise por componentes principais é mais apropriada para conjuntos de dados sem repetições, ou seja, em que há apenas uma observação por variável em cada indivíduo avaliado. A rotação efetuada na análise de fatores facilitou a interpretação dos resultados em comparação à analise de componentes principais. Porém, não se pode dizer que a análise de fatores seja melhor, pois estas técnicas não são concorrentes. Enquanto na análise de componentes principais a ênfase é explicar a variância, na análise de fatores o objetivo é tentar explicar as covariâncias. Os resultados obtidos no presente estudo foram satisfatórios para as três técnicas empregadas, o que nos leva a concluir pela recomendação do emprego de tais técnicas a outros dados também obtidos por Análise Descritiva Quantitativa, com as seguintes ressalvas: (a) aplicar variáveis canônicas e análise de fatores preferencialmente à análise de componentes principais; (b) verificar se os resultados serão satisfatórios no sentido de permitir concluir conforme o presente estudo.
This work illustrates the application of three multivariate techniques, factor analysis, principal component analysis and analysis by canonical variables, applied to sensory evaluation of food. The data used was obtained by YOKOTA (2005), who evaluated 14 commercial cachaça brands in relation to 13 sensory attributes, using Quantitative Descriptive Analysis (QDA). The programs necessary to apply the statistical procedures using the Statistical Analysis System (SAS) were presented and emphasis was given to interpretation and discussion of the results. The goal of the present work was to furnish details on how to apply these multivariate techniques to analyses data obtained from descriptive sensory evaluation of food. This thesis comprised three articles, each one illustrating one of the techniques applied and presenting the programs to run SAS analysis. The conclusion of each article provides the results presented in the other articles. The results showed that the three techniques were efficient as they allowed the reduction of 13 attributes to a smaller dimension, still retaining a large proportion of the variance from the initial dataset. Canonical variables analysis showed that only two canonical variables retained 91.58% of the total variance, while principal component analysis and factor analysis showed that only four dimensions (components or factors) retained 88.69% of the total variance. It was also possible to evaluate the importance or influence of the attributes on the first dimensions considered in the characterization and comparison of the cachaça brands. Attributes related to wood and alcoholic content, respectively, influenced the first and second dimensions in all three analyses. Results from the three techniques were equivalent in that they all showed that wood attributes and alcoholic content are important when evaluating aged cachaça. Canonical variables analysis had some advantages over the principal component analysis since the first canonical variables retained a greater proportion of the total variance than the first principal components, with the clustering of the brands into groups being more consistent. It was concluded that canonical variables analysis should be used for data with repetitions, i.e., when for each attribute, more than one observation is available per subject (cachaça brand in our study). On the other hand, principal component analysis should be used when there are no repetitions. Although principal components and factor analysis are not competing techniques, the rotation applied in factor analysis did help the interpretation of results. While in principal component analysis, emphasis is on explaining variances, in factor analysis the goal is to explain co-variances. The results obtained in the present study were satisfactory for the three techniques used. Thus, the use of these techniques to other data also obtained by Quantitative Descriptive Analysis is recommended, with the following observations: (a) canonical variables and factor analysis should be applied instead of principal component analysis; (b) verify if satisfactory results were obtained.
CAMPOS, R. F. "Comparação entre dados de precipitação interpolados e do TRMM (3B43V7)." Universidade Federal do Espírito Santo, 2017. http://repositorio.ufes.br/handle/10/7592.
Full textAs estimativas de precipitação do satélite TRMM (Tropical Rainfall Measuring Mission) podem ser informações valiosas para áreas sem quaisquer tipos de medições da pluviosidade ou regiões com uma rede pluviométrica escassa. O objetivo do estudo foi comparar as estimativas mensais de precipitação do satélite TRMM com dados de precipitação terrestre interpolados produzidos por Xavier et al. (2015) para o Brasil. Para quantificar a concordância e parecença entre os bancos de dados foi utilizado o índice de concordância refinado de Willmout e o índice de desempenho. Os resultados indicaram que o satélite capturou adequadamente os padrões espaciais de precipitação em todo o Brasil quando comparado com a estimativa interpolada. É importante ressaltar que o satélite TRMM tendeu a superestimar os valores de precipitação, entretanto em média o acordo entre as estimativas TRMM e os dados DPTI é alto (dr ≥0,8 e Pi ≥0,7), mas observa-se maior viés em épocas chuvosas. Com base nestes resultados, a região Norte apresentou resultados mais discordantes para o Brasil. Esta região foi escolhida para o cálculo do índice de erosividade com o objetivo de visualizar a diferença da entrada dos dados interpolados com os dados do satélite TRMM no cálculo da erosividade. Os dados do satélite TRMM apresentaram menor índice de erosividade para região Norte. Isto significa que a erosividade com dados interpolados pode superestimar o real valor da erosividade nesta região, devido a limitações, como a escassa rede pluviométrica, inerentes ao banco de dados de estações interpoladas para esta região. Palavras-chave: Sensoriamento Remoto, Estatística Descritiva, Análise de concordância.
Dias, Camila Rafaela Gomes. "Desempenho do método de estimação por componentes principais e da rotação varimax na análise de fatores." Universidade Federal de Viçosa, 2018. http://www.locus.ufv.br/handle/123456789/18651.
Full textMade available in DSpace on 2018-04-05T17:01:08Z (GMT). No. of bitstreams: 1 texto completo.pdf: 727114 bytes, checksum: 67faaa3a5043ddc655ded4d67de8ff59 (MD5) Previous issue date: 2018-02-26
Fundação de Amparo à Pesquisa do Estado de Minas Gerais
Com o objetivo de avaliar o desempenho do método dos componentes principais utilizando a análise de fatores ortogonais, com e sem rotação varimax, a partir das estimativas dos seus parâmetros, foram estabelecidas 18 matrizes de correlações que configuraram diferentes graus de relações entre quatro variáveis aleatórias normalmente distribuídas. Inicialmente, avaliou-se a adequação das matrizes de correlações para a aplicação da análise de fatores pelo teste de esfericidade de Bartlett e pelo critério de KMO. Definiram-se como variáveis explicativas os autovalores, a matriz de cargas fatoriais, a comunalidade e a soma de quadrados da matriz de resíduos. Em seguida, foram calculados os erros relativos médios dos desvios entre os valores teóricos e estimados dessas variáveis, definidos, respectivamente, por: ∆λ, ∆λ1 , ∆λ2 , ∆Γ e ∆h². Além disso, calculou-se também a soma de quadrados da matriz de resíduos para avaliar a qualidade de ajuste de cada modelo fatorial ortogonal. Ao total, foram efetuadas 36 análises de fatores, sem e com rotação varimax. Posteriormente, para cada variável avaliada foi realizada uma análise de superfície de resposta. Concluiu-se que para os dados que seguem distribuição normal p-variada o método de estimação da análise de fatores ortogonais por componentes principais não foi adequado e a rotação varimax não melhorou os resultados quando utilizado com esse método. As análises estatísticas foram realizadas no software R.
To evaluate the performance of the main components method using orthogonal factors analysis, with and without varimax rotation, 18 matrices of correlations were established from the estimates of their parameters, which set up different degrees of relations between four random normally distributed variables. Firstly, the adequacy of correlation matrices for the application of factor analysis by the Bartlett’s sphericity test and the KMO criterion was evaluated. The eigenvalues, the matrix of factorial loads, the commonality and the sum of squares of the residue matrix were defined as explanatory variables. Then, the mean relative errors of the deviations between the theoretical and estimated values of these variables, defined respectively as: ∆λ, ∆λ1 , ∆λ2 , ∆Γ e ∆h² were calculated. In addition, the sum of squares of the residue matrix was also calculated to evaluate the adjustment quality of each orthogonal factorial model. In total, 36 factor analyzes were carried out, with and without varimax rotation. Subsequently, a response surface analysis was performed for each evaluated variable. It was concluded that for the data following normal p-varied distribution, the method of estimation of orthogonal factors analysis by principal components was not adequate and the varimax rotation did not improve the results when used with this method. Statistical analyzes were carried out in software R.
Gregori, Jussara Maria de. "INVESTIGAÇÃO DAS CONSULTAS AMBULATORIAIS DO HUSM ATRAVÉS DA ESTATÍSTICA MULTIVARIADA." Universidade Federal de Santa Maria, 2006. http://repositorio.ufsm.br/handle/1/8315.
Full textAs dificuldades que envolvem a saúde pública no Brasil são muitas, e neste contexto de desafios diários está o HUSM, que luta para manter a organização sem perder de vista a eficiência na prestação de serviços. Com base nesta constatação a presente pesquisa trata da investigação sobre o número das consultas realizadas nos ambulatórios do Hospital Universitário de Santa Maria, no período de 2003 a 2005, através de técnicas estatísticas multivariadas. Para tanto, considerar-se-á os serviços ambulatoriais realizados por especialidades selecionadas com maior número de atendimentos para usuários da região central do Estado do Rio Grande do Sul. A Análise de Agrupamentos e Análise Fatorial através de componentes principais, foram técnicas multidimensionais utilizadas como meio de detectar relações no conjunto das especialidades clínicas consideradas na pesquisa, bem como o município de origem dos pacientes. Assim, revela-se o perfil dos atendimentos ambulatoriais do HUSM, os quais são oferecidos pelas clínicas especializadas. Indicando um número significativo de encaminhamentos para a clínica cirúrgica, como também para tratamento com medicação ou tratamento de apoio. Dentre os 33 municípios selecionados, 20 tiveram maior significância em relação às consultas ambulatoriais realizadas. Desse modo, a análise de agrupamentos e a análise fatorial através das componentes principais contribuíram indicando relações entre as consultas ambulatoriais das especialidades clínicas e os municípios da região central do Estado, fornecendo subsídios para a melhoria da qualidade destes serviços.
Loreto, Aline Brum. "Análise da complexidade computacional de problemas de estatística descritiva com entradas intervalares." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2006. http://hdl.handle.net/10183/5730.
Full textAraújo, Thiago Costa. "Extensão da estatística Scan para detecção de conglomerados espaço-temporais em dados com excesso de zeros." reponame:Repositório Institucional da UnB, 2012. http://repositorio.unb.br/handle/10482/12804.
Full textSubmitted by Tania Milca Carvalho Malheiros (tania@bce.unb.br) on 2013-03-25T15:28:02Z No. of bitstreams: 1 2012_ ThiagoCosta Araújo_Parcial.pdf: 3652531 bytes, checksum: 0ddbb927182ed3fcedb5c0728e53e2ca (MD5)
Approved for entry into archive by Jaqueline Ferreira de Souza(jaquefs.braz@gmail.com) on 2013-04-16T11:41:40Z (GMT) No. of bitstreams: 1 2012_ ThiagoCosta Araújo_Parcial.pdf: 3652531 bytes, checksum: 0ddbb927182ed3fcedb5c0728e53e2ca (MD5)
Made available in DSpace on 2013-04-16T11:41:40Z (GMT). No. of bitstreams: 1 2012_ ThiagoCosta Araújo_Parcial.pdf: 3652531 bytes, checksum: 0ddbb927182ed3fcedb5c0728e53e2ca (MD5)
A detecção de clusters espaciais ou espaço temporais tem papel importante para a decisão das instituições competentes. Nas aplicações em que os dados apresentam grande concentração de zeros visualizam-se as distorções que tal ocorrência pode gerar,caso se utilize o modelo Poisson. Para lidar com o excesso de zeros na detecção de clusters espaciais propôs-se a utilização do modelo ZIP em conjunto com a estatística scan de Kulldorff (1997)(Cançado et al.,2012). Neste trabalho propomos uma extensão da estatística Scan-ZIP para o caso espaço-tempora l(esta-tísticaScan-ZIPET). A estatística ScanZIPET é aplicada em simulações numéricas e o seu desempenho é comparado com a versão Poisson. Realiza-se a comparação entre as duas estatísticas para os dados de tuberculose no estado da Geórgia, nos Estados Unidos da América. Obtém-se resultados positivos para a nova estatística, mas condicionados ao conceito de zero estrutural que permeia a aplicação. ______________________________________________________________________________ ABSTRACT
Detection of space-time clusters plays na importante role in helping health officials in the decision making process.The assumption of Poisson distribution forcount data may lead to distortions in the cluster detection process when the num-ber of zero counts is greater than the expected. To handle this situation, Cançadoet al.(2012) proposed the combination of the ZIP distribution with Kulldorff’sscan statistic (Kulldorff,1997). In this work we propose na extension of the ZIPspatial scan statistic to the space-time context, the Scan ZIPET. The Scan ZIPET statistic is compared to Kulldorff’s space-time scan statistic(Kulldorffetal.,1998 through numerical simulations. Na application to death cases due to tuberculosis in the state of Georgia,USA,is presented. The propose dspace-time scan statistic presentes better results in the presence of structural zeros.
Amaral, Guilherme Soares Gurgel do. "Sistema de métricas de competitividade das nações baseado na estatística multivariada." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/3/3136/tde-07122016-083824/.
Full textThis thesis aims to develop metrics to measure the determinants of competitiveness of national economies. It is based on a structural and systemic notion of competitiveness, based on the studies of authors related to the evolutionary theory of economic development, to conceptualize national competitiveness as the capacity of countries to generate capabilities that will support its dynamic competitive process. The debate on the creation of national competitiveness metrics has been caught in fields of economics and management, and indicates the need to incorporate the measurement of factors related to the dynamics of competition in the international market and especially its determinants. Thus, this work is part of the debate on the dynamics of national competitiveness based on capabilities for the emergence of competitive advantages in the domestic and industrial sectors of economies. The proposal developed here involves the construction of a spreadsheet of indicators organized into dimensions of factors that affect the development of capabilities for competitiveness in countries. Multivariate statistical methods are used to analyze the data and finally comparative analysis based on canonical correlations are made to test their validity. s, multivariate statistical analysis.
Regis, Marcelo Mazarakis. "Estudo metodológico utilizando a estatística multivariada na análise da tendência socioeconômica." reponame:Repositório Institucional da UFSC, 2012. http://repositorio.ufsc.br/xmlui/handle/123456789/91904.
Full textMade available in DSpace on 2012-10-24T03:43:58Z (GMT). No. of bitstreams: 1 270029.pdf: 2627818 bytes, checksum: ef5d65291e9505acc357c89ff769ab92 (MD5)
O presente estudo, envolvendo os municípios que compõem a associação dos municípios da Grande Florianópolis tem como objetivo principal aplicar um método para a realização da análise de tendências socioeconômicas, através de estatística multivariada. Para isto, utilizou-se como arcabouço os dados socioeconômicos, dos anos de 1991 e 2000, que foram extraídos do Atlas do Desenvolvimento Humano no Brasil do Programa das Nações Unidas para o Desenvolvimento. Tendo sido analisadas as variáveis que o compõe processaram-se posteriormente os dados por meio de técnicas de estatística multivariada, utilizando a análise de cluster, visando determinar o grau de semelhança ou tipificação dos municípios em termos de características socioeconômicas. O método aqui apresentado é principalmente um instrumento de gestão do território, focado na formação de classes com características semelhantes, mostrando assim ao gestor e/ou pesquisador áreas prioritárias de trabalho. O estudo além de utilizar ferramentas de estatística multivariada também aplicou técnicas de Sistemas de Informação Geográfica, criando assim uma representação na qual os resultados foram espacializados para toda a área da Grande Florianópolis.
This following study involving the counties that compose the Municipal Association of the #Grande Florianópolis - GRANFPOLIS#; has as principal objetive to propose a method to realization of the socio economic analysis tendencies, through of the multivariate statistics. For that, it was used as skeleton the socioeconomic data that it were extracted from the #Atlas do Desenvolvimento Humano no Brasil do Programa das Nações Unidas para o Desenvolvimento#. Having been analysed the variables that it were composed, the data were later prosecuted by the use of the multi-variable statistics tecnics, using the Cluster analysis, having in view to determine the similarity degree or the type of the counties in terms of the socioeconomics characteristics. The method presented here, is mainly an instrument of territorial management, centred in the formation of classes with similary characteristics, showing to the manager and / or searcher, priority area of working. The study besides of using the multi-variables statistics tools also applied tecnics of the Geographycal Information System, creating a representation in which the results were spacing to the total area of the GRANFPOLIS.
Ferreira, Pedro Henrique Matheus da Costa. "Análise de dados de bases de honeypots: estatística descritiva e regras de IDS." Universidade Presbiteriana Mackenzie, 2015. http://tede.mackenzie.br/jspui/handle/tede/1460.
Full textFundação de Amparo a Pesquisa do Estado de São Paulo
A honeypot is a computer security system dedicated to being probed, attacked or compromised. The information collected help in the identification of threats to computer network assets. When probed, attacked and compromised the honeypot receives a sequence of commands that are mainly intended to exploit a vulnerability of the emulated systems. This work uses data collected by honeypots to create rules and signatures for intrusion detection systems. The rules are extracted from decision trees constructed from the data sets of real honeypots. The results of experiments performed with four databases, both public and private, showed that the extraction of rules for an intrusion detection system is possible using data mining techniques, particularly decision trees. The technique pointed out similarities between the data sets, even the collection occurring in places and periods of different times. In addition to the rules obtained, the technique allows the analyst to identify problems quickly and visually, facilitating the analysis process.
Um honeypot é um sistema computacional de segurança dedicado a ser sondado, atacado ou comprometido. As informações coletadas auxiliam na identificação de ameaças computacionais aos ativos de rede. Ao ser sondado, atacado e comprometido o honeypot recebe uma sequência de comandos que têm como principal objetivo explorar uma vulnerabilidade dos sistemas emulados. Este trabalho faz uso dos dados coletados por honeypots para a criação de regras e assinaturas para sistemas de detecção de intrusão. As regras são extraídas de árvores de decisão construídas a partir dos conjuntos de dados de um honeypot real. Os resultados dos experimentos realizados com quatro bases de dados, duas públicas e duas privadas, mostraram que é possível a extração de regras para um sistema de detecção de intrusão utilizando técnicas de mineração de dados, em particular as árvores de decisão. A técnica empregada apontou similaridades entre os conjuntos de dados, mesmo a coleta ocorrendo em locais e períodos de tempos distintos. Além das regras obtidas, a técnica permite ao analista identificar problemas existentes de forma rápida e visual, facilitando o processo de análise.
Requião, Reiner. "Contribuições à avaliação da incerteza em modelos MIMO não lineares em estado estacionário." Universidade Federal da Bahia, 2012. http://repositorio.ufba.br/ri/handle/ri/15102.
Full textApproved for entry into archive by LIVIA FREITAS (livia.freitas@ufba.br) on 2014-06-30T14:20:29Z (GMT) No. of bitstreams: 1 Dissertacao.pdf: 1486230 bytes, checksum: 59c4eedd305298b5614301172251ec07 (MD5)
Made available in DSpace on 2014-06-30T14:20:29Z (GMT). No. of bitstreams: 1 Dissertacao.pdf: 1486230 bytes, checksum: 59c4eedd305298b5614301172251ec07 (MD5)
CAPES, CNPQ
A publicação do Suplemento 2 do Guia para Expressão da Incerteza de Medição (GUM-S2) apresenta dois método para avaliação da incerteza nos modelos MIMO (Multiplas Entradas e Multiplas Saídas) de medição: o primeiro método (GUF - GUM Uncertainty Framework) baseada na Lei de Propagação da Incerteza e o segundo método MCM-S2 baseada na Lei de Propagação de Funções de Densidade de Probabilidade através do Método de Monte Carlo. Contudo, o método GUF negligencia a informação dos graus de liberdade nas grandezas de entrada para a construção da região de abrangência das grandezas de saída. O principal objetivo deste trabalho é o desenvolvimento do método para região de abrangência e da fórmula de Welch-Satterthwaite para modelos MIMO. Os resultados mostram que o método desenvolvido consegue fornecer uma região de abrangência satisfatória utilizando os graus de liberdade das grandezas de entrada. Por outro lado, os software de simulação de processos atuais não avaliam a incerteza dos resultados apresentados. O módulo Uncertainty desenvolvido é uma ferramenta que utiliza as equações de modelagem do processo como modelos MIMO e proporciona uma adequada avaliação dos resultados simulados auxiliando nas tomadas de decisões.
The publication of Supplement 2 of Guide to the Expression of Uncertainty in Measurement (GUM-S2) presents two methods to evaluate uncertainty in MIMO (Multiple Input and Multiple Output) measurement models: the first method (GUF - GUM Uncertainty Framework) based on the Law of Propagation of Uncertainty and the second method MCM-S2 based on the Law of Propagation of Probability Density Functions by the Monte Carlo Method. However, GUF neglects information degrees of freedom in the input quantities for the construction of the coverage region of the output quantities. The main objective of this work is the development of the method to the coverage region and the Welch-Satterthwaite formula for MIMO models. The results show that the method developed can provide a satisfactory coverage region using the degrees of freedom of the input quantities. On the other hand, the current software of simulation of processes do not evaluate the uncertainty of results. The module Uncertainty developed is a tool that uses the equations process as MIMO models and provides an adequate evaluate in the simulated results assisting in decision making.
Rosario, Alexander Alvarez. "Análise estatística multivariada para reconhecimento de padrões em ensaios não destrutivos magnéticos." Universidade de São Paulo, 2011. http://www.teses.usp.br/teses/disponiveis/3/3151/tde-04042011-114941/.
Full textThe present work deals with application of multivariate statistic techniques for pattern recognition in signals from Non-Destructive Essays (NDE), based on the Magnetic Barkhausen Noise (MBN). Pattern recognition can be done in a nonsupervised way by Cluster Analysis defining similarity criteria. On the other hand, for supervised recognition, Discriminant Analysis looks for classifying new samples in known groups, a priori, by means of classification rules created for these known sample groups. Two detection and classification cases were studied by MBN. The MBN is a magnetic phenomenon generated by sudden changes in magnetization of ferromagnetic materials, when these materials are subjected to variable magnetic fields. These changes are related to material microstructure as well as to the presence of elastic stresses (tension and compression). In the first studied case, the present study searches identifying broken wires in risers through measurements of mechanical strain. In the second case, the study classifies different thermal treatments in AISI 420 steel samples. Regarding the analysis of structural integrity of risers, firstly the reduction of data dimensionality was obtained via Analysis of Main Components and, later, Cluster Analysis was performed. Concerning the classification problem of steel samples, the Fisher Linear Discriminant Analysis and the Quadratic Analysis were used. Analysis results showed that Multivariate Statistic Techniques give rise to tools very appropriated for increasing the efficiency of inspection both in the Magnetic NDE area in general, and MBN in particular.
Silveira, Manoel Mendonça. "Estratégias de aplicação de análise estatística multivariada no desenvolvimento de novos produtos." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2010. http://hdl.handle.net/10183/28793.
Full textThe deep understanding of market’s requirements, during the manufacturing of new products and/or services, leads to the creation of products of better configuration attend customers’ necessities. Multivariable analysis techniques can be employed to help identifying such consumer preferences. Therefore, the aim of this study is to illustrate an approach to the employment of multivariate statistical procedures on the development of new products (DNP). These techniques can assist companies in managing products’ requirements by helping them to: (i) assemble and categorize products’ requirements; (ii) identify those requirements considered more relevant among all; (iii) identify market sectors based on the aspects most valuable to consumers; (iv) check on associations between one given product and certain features of general customers. The present work illustrates the combined use of statistical techniques such as the CHAID (Chi-squared Automatic Interaction Detector), factorial analysis, conjoint analysis and correspondence analysis. The successful application of these techniques is exemplified with the development of a new domestic cleaning environmental-friendly product.
Junior, Moacyr Machado Cardoso. "Incorporação da incerteza nos mapas perceptuais obtidos via MDS." Instituto Tecnológico de Aeronáutica, 2014. http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2939.
Full textMaia, Kelly do Prado. "Otimização do índice de qualidade da água por meio de análise estatística multivariada." reponame:Repositório Institucional da UFOP, 2014. http://www.repositorio.ufop.br/handle/123456789/4315.
Full textSubmitted by Maurílio Figueiredo (maurilioafigueiredo@yahoo.com.br) on 2015-01-06T16:40:29Z No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_OtimizaçãoIndiceQualidade.pdf: 4310779 bytes, checksum: d13eb947bbb5bff523d8a1e8cbd26af4 (MD5)
Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2015-01-21T18:22:56Z (GMT) No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_OtimizaçãoIndiceQualidade.pdf: 4310779 bytes, checksum: d13eb947bbb5bff523d8a1e8cbd26af4 (MD5)
Made available in DSpace on 2015-01-21T18:22:56Z (GMT). No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_OtimizaçãoIndiceQualidade.pdf: 4310779 bytes, checksum: d13eb947bbb5bff523d8a1e8cbd26af4 (MD5) Previous issue date: 2014
O principal objetivo deste trabalho foi reduzir o número de parâmetros compõem o Índice de Qualidade da Água (IQA), desenvolvido pela National Sanitation Foundation, por meio da aplicação de análise estatística multivariada. Para isto, foram utilizados os resultados fornecidos pelo Instituto Mineiro de Gestão das Águas - IGAM de cada parâmetro integrante do IQA (oxigênio dissolvido, coliformes termotolerantes, pH, DBO, nitrato, fosfato, temperatura, turbidez e sólidos totais) e os respectivos valores de IQA, de cada estação de monitoramento da Bacia do Rio das Velhas, no período de 2000 a 2010. Para a redução do número de dados avaliados foi primeiramente investigada a aplicação da análise de componentes principais (PCA), cuja aplicação não foi satisfatória para a avaliação do conjunto de dados estudado. Desta forma, a rede neural de Kohonen foi utilizada, proporcionando a redução do conjunto de dados inicial composto por 1834 resultados para 524. A viabilidade da aplicação da redução do número de resultados foi avaliada pela comparação entre a correlação dos dados originais e os dados reduzidos. A redução do número de conjuntos de dados também mostrou que a frequência de avaliação das estações de monitoramento poderia ser reduzida, em relação a frequência atualmente praticada pelo IGAM, culminando em redução de custos com monitoramento. O novo conjunto de dados formado por 524 resultados foi avaliado pela técnica OPS (ordered predictors selection), visando obter a redução do número de parâmetros do IQA. Nesta análise verificou-se a possibilidade da criação de um novo modelo para determinação do IQA, formado pelos parâmetros coliformes termotolerantes, DBO, fosfato, oxigênio dissolvido e turbidez. A calibração do novo modelo se deu com a aplicação da ferramenta PLS (partial least squares), prevendo os valores de IQA gerados pelo novo modelo e comparando-os aos valores originais de IQA, para o conjunto de dados, calculados pela fórmula tradicional. A calibração indicou que os dados se ajustaram ao modelo, cujo coeficiente de determinação (R2) foi igual a 0,96, e o gráfico de resíduos apresentou distribuição aleatória, com valores dos resíduos bem próximos de zero. O modelo ainda foi avaliado estimando os resultados de IQA, com o uso de cinco parâmetros, e a aplicação dos resultados de monitoramento de qualidade da água do ano de 2011. Os resultados obtidos na validação retratam a previsão do IQA pelo modelo muito próxima aos resultados obtidos por meio do cálculo tradicional, apontando R2 igual a 0,92, confirmando a aplicabilidade do novo modelo construído. ____________________________________________________________________________________________
ABSTRACT: The main objective of this work was to reduce the number of parameters comprising the Water Quality Index (WQI) by the application of multivariate statistical analysis. For this, the results of monitoring conducted by the Water Management Institute of Minas Gerais (IGAM) for each parameter of the WQI (dissolved oxygen, fecal coliform, pH, BOD, nitrate, phosphate, temperature, turbidity and total solids) and the respect WQI score obtained at each monitoring station in the Velhas River Basin, in the period between 2000 and 2010. The reduction of the number of evaluated data was first investigated by means of application of principal component analysis (PCA), whose implementation is not suitable for evaluating the data set studied. Thus, the Kohonen`s neural network was used, providing a reduction in the initial data set from 1834 to 524 results of analyses. The viability of this data reduction was assessed by comparing the correlation between the original data and the reduced data. The reduction of the number of data sets also showed that the monitoring frequency of all stations could be reduced, compared to currently practiced by IGAM, culminating in important cost savings with monitoring. The new data set formed by 524 results were evaluated by the OPS (Ordered Predictors Selection) to reduce the number of parameters of WQI. In this analysis there was the possibility of creating a new model for determining the WQI. This model was formed by five parameters: thermotolerant coliform, BOD, phosphate, dissolved oxygen and turbidity. The calibration of the new model was done by PLS (Partial Least Square) tool, predicting WQI values generated by the new model and comparing the results to the original forecast WQI values for the data set, calculated by the traditional formula. The calibration indicated that the data fitted the model, whose coefficient of determination (R2) was equal to 0.96, and the graph of residues showed a random distribution, with values close to zero. The model was further assessed for prediction of the results of WQI, using this model with five parameters, and applying the results of monitoring of water quality in the year 2011 carried out by IGAM. The results of the validation depicted very close to WQI results obtained by the traditional calculation and R2 was 0.92, confirming the applicability of the new model constructed
Santos, Rodrigo Neves Figueiredo dos. "Calibração multivariada para análises espectrofotométricas empregando pacotes wavelets e mínimos quadrados-parciais." Instituto Tecnológico de Aeronáutica, 2006. http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=335.
Full textCruz, Sara dos Santos Escudeiro. "Análise estatística de dados de biologia molecular." Master's thesis, Universidade de Aveiro, 2010. http://hdl.handle.net/10773/9695.
Full textNesta dissertação são analisados os genomas completos de 46 espécies de organismos, com o objectivo de investigar a existência, ou não, de características estatísticas discriminatórias da classe a que pertence cada uma das espécies em estudo, com base na distribuição empírica da distância global entre nucleótidos iguais. Esta distribuição resulta do mapeamento da estrutura primária do ADN proposto e avaliado por Afreixo et al. (2009). São utilizadas metodologias estatísticas multivariadas de análise não-supervisionada e de redução da dimensionalidade, nomeadamente as classificações hierárquica e não-hierárquica e a análise de componentes principais. Verifica-se que o mapeamento da distância global entre nucleótidos iguais captura características essenciais do ADN das espécies analisadas, uma vez que a distribuição das primeiras distâncias determina uma possível assinatura genética capaz de permitir a diferenciação entre espécies. Esta diferenciação é conseguida não só a um nível geral, entre os dois grandes grupos de espécies eucariotas e procariotas, mas também a níveis mais especializados. No que diz respeito ao ajustamento de modelos probabilísticos teóricos à distribuição empírica de cada espécie, são avaliados o modelo proposto em Afreixo et al. (2009) e também um modelo alternativo, ambos baseados em misturas finitas de distribuições geométricas. No caso deste último, é utilizado o algoritmo EM (Expectation-Maximization) para estimar os seus parâmetros. A qualidade do ajustamento dos modelos teóricos à distribuição empírica é investigada com o auxílio do teste de ajustamento do qui-quadrado e também com a utilização de medidas de similaridade. Os resultados obtidos permitem constatar que, na maioria das espécies em estudo, o modelo de mistura de quatro distribuições geométricas é aquele que melhor se ajusta à distribuição empírica da distância global entre nucleótidos iguais.
In this dissertation the complete genomes of 46 species of organisms are analysed, with the aim of investigating the possible existence of discriminatory statistical characteristics of the class to which each of the species under study belongs, based on the empirical distribution of the global distance between equal nucleotides. This distribution came about from the mapping scheme for the primary structure of DNA proposed and assessed by Afreixo et al. (2009). Unsupervised multivariate statistical and dimensionality reduction methods are used in the present analysis, namely hierarchical classification, non hierarchical classification and principal component analysis. It is shown that the mapping of the global distance between equal nucleotides captures essential features of the DNA of the species studied, as it allows to infer that the distribution of the first distances represents a possible genetic signature capable of differentiating among species. This differentiation is achieved not only at a general level between the two major groups of species, eukaryotic and prokaryotic, but also at more specialized levels. Furthermore, fittings of probabilistic models to the empirical distribution are investigated for each specie. More specifically, the model proposed by Afreixo et al. (2009) and an alternative model, both based on finite geometric mixture models, are analysed. In the latter case, the EM (Expectation-Maximization) algorithm is used to estimate its parameters. The goodness of fit of the theoretical models is assessed using a chi-square test and measures of similarity. For most species studied, the results show that four-component geometric mixture models are the ones that better fit to the empirical distribution of the global distance between equal nucleotides.
Toledo, Carlos Eduardo Vieira [UNESP]. "Análises estatística multivariada e filogenética dos dipnoiformes brasileiros. Comparações bióticas com o Gondwana ocidental." Universidade Estadual Paulista (UNESP), 2006. http://hdl.handle.net/11449/103010.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Dipnoiformes não têm sido particularmente bem estudados no Brasil, devido à falta de espécimens e da aparente distribuição paleobiogeográfica limitada. A descoberta de novas localidades mudou isto. No momento foram identificados Dipnoiformes nas seguintes bacias sedimentares brasileiras: Paraná, estados de Rio Grande do Sul (Triássico), Paraná (Permiano Superior), São Paulo (Permiano Superior), Mato Grosso (Devoniano); Bauru, Estado de São Paulo (Cretáceo Superior); Parnaíba, Estado do Maranhão (Permiano Inferior); Araripe, Estado de Ceará (Jurássico Superior/Cretáceo Inferior); São Luís-Grajaú, Estado do Maranhão (Cretáceo médio); Acre, Estado do Acre (Mioceno superior/Plioceno inferior). As maiores diversidades de Dipnoiformes são encontradas nas bacias de Paraná e São Luís-Grajaú. As espécies até o momento identificadas no Brasil são Neoceratodus sp., Ceratodus africanus, Asiatoceratodus tiguidiensis, Protopterus humei, Lepidosiren megalos e o Gênero Archaeoceratodus. Muitas destas espécies são encontradas no continente Africano e outras semelhantes na Austrália, evidenciando a troca faunística que ocorreu no Gondwana durante Paleozóico e Mesozóico. A Análise Estatística Multivariada foi utilizada como uma ferramenta para auxiliar na classificação de fósseis. Seu objetivo foi propor uma classificação para o material ainda não descrito formalmente, com base na grande variação morfológica observada nos espécimens, simultaneamente levando-se em conta as diversas variáveis morfométricas dos fósseis. A Análise Histológica corroborou a Análise Estatística, evidenciando a observação de dois conjuntos de placas, o primeiro relacionado às famílias Ceratodontidae e Neoceratodontidae, o segundo a Família Gnarthorizidae...
Dipnoiformes have not been very well studied in Brazil, due to the lack of specimens and apparent limited paleobiogeographical distribution. The discovery of new localities has changed this scenario. To date, Dipnoiformes have been identified in the following Brazilian sedimentary basins: Paraná, in the states of Rio Grande do Sul (Lower/Middle Triassic), Paraná (Upper Permian), São Paulo (Upper Permian), and Mato Grosso (Devonian); Bauru, in the State of São Paulo (Upper Cretaceous); Parnaíba, in the State of Maranhão (Lower Permian); Araripe, in the State of Ceará (Upper Jurassic/Lower Cretaceous); São Luís-Grajaú, in the State of Maranhão (middle Cretaceous); Acre, in the State of Acre (upper Miocene/lower Pliocene). The largest Dipnoiformes diversities are found in the Paraná and São Luís-Grajaú basins. The species until now identified in Brazil are Neoceratodus sp., Ceratodus africanus, Asiatoceratodus tiguidiensis, Protopterus humei, Lepidosiren megalos and the Genus Archaeoceratodus. Many of these species are found in Africa and Australia, evidencing the faunistic changes in Gondwana during Paleozoic and Mesozoic era. The Multivariate Statistical Analysis was used as a tool to aid in the classification of the fossils. The main objective of this analysis was to propose a classification for the material not described formally, based on the great morphologic variation observed in the specimens, simultaneously taking into account the several variables morfometrics of the fossils. The Histological Analysis corroborated the Statistical Analysis, allowing the identification of two groups of dental plates, the first related to the families Ceratodontidae and Neoceratodontidae, the second to the Family Gnarthorizidae. A Phylogenetic Analysis is presented and sustained by the characteristics... (Complete abstract click electronic access below)
Toledo, Carlos Eduardo Vieira. "Análises estatística multivariada e filogenética dos dipnoiformes brasileiros. Comparações bióticas com o Gondwana ocidental /." Rio Claro : [s.n.], 2006. http://hdl.handle.net/11449/103010.
Full textAbstract: Dipnoiformes have not been very well studied in Brazil, due to the lack of specimens and apparent limited paleobiogeographical distribution. The discovery of new localities has changed this scenario. To date, Dipnoiformes have been identified in the following Brazilian sedimentary basins: Paraná, in the states of Rio Grande do Sul (Lower/Middle Triassic), Paraná (Upper Permian), São Paulo (Upper Permian), and Mato Grosso (Devonian); Bauru, in the State of São Paulo (Upper Cretaceous); Parnaíba, in the State of Maranhão (Lower Permian); Araripe, in the State of Ceará (Upper Jurassic/Lower Cretaceous); São Luís-Grajaú, in the State of Maranhão (middle Cretaceous); Acre, in the State of Acre (upper Miocene/lower Pliocene). The largest Dipnoiformes diversities are found in the Paraná and São Luís-Grajaú basins. The species until now identified in Brazil are Neoceratodus sp., Ceratodus africanus, Asiatoceratodus tiguidiensis, Protopterus humei, Lepidosiren megalos and the Genus Archaeoceratodus. Many of these species are found in Africa and Australia, evidencing the faunistic changes in Gondwana during Paleozoic and Mesozoic era. The Multivariate Statistical Analysis was used as a tool to aid in the classification of the fossils. The main objective of this analysis was to propose a classification for the material not described formally, based on the great morphologic variation observed in the specimens, simultaneously taking into account the several variables morfometrics of the fossils. The Histological Analysis corroborated the Statistical Analysis, allowing the identification of two groups of dental plates, the first related to the families Ceratodontidae and Neoceratodontidae, the second to the Family Gnarthorizidae. A Phylogenetic Analysis is presented and sustained by the characteristics... (Complete abstract click electronic access below)
Orientador: Reinaldo José Bertini
Coorientador: Martha Richter
Banca: Marcello Guimarães Simões
Banca: Paulo Marques Machado Brito
Banca: Paulo Milton Barbosa Landim
Banca: Valéria Gallo da Silva
Doutor
Sperandio, Mauricio. "Classificação de conjuntos consumidores de energia elétrica via mapas auto-organizáveis e estatística multivariada." Florianópolis, SC, 2004. http://repositorio.ufsc.br/xmlui/handle/123456789/87238.
Full textMade available in DSpace on 2012-10-21T16:57:05Z (GMT). No. of bitstreams: 1 207970.pdf: 2460629 bytes, checksum: 4983ad8cc897ed5f8e1367dec5be8b7b (MD5)
É apresentada uma metodologia para formação de agrupamentos de conjuntos consumidores de energia elétrica, contemplando desde a seleção das variáveis a serem utilizadas no processo, até a classificação dos grupos de acordo com a qualidade do fornecimento de seus integrantes. A partir dos dados atuais de 260 conjuntos sob concessão das Centrais Elétricas de Santa Catarina (CELESC), contendo 18 variáveis que descrevem características do mercado consumidor e do sistema elétrico de fornecimento, são selecionadas as variáveis mais significativas por meio da análise estatística multivariada. Então, utilizando uma validação cruzada entre um tipo de rede neural auto-organizável e o tradicional método estatístico das k-médias é feito o agrupamento dos conjuntos consumidores. Os grupos obtidos são classificados de forma a sinalizar quando o nível de continuidade seja inferior ao nível de referência, possibilitando detectar incompatibilidades com a meta, ou com o sistema elétrico de fornecimento. Conhecendo melhor a situação de cada conjunto, a concessionária pode aplicar o controle de qualidade necessário, e rever as tarifas de maneira a remunerar os investimentos indispensáveis à prestação do serviço de acordo com a qualidade regulamentada, ou discutir junto ao órgão regulador a situação do conjunto em relação à meta determinada.
Carmo, Marcus Fabio Fontenelle do. "CLASTRIN - um Classificador de Tráfego de Aplicações Internet Utilizando a Abordagem "Um-Contra-Todos"." Universidade de Fortaleza, 2009. http://dspace.unifor.br/handle/tede/82551.
Full textIn this work, it is presented a proposal of a classifier for applications present into the Internet traffic. The purpose of this classifier is to use statistical information collected from the data flow and identify the least amount of statistical discriminators able to distinguish the flow of a determined application class from the others, separating them into groups. To achieve this classification, the proposed method is based on split an 1 to N classification problem in N problems of classification 1 to 1 (one against all approach). The generation of data clusters is performed by cluster analysis (a method of multivariate statistics) using a non-hierarchical method (K-Means) together with techniques of supervised machine learning. The methodology presented claims that the best set of variables to classify a given application is not the same to classify N applications. Compared to other methods, this work innovates in providing a reduction in the number of variables (features) to be analyzed by a statistical method computationally simple, which can be used in other data sets (traces). It was observed that for most classes only one variable was sufficient to discriminate the traffic of the application, getting an average of 74,40% of correct classification of flows in the class under analysis. Keywords: Computer Networks; Statistical Discriminators; Traffic Classification; Multivariate Statistics; Cluster Analysis; Machine Learning.
Neste trabalho, apresenta-se uma proposta de um classificador de aplicações presentes no tráfego Internet. A proposta deste classificador é utilizar informações estatísticas coletadas dos fluxos de dados e identificar a menor quantidade de discriminantes estatísticos capazes de distinguir os fluxos de determinada classe de aplicação dos demais, separando-os em grupos. Para a realização desta classificação a metodologia apresentada se baseia na divisão de um problema de classificação de 1 para N em N problemas de classificação 1 para 1 (abordagem um contra todos one-against all). A geração dos conglomerados de dados é realizada através da análise de agrupamentos (método de estatística multivariada) utilizando-se de um método não hierárquico (K-Médias K-Means) em conjunto com técnicas de aprendizagem de máquina supervisionada. A metodologia apresentada parte do princípio que o melhor conjunto de variáveis para classificar uma determinada aplicação não é o mesmo para classificar N aplicações. Comparativamente a outros métodos estudados, este trabalho inovou ao apresentar uma redução do número de variáveis (features) a serem analisadas através de um método estatístico computacionalmente simples, que pode ser utilizado em outros conjuntos de dados (traces). Foi obtida uma média de acerto na classificação dos fluxos das classes sob análise de 74,40% e média de falsos negativos de 5,98%. Palavras-chave: Redes de Computadores; Discriminantes Estatísticos; Classificação de Tráfego; Estatística Multivariada; Análise de Agrupamentos; Aprendizagem de Máquina.
Siqueira, Junior Gabriel Paulino. "Uma metodologia para identificação de classes de tráfego baseada em discriminantes estatísticos e análise de agrupamentos." Universidade de Fortaleza, 2008. http://dspace.unifor.br/handle/tede/79980.
Full textIn this study, we present a methodology to identify classes of Internet traffic. This methodology is based on multivariate statistics using cluster analysis to aggregate flows into groups. To do this task, we use several statistic information collected from each data flow which are evaluated on their power of discrimination to reach a high level of accuracy on their identification. To validate this methodology, we use the peer-to-peer class. Nowadays, peer-to-peer traffic represents a significant component of the Internet traffic data meantime it is hard to identify because of the camouflage to difficult their presence in the traffic.
Neste trabalho, apresenta-se uma metodologia para identificação de classes de aplicações presentes no trafego Internet. A metodologia adotada tem como fundamento o uso da estatística multivariada, através do método de análise de agrupamentos para separar os fluxos do tráfego em grupos, utilizando para tanto diversas informações estatísticas coletadas de cada fluxo de dados, as quais são avaliadas em seu poder de discriminação para alcançar um alto índice de exatidão na identificação. Para validação da metodologia, utilizou-se a classe de aplicações peer-to-peer. Esta representa atualmente um componente significativo do total de dados que circulam na Internet sendo, entretanto, de difícil identificação, uma vez que as características de diversas aplicações peer-to-peer se camuflem para dificultar sua detecção. Palavras-chave: Redes de Computadores; Discriminantes Estatísticos; Análise de Agrupamentos.
Alvarez, Rojas Cirilo. "Distribuição exata da estatistica de razão de verossimilhança para testar Ho: =I em populações normais multivariadas complexas." [s.n.], 1989. http://repositorio.unicamp.br/jspui/handle/REPOSIP/306395.
Full textDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação
Made available in DSpace on 2018-07-19T02:42:05Z (GMT). No. of bitstreams: 1 AlvarezRojas_Cirilo_M.pdf: 1012860 bytes, checksum: dcb32d74569352342e02fa8bc0be26da (MD5) Previous issue date: 1989
Resumo: O objetivo do presente trabalho é a determinação da distribuição exata do critério de razão de verossimilhança para testar a hipótese Ho : S = I contra H1 : S ? I em populações normais multivariadas complexas. A distribuição da estatística de razão de verossimilhança determina-se em forma de série de densidade chi-quadrado, série logarítmica e série beta incompleta. Faz-se cálculo computacional para determinar os valores de À correspondente a níveis de a = 0.01,0.05,0.10,0.90,0.95 e 0.99 para 2,3 e 4 variáveis e vários tamanhos de amostras, especificamente para amostras pequenas.
Abstract: Not informed
Mestrado
Mestre em Estatística
Souza, Ana Paula Almeida Bertossi. "ÍNDICE DE QUALIDADE DA ÁGUA EM MICROBACIAS HIDROGRÁFICAS COM DIFERENTES COBERTURAS VEGETAIS NO SUL DO ESPÍRITO SANTO." Universidade Federal do Espírito Santo, 2011. http://repositorio.ufes.br/handle/10/4974.
Full textBERTOSSI, Ana Paula Almeida. Índice de qualidade da água em microbacias hidrográficas com diferentes coberturas vegetais, no sul do estado do Espírito Santo. 2011. Dissertação (Mestrado em Ciências Florestais) Universidade Federal do Espírito Santo, Alegre-ES. Orientador: Prof. Dr. Roberto Avelino Cecílio. Coorientadores: Prof. Dr. Giovanni de Oliveira Garcia e Prof.ª Drª. Mirna Aparecida Neves. O presente trabalho foi desenvolvido com o objetivo de avaliar a relação entre cobertura do solo e qualidade da água na bacia hidrográfica do Córrego Horizonte, localizada no município de Alegre, ES. Foram selecionadas três microbacias de cabeceira, para coleta de água superficial e subterrânea, cada qual caracterizada por diferentes coberturas do solo: pastagem, floresta e cafeeiro. As águas superficiais foram coletadas nos exutórios das microbacias e as águas subterrâneas em poços de monitoramento instalados na área. As coletas foram feitas em períodos de estiagem e de chuvas. Neste estudo foi desenvolvido um índice de qualidade de água, utilizando a técnica da estatística multivariada, denominada análise de componentes principais. O estudo de qualidade de água considerou as seguintes características físico-químicas: potencial hidrogeniônico, condutividade elétrica, sólidos dissolvidos, sólidos suspensos, turbidez, demanda bioquímica de oxigênio, nitrogênio amoniacal, nitrato, nitrito, fósforo total, cálcio, magnésio, ferro, sódio, potássio, zinco, cobre e coliforme total. A análise de componentes principais proporcionou a redução de 13 características em duas componentes que explicaram 91,2% da variância total. A primeira componente, contendo 61,95% da variância total, representa o processo de mineralização das águas das microbacias e a segunda componente, com 29,25% da variância, é alusiva à contaminação orgânica. Em seguida, estas características foram utilizadas para desenvolver um índice de qualidade de água, que foi melhor no período de chuva. As águas superficiais e subterrâneas das microbacias foram adequadas ao consumo humano, após tratamento convencional, ao longo de todo o período estudado, exceto a água subterrânea da microbacia coberta com pastagem no período de estiagem. Palavras-chave: estatística multivariada, análise de componentes principais, qualidade da água, pastagem, floresta, cafeeiro.
Paula, Renata Ramos Rodrigues de. "Análise comparativa de modelos de estatística multivariada aplicados à previsão de níveis de poluentes atmosféricos." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/3/3137/tde-12042017-101313/.
Full textThe present study aims to compare the performance of the multivariate statistical models Multi-layer Perceptron Neural Networks, Random Forests and Support Vector Machine applied to the prediction of daily maximum concentrations of groundlevel ozone in the Metropolitan Area of São Paulo (MASP), characterized by the high population density and the intense economic activity, where the air quality is mostly affected by high ozone levels. Both regression and classification models were applied. In the classification cases, two more models were applied: Linear Discriminant Analysis and Fisher Discriminant Analysis. The models were constructed using a database containing meteorological variables and daily maximum ozone concentration values, which were provided by the Environmental Agency of São Paulo State (CETESB). Given the great importance and complexity of the process of ozone formation in the troposphere, the University of São Paulo (USP) and CETESB have made studies in this area since 1999 and developed a prediction model based on neural networks, which was implemented by CETESB. The present study is a continuation of the previous one and contains the following innovations regarding the methodology and expected results: (1) comparison with other models such as support vector machines, random forests and discriminant analysis; (2) use of a wider and up-to-date database, which improves the representativeness of the models; (3) the models took into acount the new legislation, State decree 59113 of 04/23/2013, that establishes new air quality standards for ozone. Although none of the classification models had a good performance, the regression models yielded better than expected results. The multi-layer perceptron model was the one with higher performance in the prediction of daily maximum ozone concentrations based both on hourly averages and on eight-hour moving averages, which yielded correlation coefficients of 0.867 and 0.891 respectively.
Fokoue, Harold Hilarion. "Emprego de estatística multivariada no estudo quimiossistemática da família Asteraceae e da sua tribo Heliantheae." Universidade de São Paulo, 2010. http://www.teses.usp.br/teses/disponiveis/46/46135/tde-12082013-152437/.
Full textThis work analyse the occurrence of 12 classes of substances (monoterpenes, sesquiterpenes, sesquiterpene lactones, diterpenes, triterpenes, coumarins, flavonoids, polyacetylenes, Benzofurans, benzopyrans, acetophenones and phenylpropanoids) in the Asteraceae family and its Heliantheae tribe. This study intends to demonstrate the existence of correlations in the production of secondary metabolites in lower taxonomic levels (tribes, subtribes and genera). We used a database of about 36,000 occurrences of the main substances isolated from the plant family. The study of chemical equilibrium in the production of secondary metabolites was done using Multiple Linear Regression. The affinities between the groups based on their chemistry were investigated by various methods such as principal component analysis, Cluster and cladistic analysis. There was also the average degree of oxidation of various metabolites and their usefulness as a tool in chemotaxonomic analysis. It was possible to show the existence of a balance in the production of 12 classes of metabolites in the levels of the tribes and subtribes. But the level of the genus balance was found moderate. It was also possible to show the existence of an oxidative equilibrium in various levels (tribes, subtribes). The level of genus balance was not found using the parameter oxidation step. We could group some of the subfamilies of Asteraceae according to Bremer and the subtribes of Heliantheae according to Stuessy using the principal component analysis and Cluster Analysis
Heil, Jonilson. "Emprego da estatística multivariada como proposta para o cálculo do valor venal e tributação imobiliária." reponame:Repositório Institucional da UFPR, 2013. http://hdl.handle.net/1884/30480.
Full textSouza, Elderlei de Jesus Pita. "APLICAÇÃO DA ESPECTROSCOPIA RAMAN E ESTATÍSTICA MULTIVARIADA NO ESTUDO QUANTITATIVO DE MOLÉCULAS DE INTERESSE BIOTECNOLÓGICO." Instituto de Ciências da Saúde, 2017. http://repositorio.ufba.br/ri/handle/ri/25291.
Full textMade available in DSpace on 2018-02-05T17:47:43Z (GMT). No. of bitstreams: 1 Dissertação- introdução_ICS_ Elderlei de Jesus Pita Souza.pdf: 4255306 bytes, checksum: 7ce3bb9114f768ee0e41c48c60f82a04 (MD5)
A análise, monitoramento e detecção de substâncias presentes em meios de produção, assim como a determinação de suas concentrações são fatores de grande importância em processos biotecnológicos, permitindo, por exemplo, estudo de otimização de processos metabólicos de microorganismos. Contudo, o nível de complexidade e a grande incerteza, associados aos resultados de alguns métodos, limitam seu uso e reduzem o grau de confiabilidade dos mesmos. Neste cenário, a espectroscopia de espalhamento Raman com base em suas diversas vantagens como a capacidade de obtenção de espectros de amostras em qualquer estado físico e condição de temperatura e pressão, associado à ideia de “impressão digital” espectral das substâncias, apresenta-se como proposta de técnica para as demandas mencionadas. No entanto, devido à sua natureza de técnica semiquantitativa, requer ferramentas matemáticas adequadas para o correto tratamento e interpretação de seus dados. O uso de técnicas estatísticas multivariadas, como a Análise de Componentes Principais (PCA) e a Regressão Linear Multivariada (MLR) permitem o uso dos dados espectrais na sua totalidade, obtendo-se o máximo de informações neles contidas. O presente trabalho aplica estes métodos a dados oriundos de espectros Raman obtidos de diversas soluções aquosas de nitrato de sódio, glicerol e raminose (substâncias de interesse biotecnológico), em diferentes concentrações¸ relacionando as amplitudes de cada um destes espectros às suas proporções presentes nas misturas. Assim, foram criados modelos de regressão para a calibração destes dados, utilizando as intensidades espectrais como preditores e as respectivas concentrações como respostas, sendo realizados testes de predição e validação destes mesmos modelos. Também foi realizado o préprocessamento matemático destes dados através do PCA, identificando as variáveis de maior relevância e filtrando parte do ruído presente nos espectros. Foram também realizadas avaliações qualitativas dos mesmos espectros, discutindo-se suas principais características. A análise dos resultados obtidos confirmou a capacidade do método em identificar a presença das substâncias em questão nas misturas testadas, além de determinar suas respectivas concentrações através de seus espectros Raman. A Análise de Componentes Principais também mostrou-se eficiente no tratamento dos dados, possibilitando, inclusive, a identificação de padrões espectrais entre as amostras, nem sempre perceptíveis sem o adequado tratamento matemático.
Sousa, Rodney Carvalho Afonso de. "Análise estatística de dados composicionais." Master's thesis, Universidade de Aveiro, 2016. http://hdl.handle.net/10773/22501.
Full textDados composicionais são dados multivariados em que cada unidade amostral corresponde a um vetor cujas componentes são números reais estritamente positivos, que representam proporções de um todo, e contêm apenas informação relativa, presente nas razões entre as suas componentes. Esse vetor está sujeito à restrição da soma das componentes ser igual à uma constante. Podemos encontrar dados composicionais em muitos campos científicos, sendo que esses dados geralmente aparecem na forma de proporções, percentagens, concentrações, frequências absolutas ou relativas. Do ponto de vista geométrico, os dados composicionais pertencem a um subespaço real chamado simplex, sobre o qual se define uma geometria, chamada Geometria de Aitchison. Atualmente, a análise de dados composicionais baseia-se na análise estatística de log-razões (logratios) entre componentes (ou partes) das composições. Neste trabalho, aplicamos técnicas exploratórias de dados composicionais na análise de um conjunto de dados do espaço dos codões referentes às regiões codificantes do ADN de 31 espécies distribuídas entre os cinco reinos de seres vivos: 16 animais, 4 plantas, 5 bactérias, 3 fungos e 3 protozoários. A principal ferramenta de análise utilizada é o biplot, que consiste numa representação gráfica que nos permite a visualização simultânea dos padrões existentes nas observações e nas variáveis de um conjunto de dados multivariado.
Compositional data are multivariate data consist of vectors of positive values summing to unit. They represent parts of a whole and contain only information presents in the ratios of its components. We can find compositional data in many scientific areas. This kind of data usually appear as proportions, percentages, concentrations, absolute or relative frequencies. From a geometrical point of view, compositional data belong to a real subspace called simplex, where there is defined a specific geometry, called Aitchison geometry. Currently, the compositional data analysis is based on statistical analysis of log-ratios between components of the compositional vector. In this work, we have used exploratory techniques of compositional data analysis to investigate patterns in a data set of the codon space concerning coding regions of DNA of 31 species distributed among the five kingdoms of living: 16 animals, 4 plants, 5 bacteria, fungi and 3 protozoa. The codon space is formed by the relative frequency of the four nucleotides in the three codon positions. The main analysis tool used is the biplot which is a graphical representation that allows the simultaneous visualization of patterns for the observations and variables of multivariate data.
MAPA, Felipe Brito. "Geoquímica multielementar de sedimentos de corrente no estado de São Paulo: abordagem através da análise estatística multivariada." reponame:Repositório Institucional da CPRM, 2015. http://rigeo.cprm.gov.br/xmlui/handle/doc/15960.
Full textApproved for entry into archive by Roberta Silva (roberta.silva@cprm.gov.br) on 2016-05-12T17:44:25Z (GMT) No. of bitstreams: 1 MESTRADO_FELIPEMAPA.pdf: 29181013 bytes, checksum: fb1ecaa272e4e1d6efd0b96d8647853c (MD5)
Approved for entry into archive by Roberta Silva (roberta.silva@cprm.gov.br) on 2016-05-12T17:44:42Z (GMT) No. of bitstreams: 1 MESTRADO_FELIPEMAPA.pdf: 29181013 bytes, checksum: fb1ecaa272e4e1d6efd0b96d8647853c (MD5)
Made available in DSpace on 2016-05-12T18:25:12Z (GMT). No. of bitstreams: 1 MESTRADO_FELIPEMAPA.pdf: 29181013 bytes, checksum: fb1ecaa272e4e1d6efd0b96d8647853c (MD5) Previous issue date: 2015
Cerqueira, Eduardo Osorio de. "Desenvolvimento e aplicações de modelos de calibração multivariada em espectroanalitica e eletroanalitica." [s.n.], 2002. http://repositorio.unicamp.br/jspui/handle/REPOSIP/249336.
Full textTese (doutorado) - Universidade Estadual de Campinas, Instituto de Quimica
Made available in DSpace on 2018-08-01T22:34:14Z (GMT). No. of bitstreams: 1 Cerqueira_EduardoOsoriode_D.pdf: 8889961 bytes, checksum: 556dbd484aca448c9c56068675ffee27 (MD5) Previous issue date: 2002
Doutorado
Arana, Andréa Araújo. "Aerossóis atmosféricos na Amazônia: composição orgânica e inorgânica em regiões com diferentes usos do solo." Instituto Nacional de Pesquisas da Amazônia, 2014. http://bdtd.inpa.gov.br/handle/tede/2258.
Full textMade available in DSpace on 2017-05-22T15:00:55Z (GMT). No. of bitstreams: 2 Andréa Araújo Arana.pdf: 11629380 bytes, checksum: 6ed68bb35bb082b890cd7b6dc4c27f1b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2014-05-01
This work showed the complexity of the organic and inorganic composition of aerosol from Amazônia e its interactions with biogenic processes in the forest. We investigated the sources and processes that regulate the organic and inorganic components of aerosol particles from Amazônia based on long term continuous measurements in two regions: one perturbed by land use change, in Porto Velho/RO, and one of pristine tropical rainforest, Rebio Cuieiras/AM. For the first time, the elemental concentration of the aerosol from Amazônia was obtained using energy dispersive x-ray fluorescence – EDRF. A careful calibration and optimization of the EDXRF Epsilon 5, PANalytical, was performed. This task involved the production of calibration standards for element P, besides the use of commercially available standards from MicroMatter. A new methodology was developed to calculate the detection limit for each element based on a non-linear fit of the standard deviation for different masses, and was compared to the usual method using the background noise in blank filter measurements. Both methods gave similar detection limits, with higher values around 45 ng cm -2 (Na, Mg e Cd), most values below 10 ng cm -2 , and some very low values as 3 ng cm -2 (P, S, Cl, K, Ca, Cr, Fe e Cu). A detailed and extensive comparison with other EDXRF spectrometers, one from Antwerp University and another from CETESB, and other analytical methods, PIXE and Ion Chromatography, was performed. The comparison between PIXE and EDXRF showed statistically significant regressions for most elements, as well as the comparison with the other EDXRF, thus indicating that the calibration and fine-tuning of the LFA EDXRF were appropriate. The comparison with the Ion Chromatography from PUC-Rio was used to quantify the particle self-attenuation corrections necessary for light elements. About the seasonal variation of aerosol mass concentration at Rebio Cuieiras, the average concentration was very low, 9.5 ± 4.7 μg m -3 (wet season) and 13.4 ± 4.9 μg m -3 (dry season), with a very clear seasonal cycle. The equivalent BC showed a stronger seasonality with high concentrations in the fine mode, 0.57 ± 0.38 μg m -3 , during the dry season, and very low, 0.05 ± 0.02 μg m -3 , during the wet season. In Porto Velho, average PM10 was 8.8 ± 4.2 μg m -3 (wet) and 45 ± 42 μg m -3 (dry), but with mean values reaching as high as 200 μg m -3 as during the dry season of 2010, when EBC reached values of 3.6 ± 3.6 μg m -3 . During the wet season, the EBC average concentration was 0.5 ± 0.4 μg m -3 . That means that, even in the absence of large scale biomass burning, land use change and local pollution interfere on the concentration of aerosol in anthropogenic impacted Amazon regions, as observed by Artaxo et al. (2013). For measuring the carbonaceous aerosols, the EUSAAR_2 was chosen after an comparison exercise. For validating the measurements, a comparison with the University of Ghent, Belgium, was performed and showed that our calibration with sucrose, the determination of the transit time and the data processing is correct. The average concentration of OC at Rebio Cuieiras was 6.3 ± 3.1 μ g m -3 (dry) e 1.8 ± 0.7 μ g m -3 (wet), and for EC it was 0.6 ± 0.3 μg m -3 (dry) and 0.18 ± 0.08 μg m -3 (wet). In general, our results indicate that this area is still pristine but with some impact of long range biomass burning transport during the dry season. At Porto Velho, the average OC concentration was 12 ± 5 μg m -3 (dry) and 5.0 ± 0.5 μg m -3 (wet), and for EC was 0.9 ± 0.5 μg m -3 (dry) e de 0.5 ± 0.3 μg m -3 (wet). The presence of anomalous brown carbon absorption was analyzed but it was not possible to quantify its presence in the atmospheric aerosol in the Amazon region. The increase in mean atmospheric concentrations of OC and EC from the wet to the dry season was studied for each volatility level. Results showed a higher increase of the OC2, OC3, EC2 and EC3 (intermediate volatility) at Rebio Cuieiras, while at Porto Velho there was a higher increase of OC1 and EC1, as it is more subject to fresh biomass burning. Using positive matrix factorization and absolute principal factor analysis, a source apportionment of particulate matter was performed. The novelty in this study was the inclusion of the organic and inorganic components (and not only the elemental composition). The PMF analysis did not show self-consistent results and, indeed, there is a scientific debate nowadays on the source apportionment tools by the European Comission / Joint Research Centre.
Este trabalho mostrou a complexidade da composição orgânica e inorgânica do aerossol da Amazônia e sua interação com processos biogênicos da floresta. Investigamos as fontes e processos que regulam as componentes orgânica e inorgânica dos aerossóis atmosféricos na Amazônia, a partir de medidas contínuas e de longo prazo em duas regiões: uma área perturbada por mudanças no uso do solo, Porto Velho/RO e uma área com floresta tropical não perturbada, Rebio Cuieiras/AM. Pela primeira vez, a concentração elementar do aerossol da Amazônia foi determinada utilizando a técnica de fluorescência de raios X por dispersão de energia – EDXRF. Foi realizado um trabalho de calibração e otimização do instrumento de EDXRF Epsilon 5, da PANalytical, que envolveu a produção própria de padrões de calibração para o elemento P, além da utilização de padrões comerciais da MicroMatter. Um novo procedimento foi desenvolvido para calcular os limites de detecção para cada elemento utilizando o ruído de fundo em medidas amostradas com método alternativo de regressão não linear. Os resultados da comparação entre as concentrações medidas pelos sistemas PIXE e EDXRF se mostraram estatisticamente significantes para a maioria dos elementos, assim como a comparação com a CETESB e Universidade de Antuérpia, Bélgica, indicando que a preparação dos padrões e o procedimento de calibração desenvolvidos neste trabalho foram apropriados. A comparação entre as medidas do LFA EDXRF e Cromatografia Iônica da PUC-Rio foi utilizada para a derivação das correções de autoabsorção de partículas para elementos leves. Sobre os ciclos sazonais e interanuais das concentrações em massa do aerossol na região Amazônica, na Rebio Cuieiras, a concentração média de PM 10 foi muito pequena, 9,5 ± 4,7 μg m -3 durante a estação chuvosa e 13,4 ± 4,9 μg m -3 na estação seca. O EBC (black carbon equivalente) apresentou uma forte sazonalidade, com elevadas concentrações na fração fina de 0,57 ± 0,38 μg m -3 (seca) e de 0,05 ± 0,02 μg m -3 (chuvosa). Em Porto Velho, o PM 10 foi de 8,8 ± 4,2 μg m -3 (chuvosa) e 45 ± 42 μg m -3 (seca), podendo chegar a 200 μg m -3 , como na estação seca de 2010. A presença de EBC chegou a valores de 3,6 ± 3,6 μg m -3 . Na estação chuvosa a concentração média foi 0,5 ± 0,4 μg m -3 . Mesmo na ausência das queimadas em larga escala, as mudanças no uso do solo e a polução local interferem nas concentrações do aerossol em regiões impactadas antropicamente na Amazônia, como observado na literatura. Para medidas do aerossol carbonáceo, o protocolo escolhido foi o EUSAAR_2, por ser mais indicado ao estudo de aerossóis remotos. A intercomparação com o instrumento da Universidade de Ghent, Bélgica, conclui que nosso processo de calibração externo com sacarose, determinação do transit time e o processamento dos dados estão corretos. A concentração média de OC (carbono orgânico) na Rebio Cuieiras foi de 6,3 ± 3,1 μg m -3 (seca) e 1,8 ± 0,7 μg m -3 (chuvosa), para EC (carbono elementar) foi de 0,6 ± 0,3 μg m -3 (seca) e 0,18 ± 0,08 μg m -3 (chuvosa). De maneira geral, os resultados demonstram que esta é uma área ainda sob condições preservadas, porém com algum impacto de transporte a longa distância de emissões de queimadas durante a estação seca. Em Porto Velho, a concentração média de OC foi de 12 ± 5 μ g m -3 (seca) e 5,0 ± 0,5 μ g m -3 (chuvosa), e EC foi de 0,9 ± 0,5 μg m -3 (seca) e de 0,5 ± 0,3 μg m -3 (chuvosa). Analisou-se a questão da presença de absorção de radiação anômala por brown carbon, mas não foi possível quantificar a sua presença no aerossol atmosférico da região amazônica, em parte devido às incertezas inerentes nas medidas. Avaliou-se o aumento da concentração atmosférica média durante a estação seca para cada nível de volatilidade do carbono e os resultados mostraram um aumento maior das componentes OC2, OC3, EC2 e EC3 (volatilidade medida) na Rebio Cuieiras enquanto em Porto Velho a estação de queimadas trouxe um aumento das componentes OC1 e EC1, caracterizando queima de biomassa fresca, pela sua baixa volatilidade. Por meio da PMF (fatorização de matriz positiva) e APFA (análise de fatores principais absoluta) foram identificadas as fontes do material particulado. A diferença deste estudo está no fato de que o carbono orgânico e carbono elementar (e não apenas a composição química elementar) foram incluídos. O modelo PMF não atendeu às expectativas de ser um modelo de fácil utilização e robusto, ao contrário do APFA. Na Rebio Cuieiras foram identificados três fatores: fator (1) emissão de queimadas, com os elementos traçadores S, K, Br associados ao PM10, EBC, OC e EC; fator (2) poeira do solo proveniente do deserto do Saara, devido aos elementos traçadores, Al, Si, Ca, Ti, Fe e fator (3) indicou uma mistura de aerossol biogênico, elementos P, e sal marinho, elemento Cl. Em Porto Velho, o fator (1) com a emissão de solo associado ao EC, o fator (2) traçadores característicos de queimada, e o fator (3) emissão biogênica.
Pereira, João Eduardo da Silva. "Aplicação de técnicas estatísticas à integração de dados geológicos, geofísicos na região do município de Santa Maria, RS, Brasil." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2009. http://hdl.handle.net/10183/15737.
Full textThe present work was prepared at Santa Maria region, southern Brazil, Rio Grande do Sul State. Which the objective to evaluate the behavior of geophysics variables of airborne gamma-ray and magnometry from Survey of Brazil/Companhia de Pesquisas de Recursos Minerais in Camaquã Project./CPRM 1973 in function of different geologic units, sedimentary and volcanic (acid and basic types). Through the use of the Statistca 7.1 computational support, licensed to UFSM, were done, unvaried and multivariate statistical analysis in geophysics data, associated to different groups of volcanic rocks , belonged the central depression of Rio Grande do Sul state and/or to volcanic rocks belonged to Serra Geral formation at border of Paraná Basin Inside this context was possible to define characteristic values from mean standard error and confidence interval for all variables in each geologic formation, to carryout, through mean comparison, to distingue different geologic formation by statistical analysis of geophysics data. The variables behavior, when evaluated in relation to geographic coordinates of the Universal Transverse Mercator system, presented spatial dependency that following polynomial models of second order. The multivariate statistical analysis of standardized geophysics data by factorial analysis was a efficient toll to reduce the number of variables of the problem and allowed to develop a efficient classification system for identify different kinds of conjunct behavior of the variables, respected the characteristc of spacial non stationary in mean and variance.
Goes, Mendes Wallace. "Mercado automotivo no Grande Recife e Caruaru: análise atual e temporal." Universidade Federal de Pernambuco, 2011. https://repositorio.ufpe.br/handle/123456789/5495.
Full textEsta dissertação trata-se da construção, modelagem e análise de um conjunto de informações acerca do mercado automotivo do Grande Recife e Caruaru, que visa auxiliar e subsidiar os principais agentes envolvidos, tais como: concessionárias, montadoras e consumidores. Para atingir o objetivo geral, foram aplicadas ferramentas de pesquisa de mercado, técnicas estatísticas inferenciais e análises multivariadas. O trabalho inicia-se com um breve histórico do automóvel, ressaltando a evolução do mercado automotivo e as principais tecnologias do século XXI, de forma, a esclarecer e permitir uma melhor compreensão do setor automotivo. Em seguida, são apresentados e detalhados algumas estatísticas e indicadores do estado do Pernambuco e do Brasil, visando mostrar o atual comportamento do mercado automotivo nacional e seu contexto no mundo. Na pesquisa de mercado realizada no Grande Recife e Caruaru apresenta-se o perfil e o comportamento dos consumidores de automóveis, fidelidade das marcas, estimativa do mercado futuro, a evolução e tendências do comportamento do consumidor nos anos de 2003, 2005 e 2009. Na última parte do trabalho utilizou-se a estatística multivariada, mais especificamente a análise fatorial e escalonamento multidimensional, para o estudo de todas as variáveis em conjunto comuns nas três pesquisas. O uso da técnica da análise fatorial possibilitou a redução para treze variáveis e seis fatores o conjunto de dados estudado, esclarecendo-se o significado de cada fator para o estudo. A técnica do escalonamento multidimensional foi aplicada pontualmente para algumas variáveis, apresentou resultados relevantes para duas e três dimensões, além de identificar o perfil do consumidor para cada dimensão. Tais informações podem servir para auxiliar as concessionárias, montadoras e consumidores à tomada de decisões sobre o mercado automotivo
OLIVEIRA, Rodrigo Alves de. "Algoritmos para determinação do número de grupos em estudos de formas planas." Universidade Federal de Pernambuco, 2016. https://repositorio.ufpe.br/handle/123456789/17314.
Full textMade available in DSpace on 2016-07-11T16:55:56Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Rodrigo_CD.pdf: 1954769 bytes, checksum: 1848fe54bf3979180fcfc4966a04b492 (MD5) Previous issue date: 2016-02-05
CAPES
Análise de formas planas é uma área de conhecimento bastante útil e sólida para lidar com estudos de estruturas de objetos e informação geométrica. A fim de descrever objetos bidimensionais é necessário especificar um sistema de coordenadas a qual deve ser invariante sob locação, escala e rotação da configuração tal como as coordenadas de Kendall. E uma versão linearizada do espaço de formas são as coordenadas tangentes, esta pertence ao espaço Euclidiano, portanto, toda literatura de análise multivariada pode ser utilizada. Em diversas ocasiões é necessário agrupar conjuntos de dados de tal maneira que se tenha grupos com características mais homogêneos entre si. Para tanto Amaral et al. (2010a) desenvolveu o algoritmo K-médias para lidar com análise de formas. Devido as desvantagens deste algoritmo, Jayasumana et al. (2013) propôs o algoritmo Kernel K-médias. Estes dois algoritmos dependem da escolha do número de grupos, K. E para o segundo, deve-se estimar o parâmetro de largura de banda. Em situações em que não se conhecem os rótulos dos grupos, a escolha de um valor apropriado para K é difícil. Para resolver esse desafio, medidas de validade tentam determinar como precisamente se retratam os grupos dos dados. No entanto, diversas medidas de validade surgem, e diferentes medidas geralmente produzem resultados discrepantes. Esta dissertação introduz métodos para computar o número de grupos em um determinado conjunto de dados que lidam com a natureza das estruturas planas. Os métodos propostos são baseados nas medidas de validade Silhoueta, Davies-Bouldin e os Resíduos Procrustes. Gerou-se amostras de duas populações da distribuição Bingham complexa a qual possui suporte na esfera unitária; e também amostras de duas populações com espaço nos marcos. Considera-se vários cenários com alta e baixa concentração dos dados. Percebe-se que os índices para coordenadas tangentes encontram corretamente o número de grupos para dados de alta concentração assim como os índices modificados para coordenadas de Kendall. Já em situações com baixa concentração os índices para coordenadas tangentes não funcionam bem, portanto, não identificam o número correto de grupos, ao contrário, os índices com natureza própria de formas planas conseguem estimar o verdadeiro número de grupos para os dados simulados. Os índices mais apropriados são o Procruste Residual e o Davies-Bouldin ajustado pela segunda vez. Análise de dados reais mostra que os índices existentes para coordenadas tangentes e os índices modificados para coordenadas de Kendall estimam o número correto de grupos.
Statistical Shape Analysis is a useful and solid area of knowledge for deal objects structures study and geometrical information. In order to describe two-dimensional objects you must specify a coordinate system which must be filter out translation, rotation and scale information of the setting as the Kendall coordinates. One linearized version of the shape space in the vicinity of a particular point of shape space is the tangent coordinates, that belongs to the Euclidian space, so all multivariate analysis may be used. On several occasions it is necessary to group data sets in such a way that it has groups with more homogeneous characteristics together. Therefore, Amaral et al. (2010a) developed the K-means algorithm to deal with shape analysis. Because of the disadvantages of this algorithm, Jayasumana et al. (2013) proposed Kernel K-means algoritm. These two algorithms depends on the choice of the number of groups, K. And for second, to estimate the bandwidth parameter. In situations in which there is no known labels groups, the choice of an appropriate value for K is difficult. To overcome this challenge, validity measures attempt to determine how accurately the clusters reflect the data. However, numerous validity measures proliferate, and different measures often produce disparate results. This paper introduces methods to compute the number of groups in a given data set that deal with the nature of the planar shapes. The proposed methods are based on the validity of measures Silhoutte, Davies-Bouldin and Procrustes Residuals. Samples were generated from two populations of complex Bingham distribution which is supported on the unit sphere; and also samples of two populatoin with space in the landmarks. Considered some scenarios with high and low concentration of data. It is noticed that the contents are properly coordinated tangent to the number of groups for high-concentration data, as well as modified indices for Kendall coordinates. Already in situations with low concentration indexes to coordinate tangents do not work well, so do not identify the correct number of groups, by contrast, the indexes with the nature of planar shapes can estimate the true number of groups for the simulated data. The most suitable index are Procrustes Residuals and Davies-Bouldin adapted the second time. Real data analysis shows that the existing index for tangent coordinates and indexes modified to Kendall coordinates estimate the correct number of groups.
Salume, Juliana Nogueira. "Segmentação da base de arrecadação de IPTU em Juiz de Fora através de análise estatística multivariada." Universidade Federal de Juiz de Fora (UFJF), 2008. https://repositorio.ufjf.br/jspui/handle/ufjf/3954.
Full textApproved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-04-03T19:06:41Z (GMT) No. of bitstreams: 1 juliananogueirasalume.pdf: 378263 bytes, checksum: d3168b3f0d9df84c85685706e3e28723 (MD5)
Made available in DSpace on 2017-04-03T19:06:41Z (GMT). No. of bitstreams: 1 juliananogueirasalume.pdf: 378263 bytes, checksum: d3168b3f0d9df84c85685706e3e28723 (MD5) Previous issue date: 2008-02-27
A Prefeitura de Juiz de Fora teve o seu projeto de recadastramento imobiliário aprovado junto ao Programa Nacional de Apoio à Gestão Administrativa e Fiscal dos Municípios Brasileiros (PNAFM). Esse recadastramento é uma das ações necessárias ao Cadastro Imobiliário para a futura implantação do Cadastro Multifinalitário. Um tratamento estatístico do Cadastro Imobiliário possibilitará a geração de informações que podem dar suporte à tomada de decisões da administração pública em Juiz de Fora, apoiando inclusive o recadastramento que terá início em fevereiro de 2008. Este trabalho pretende tratar estatisticamente a base de dados do cadastro imobiliário (197.230 unidades imobiliárias) do município de Juiz de Fora através do estudo e da aplicação de técnicas de análise estatística multivariada. O tratamento estatístico possibilitará tanto uma redução do universo de variáveis, quanto uma análise de segmentação das unidades de arrecadação em agrupamentos de perfis. Essa redução da dimensionalidade do cadastro é capaz de gerar informações confiáveis para o gestor público que auxiliem em análises futuras de mensuração do potencial de arrecadação, adotando uma nova modelagem de cálculo que considere as similaridades dos imóveis.
The City Hall of Juiz de Fora had its Project of new property registration approved by the National Program of Support to the Administrative and Fiscal Management of the Brazilian Cities (PNAFM). This new registration is one of the necessary actions to Property Registration for the future implantation of Multiple Purposes Registration. A statistical treatment of Property Registration will make possible the generation of information that can give support to the decisions of the public administration in Juiz de Fora, also supporting the new registration that will have beginning in February of 2008. This work statistically treats the database of property registration (197,230 property units) of the city of Juiz de Fora through the study and application of multivariate analysis statistics techniques, more specifically the factor analysis and the cluster analysis. The statistical treatment will make possible such a reduction of the universe of variables, as an analysis of segmentation of the tax units in groupings of similar profiles. This reduction of the dimension of registration is capable to generate trustworthy information for the public manager. It is hoped that they assist in the future analyses of measuring the tax potential, adopting a new modeling calculation that considers the similarities of the properties.
Massaretto, Isabel Louro. "Características químicas e nutricionais de arroz-preto, vermelho e selvagem e comparação por análise estatística multivariada." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/9/9131/tde-04062014-152239/.
Full textRice (Oryza sativa L.) is mostly consumed in its milled form; however there is an increasing demand for whole non-pigmented and pigmented rice, such as black, red, and wild rice, which the latter belongs to the genus Zizania. Pigmented rice has particular nutritional composition and sensory characteristics, and in addition high amounts of phenolic compounds, which not only confer color but also has been linked to beneficial effects on human health. To date, little is known about the nutritional and bioactive contents of these grains. The aim of this study was to compare the chemical composition, including the total phenolic compounds (TPC), the majoritarian polyphenols and the antioxidant radical efficiency of the following accessions: three black rice from the state of São Paulo, two black rice from the state of Rio Grande do Sul, eleven black rice genotypes from Santa Catarina state, nine red rice from those states and six wild rice, imported from Canada and marketed in São Paulo. All samples were cultivated and/or marketed from 2009 to 2011. Data were evaluated by uni- and multivariate statistical analysis. The effect of cooking on the stability of TPC and antioxidant capacity was also evaluated. In addition, a preliminary comparison of γ- oryzanol, tocopherols and tocotrienols was carried out between two groups: seven black rice and four red rice samples, all of them cultivated in 2013. Based on chemical results and multivariate statistical analysis it was possible to cluster the various types of rice in four groups, significantly different among themselves: wild rice, black long grain rice, black medium grain rice, and red rice. Wild rice was the most dissimilar group due to its highest contents of protein (12.9 g/100g) and α-linolenic acid (0.12 g/100g), and the lowest amounts of lipids (0.9 g/100g), TPC, and antioxidant capacity. Black long grain rice was characterized mainly by its high contents of TPC, especially anthocyanins and by its elevated antioxidant capacity. Cyanidin-3-O-glycoside was identified by HPLC-DAD-MS/MS as being the main anthocyanin. The protein and lipid mean contents in these groups were respectively, 9.8 and 3.6 g/100g and were higher than the amounts in the other next two types of rice. The black medium grain rice and red rice were similar in terms of nutrient composition and TPC. The average amount of protein in both groups was about 8.8 g/100g. However, in black rice prevails anthocyanins, while in red rice coloration is provided by proanthocyanidins, which results in differences in antioxidant activity. Medium and long black grain rice showed a 2-fold higher antioxidant activity than red rice. These findings indicate that the high content of anthocyanins, independent of the grain shape, is responsible for the high antioxidant capacity in black rice. The multivariate analysis demonstrated that the grain shape is fundamental to differentiate black rice in terms of nutrient composition, like protein and lipids, but not in relation to amounts of phytochemicals and antioxidant capacity. ORAC was more suitable than DPPH· methodology to evaluate the antioxidant activity of black rice, due to its high correlation to anthocyanin contents. Conversely, DPPH· can be a consistent method to evaluate antioxidant capacity of red and wild rice. Cooking resulted in significant loss on TPC contents and on the antioxidant capacity of black and red rice. In black rice, 26% of TPC was reduced on average, while the loss of anthocyanins was 50%. The reason may be that during cooking, part of the anthocyanins is converted into protocatechuic acid, which is quantified as TPC. The reduction in TPC in red rice was 60%, possibly due to a partial insolubilization of proanthocyanidins. In wild rice, cooking caused no significant loss of TPC. The antioxidant capacity of different types of cooked rice was dependent on the method used, being strongly correlated with the remaining levels of TPC. Thus, black rice even after cooking showed the highest antioxidant capacity, followed by red and wild rice. From a preliminary evaluation, the contents of lipophilic phytochemicals, γ-orizanol and vitamin E homologues were similar in black and red rice, which indicates that the contents of these compounds are not dependent of the pericarp color.
Brandão, Flávia Janaina Carvalho [UNESP]. "Caracterização de um latossolo em sistemas agroflorestais e mata com o uso de análise estatística multivariada." Universidade Estadual Paulista (UNESP), 2013. http://hdl.handle.net/11449/110307.
Full textOs impactos negativos causados pela agricultura nociva aos aspectos de qualidade e da sustentabilidade das propriedades físicas, químicas e biológicas inerentes ao solo. Tendo em vista a existência de sistemas de cultivos alternativos, a exemplo dos agroflorestais. Objetivou-se, neste trabalho, avaliar três sistemas com agroflorestas em diferentes épocas de implantação, com inclusão de espécies frutíferas e culturas anuais para subsistência, tendo como referência uma Mata Nativa sob a mesma vegetação típica de Cerrado-Cerradão. Para isso, coletaram-se amostras de um Latossolo Vermelho Amarelo, em duas profundidades 0-0,20 e 0,20-0,40m, para avaliação dos atributos químicos pH, cálcio, magnésio, fósforo, potássio, hidrogênio + alumínio e matéria orgânica, bem como, macro e microporosidade, densidade do solo, teores de silte, areia e argila para classificação textural do solo, e resistência à penetração. Os resultados foram submetidos à análise descritiva e análise multivariada com estudo de componentes principais, que possibilitou caracterizar por técnicas de agrupamentos, três grupos distintos (G1, G2 e G3), o grupo G1 tendo agrupado as variáveis do solo com Mata Nativa, G2 agruparam-se (SAF 1 e SAF 2 com 7 e 4 anos de implantação respectivamente), e G3 (SAF 3, com 3 anos). As variáveis que melhor responderam à caracterização por meio de análise de componentes principais foram: matéria orgânica, teores de magnésio, cálcio, macroporosidade, volume total de poros e densidade do solo. Os SAFs 1 e 2, com maior tempo de implantação, apresentaram melhores características físicas e químicas do solo em relação à área com Mata Nativa
The negative impacts caused by agriculture harmful aspects of quality and sustainability of physical, chemical and biological properties inherent to the soil. Given the existence of alternative cropping systems, such as agroforestry. The objective of this study was to evaluate three agroforestry systems in different periods of deployment, with the inclusion of fruit trees and annual crops for subsistence, with reference to a native bush under the same typical Cerrado vegetation - Savana. For this, samples were collected from a Typic in two depths 0-0.20 and 0.20-0.40 m for evaluation of chemical properties pH , calcium, magnesium , phosphorus, potassium , hydrogen and aluminum and matter organic as well as macro and micro porosity , bulk density , silt, sand and clay to soil textural classification , and penetration resistance. The results were submitted to descriptive analysis and multivariate analysis with the study of major components , which enabled characterization techniques for groups , three groups ( G1 , G2 and G3 ) , G1 has grouped the variables soil with native plants , grouped G2 up ( SAF SAF 1 and 2 with 7 and 4 year deployment respectively) , and G3 ( SAF 3 , 3 years) . The variables that best responded to the characterization by means of principal component analysis were organic matter content of magnesium, calcium, macroporosity, total pore volume and density. The SAFs 1 and 2, with longer implantation showed better physical and chemical characteristics of the soil in relation to the area with native plants
Brandão, Flávia Janaina Carvalho. "Caracterização de um latossolo em sistemas agroflorestais e mata com o uso de análise estatística multivariada /." Jaboticabal, 2013. http://hdl.handle.net/11449/110307.
Full textBanca: Maria Esmeralda Soares Payão Demattê
Banca: Alexandre Barcellos Dalri
Banca: Maria Teresa Vilela Nogueira Abdo
Banca: Vera Lucia Abdala
Resumo: Os impactos negativos causados pela agricultura nociva aos aspectos de qualidade e da sustentabilidade das propriedades físicas, químicas e biológicas inerentes ao solo. Tendo em vista a existência de sistemas de cultivos alternativos, a exemplo dos agroflorestais. Objetivou-se, neste trabalho, avaliar três sistemas com agroflorestas em diferentes épocas de implantação, com inclusão de espécies frutíferas e culturas anuais para subsistência, tendo como referência uma Mata Nativa sob a mesma vegetação típica de Cerrado-Cerradão. Para isso, coletaram-se amostras de um Latossolo Vermelho Amarelo, em duas profundidades 0-0,20 e 0,20-0,40m, para avaliação dos atributos químicos pH, cálcio, magnésio, fósforo, potássio, hidrogênio + alumínio e matéria orgânica, bem como, macro e microporosidade, densidade do solo, teores de silte, areia e argila para classificação textural do solo, e resistência à penetração. Os resultados foram submetidos à análise descritiva e análise multivariada com estudo de componentes principais, que possibilitou caracterizar por técnicas de agrupamentos, três grupos distintos (G1, G2 e G3), o grupo G1 tendo agrupado as variáveis do solo com Mata Nativa, G2 agruparam-se (SAF 1 e SAF 2 com 7 e 4 anos de implantação respectivamente), e G3 (SAF 3, com 3 anos). As variáveis que melhor responderam à caracterização por meio de análise de componentes principais foram: matéria orgânica, teores de magnésio, cálcio, macroporosidade, volume total de poros e densidade do solo. Os SAFs 1 e 2, com maior tempo de implantação, apresentaram melhores características físicas e químicas do solo em relação à área com Mata Nativa
Abstract: The negative impacts caused by agriculture harmful aspects of quality and sustainability of physical, chemical and biological properties inherent to the soil. Given the existence of alternative cropping systems, such as agroforestry. The objective of this study was to evaluate three agroforestry systems in different periods of deployment, with the inclusion of fruit trees and annual crops for subsistence, with reference to a native bush under the same typical Cerrado vegetation - Savana. For this, samples were collected from a Typic in two depths 0-0.20 and 0.20-0.40 m for evaluation of chemical properties pH , calcium, magnesium , phosphorus, potassium , hydrogen and aluminum and matter organic as well as macro and micro porosity , bulk density , silt, sand and clay to soil textural classification , and penetration resistance. The results were submitted to descriptive analysis and multivariate analysis with the study of major components , which enabled characterization techniques for groups , three groups ( G1 , G2 and G3 ) , G1 has grouped the variables soil with native plants , grouped G2 up ( SAF SAF 1 and 2 with 7 and 4 year deployment respectively) , and G3 ( SAF 3 , 3 years) . The variables that best responded to the characterization by means of principal component analysis were organic matter content of magnesium, calcium, macroporosity, total pore volume and density. The SAFs 1 and 2, with longer implantation showed better physical and chemical characteristics of the soil in relation to the area with native plants
Doutor
Oliveira, Andrea Melo Garcia de. "Análise estatística multivariada de parâmetros de qualidade de leite cru refrigerado no estado de Minas Gerais." Universidade Federal de Minas Gerais, 2008. http://hdl.handle.net/1843/FRPO-7L2QZJ.
Full textDados das análises de leite cru refrigerado de 722 produtores de cinco microrregiões do estado de Minas Gerais foram usados para avaliar, em um espaço multivariado, as associações entre as variáveis estudadas na avaliação da qualidade do leite. Foram consideradas as seguintes variáveis: teores de gordura, proteína, lactose, extrato seco total (EST) e extrato seco desengordurado (ESD); contagem de células somáticas (CCS) e contagem bacteriana total (CBT). A primeira análise de componentes principais mostrou que dos sete componentes principais obtidos a partir da matriz de correlação, três apresentaram variância inferior a 0,7 (autovalor), o que indicou a exclusão de três variáveis (aquelas que possuíam maior correlação com as componentes principais de menor autovalor): EST, ESD e CCS. Optou-se pela exclusão de apenas duas destas variáveis, EST e ESD, pelo fato destas apresentarem alta correlação com teores de proteína e gordura, sendo redundantes. A terceira variável, CCS, não foi excluída por ser considerada, internacionalmente, como um dos parâmetros mais importantes para determinar a qualidade do leite cru. Em seguida, nova análise foi realizada e as associações entre as variáveis puderam ser observadas. Com a aplicação de cada componente foi calculado um escore para classificação dos produtores. Pela análise de agrupamento foi possível formar grupos de acordo com a semelhança na qualidade do leite produzido. Pode-se concluir que a abordagem multivariada dos dados de análise de leite cru é uma boa alternativa para avaliar quais as variáveis mais importantes, para definir associações e agrupar os produtores.
Alves, Luciene Bianca. "Tratamento de dados multivariados por análise de correspondência em dados de idosos de São José dos Campos." Instituto Tecnológico de Aeronáutica, 2007. http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=497.
Full textFLEXA, Roosevelt Tavares. "Determinação estatística dos contatos fluidos em perfis de poço." Universidade Federal do Pará, 2001. http://repositorio.ufpa.br/jspui/handle/2011/5792.
Full textRejected by Irvana Coutinho (irvana@ufpa.br), reason: Indexar os assuntos on 2014-08-07T16:18:34Z (GMT)
Submitted by Cleide Dantas (cleidedantas@ufpa.br) on 2014-08-12T15:14:41Z No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DeterminacaoEstatisticaContatos.pdf: 6587528 bytes, checksum: c394cb002b28d37e58355d6f8383f245 (MD5)
Approved for entry into archive by Irvana Coutinho (irvana@ufpa.br) on 2014-09-22T11:22:23Z (GMT) No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DeterminacaoEstatisticaContatos.pdf: 6587528 bytes, checksum: c394cb002b28d37e58355d6f8383f245 (MD5)
Made available in DSpace on 2014-09-22T11:22:23Z (GMT). No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DeterminacaoEstatisticaContatos.pdf: 6587528 bytes, checksum: c394cb002b28d37e58355d6f8383f245 (MD5) Previous issue date: 2001
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
No interior dos reservatórios petrolíferos, o efeito da gravidade produz naturalmente a segregação dos fluidos presentes. Em razão basicamente das forças capilares não existe uma superfície definida de separação entre cada dois fluidos. No entanto, é comum na engenharia de petróleo admitir-se uma superfície convencional de separação dos fluidos. À essa superfície dá-se o nome de interface fluida ou contato fluido. A obtenção da localização dos contatos fluidos no interior dos reservatórios, como os contatos óleo-água, contatos gás-água e os contatos gás-óleo, sem a interpretação completa dos perfis geofísicos ou a realização dos procedimentos diretos dos testes de formação é um problema de difícil solução para a indústria do petróleo. O posicionamento em profundidade dos contatos pode ser utilizado para a definição dos procedimentos de completação do poço e para o posicionamento do canhoneio nos horizontes produtores dos poços verticais. Temos também a aplicação do mapeamento deste parâmetro, para os projetos e controle da perfuração no caso dos poços direcionais e horizontais, que utilizam tal informação para o posicionamento do eixo do poço no interior da zona de hidrocarboneto no reservatório, a fim de se evitar, principalmente, a produção de água. Este trabalho apresenta uma metodologia para a identificação e posicionamento dos contatos fluidos, através da aplicação da técnica da estatística multivariada, chamada de análise discriminante. Nesta aplicação, faz-se uso direto dos perfis de resistividade (RT), de raios gama natural (RG), de densidade (ρb), de porosidade neutrônica (ΦN), de caliper (Cal) e do perfil de volume de argila (Vcla), como dados de entrada no programa de análise discriminante. Para o caso de depósitos clásticos, com seqüências arenito-folhelho, a análise discriminante fornece ainda a indicação da litologia e as espessuras aparentes dos reservatórios. As curvas de perfis geofísicos aplicadas para a avaliação desta metodologia são provenientes de poços perfurados na bacia do lago Maracaibo, na Venezuela, onde, segundo estudos geológicos, existe a ocorrência de seqüências estratigráficas, com camadas de folhelhos e arenitos, sendo também confirmada a presença de hidrocarbonetos nos poços utilizados neste trabalho.
In oil reservoirs, the effect of gravity naturally produces the fluid segregation. Due to capillary forces, there is no defined surface of separation between two differents fluids. However, it is common in petroleum engineering to admit a conventional fluid separation surface, called fluid interface or fluid contact. The depth location of the fluid contacts (oil-water, gas-water and gas-oil) inside the reservoir rocks, without the complete well log interpretation or the accomplishment of the direct procedures involved in formation tests, is a petroleum industry problem. The knowledge of this parameter can be used for well completation procedures and for positioning perforating services in vertical wells. Another application of fluid contact mapping can be to control the drilling bit in directional and horizontal wells, where such information is used to maintain the well axis inside the hydrocarbon zone in order to avoid water production. We present a methodology which can identify and locate fluid contacts, through an application of the multivariate statistical technique called discriminant analysis. For clastics deposits, with sand-shale sequences, discriminant analysis may provide the indication of lithology and the apparent thicknesses of the reservoirs. The well logs applied for the evaluation of this methodology (resistivity (RT), gamma ray (RG), density (ρb), neutronic porosity (ΦN), caliper (Cal) and shaleness (Vcla) are from wells in Lake Maracaibo, Venezuela.
Mapa, Felipe Brito. "Geoquímica multielementar de sedimentos de corrente no Estado de São Paulo: abordagem através da análise estatística multivariada." Universidade de São Paulo, 2016. http://www.teses.usp.br/teses/disponiveis/44/44142/tde-17062016-144236/.
Full textThis research introduces multi-element geochemical results from stream sediments samples in São Paulo State, obtained from the institutional project entitled \"Low Density Geochemical Mapping in Brazil.\" A total of 1422 stream sediment samples were collected and 32 chemical elements (Al, Ba, Be, Ca, Ce, Co, Cr, Cs, Cu, Fe, Ga, Hf, K, La, Mg, Mn, Mo, Nb, Ni, P, Pb, Rb, Sc, Sn, Sr, Th, Ti, U, V, Y, Zn and Zr) determined by ICP-MS (Inductively Coupled Plasma Mass Spectrometry). Uni-variate and multivariate statistic analysis were used to explore the data. The uni-variate statistics results of processed data provided geochemical background values of the 32 elements for São Paulo State. The geo-referenced analysis of uni-element geochemical distributions showed the geological domains of the area. The two main geological provinces of São Paulo, Paraná Basin and Crystalline Basement, standed out clearly at most of the geochemical distributions. Geological units of larger extension, such as Serra Geral Formation and the Bauru Group were also clearly highlighted. Other geochemical features indicated possible contaminated areas and uncharted geological units. Geochemical multivariate analysis for 24 variables (Al, Ba, Ce, Co, Cr, Cs, Cu, Fe, Ga, La, Mn, Nb, Ni, Pb, Rb, Sc, Sr, Th , Ti, U, V, Y, Zn and Zr) allowed to define the main signatures and existing geochemical associations at São Paulo State and its correlation to the main lithological domains. Q mode cluster analysis provided eight groups of geochemically correlated samples, which reproduced the main geo-referenced geological domains from the State: Crystalline Basement, Passa Dois and Itararé Groups, Serra Geral Formation and Bauru and Caiuá Group. The multi-groups discriminant analysis, statistically attested the classification of groups formed by cluster analysis, and determined Fe, Co, Sc, V e Cu as the main discriminant variables. The principal component analysis, discussed along with the factor analysis by varimax rotation method, provided the main multivariate factors and their elemental associations. The geo-referencing of the factorial values of multivariate scores delimited areas where the elementary associations occur and provided multivariate maps for the state. At last, it was concluded that applied statistical methods are crucial at the treatment, presentation and interpretation of geochemical data. Furthermore, based on an integrated outlook of the results obtained, this study recommends: (1) the application of low density geochemical surveys in the country as a matter of priority, as these surveys are highly effective in defining regional backgrounds and geochemical provinces delineation with metallogenic and environmental interest, and (2) the continuous geological mapping implementation at an adequate scale (greater than 1: 100,000), for areas that indicate possible units not yet mapped in the current geological maps.
Almeida, João Roberto Façanha de. "Análise estatística multivariada e modelo geoquímico inverso no estudo da qualidade da água subterrânea da bacia de Forquilha em Quixeramobim-Ceará." reponame:Repositório Institucional da UFC, 2009. http://www.repositorio.ufc.br/handle/riufc/16832.
Full textSubmitted by João silva (jpauloqxb@gmail.com) on 2016-05-13T16:58:04Z No. of bitstreams: 1 2009_dis_jrfalmeida.pdf: 2408718 bytes, checksum: 320fa6243c5442b04423d7ac7904078a (MD5)
Approved for entry into archive by Marlene Sousa (mmarlene@ufc.br) on 2016-05-17T14:14:54Z (GMT) No. of bitstreams: 1 2009_dis_jrfalmeida.pdf: 2408718 bytes, checksum: 320fa6243c5442b04423d7ac7904078a (MD5)
Made available in DSpace on 2016-05-17T14:14:54Z (GMT). No. of bitstreams: 1 2009_dis_jrfalmeida.pdf: 2408718 bytes, checksum: 320fa6243c5442b04423d7ac7904078a (MD5) Previous issue date: 2009-11-16
The alluvial aquifers in the semi-arid region of Brazil’s Northeast host an important natural water resource for the populations that live in that region, owing to its excellent quality, when compared to the crystalline basement rock aquifers. However, they are fragile resources and are susceptible to processes of degradation of quality by anthropic action, climatic changes or hydrogeological modifications. The objective of this research is to identify and quantify the primary processes responsible for the increase in salinity observed in the alluvial aquifers during the dry season. Besides hydrochemical analysis (Piper and Stiff diagrams and ionic relations), multivariate statistical analysis (hierarchical clustering and discriminant analyses) and inverse geochemical modeling were also used. The Piper and Stiff diagrams presented water classification according to dominant ions, where the alluvial water showed intermediate characteristics between the hard-rock basement aquifer water and that from the reservoirs. With the SAR diagram, the same result was observed. The ionic relations revealed a strong relation of the alluvial water with the lithology of the region and the probable dissolution of aerosols containing composites of the MgCl2 type in the aquifers of the crystalline rock shield. Cluster analysis showed the similarities between the wells, whereas discriminant analysis helped to understand the process of salinization in the alluvial aquifer. The inverse geochemical modeling carried out with PHREEQC identified cationic exchanges of CaX2, MgX2, NaX and KX, as well as precipitation of K-mica and albite and dissolutions of anorthite and K-feldspar, evidencing the intemperic action of the water on the rocks. Strong dissolution of CO2 in the alluvial water justifies the bicarbonated characteristics of that water. The volume contribution from crystalline rock aquifer water was estimated as between 1.53% and 27.99% at different points with a mean value of 15.8%. However, this contribution represents nearly 64% of the salinity of the water in the alluvium.
Os aqüíferos aluviais presentes na região semi-árida do Nordeste brasileiro hospedam importantes recursos hídricos naturais para as populações que vivem nessa região, devido a sua excelente qualidade, quando comparado aos aqüíferos localizados nas áreas de embasamento cristalino. No entanto, constituem recursos frágeis, sendo susceptíveis a processos de degradação da sua qualidade por ações antrópicas, variações climáticas ou modificações hidrogeológicas. Com o objetivo de identificar e quantificar os principais processos responsáveis pelo aumento da salinidade observada no aqüífero aluvial durante o período não chuvoso usou-se, além de estudos hidroquímicos (diagramas e estudo de razões iônicas), a análise estatística multivariada (agrupamento hierárquico e discriminante) e a modelagem geoquímica inversa. Os diagramas de Piper e Stiff mostraram a classificação das águas quanto à presença dos íons dominantes, onde as águas aluviais apresentaram características intermediárias entre as águas do aqüífero fissural e água dos reservatórios. Com o diagrama de RAS obteve-se a mesma interpretação. As relações iônicas revelaram forte relação das águas aluviais com a litologia da região e a provável dissolução de aerossóis contendo compostos de MgCl2 nos aqüíferos do embasamento cristalino. A análise de agrupamento mostrou as similaridades entre os poços, enquanto a análise discriminante ajudou a compreender o processo de salinização no aqüífero aluvial. As modelagens geoquímicas inversas realizadas com o PHREEQC identificaram trocas catiônicas de CaX2, MgX2, NaX e KX, além de precipitações de K-mica e albita e dissoluções de anortita e K-feldspato, evidenciando a ação intempérica das águas sobre as rochas. A grande dissolução de CO2 nas águas aluviais justifica a característica bicarbonatada dessas águas. A contribuição volumétrica de águas do aqüífero fissural, como forma de justificar o aumento da salinidade nos poços aluviais, foi estimada entre 1,53% e 27,99% para diferentes pontos, na média foi de 15,8%. No entanto, esta contribuição representa quase 64% da salinidade no aluvião.