Dissertations / Theses: 'Boosting and bagging'

1

Nascimento, Diego Silveira Costa. "Configuração heterogênea de ensembles de classificadores : investigação em bagging, boosting e multiboosting." Universidade de Fortaleza, 2009. http://dspace.unifor.br/handle/tede/83562.

Full text

Abstract:

Made available in DSpace on 2019-03-29T23:22:32Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-12-21
This work presents a study on the characterization and evaluation of six new heterogeneous committees machines algorithms, which are aimed at solving problems of pattern classification. These algorithms are extensions of models which are already found in the literature and have been successfully applied in different fields of research. Following two approaches, evolutionary and constructive, different machine learning algorithms (inductors) can be used for induction of components of the ensemble to be trained by standard Bagging, Boosting or MultiBoosting on the resampled data, aiming at the increasing of the diversity of the resulting composite model. As a means of automatic configuration of different types of components, we adopt a customized genetic algorithm for the first approach and greedy search for the second approach. For purposes of validation of the proposal, an empirical study has been conducted involving 10 different types of inductors and 18 classification problems taken from the UCI repository. The acuity values obtained by the evolutionary and constructive heterogeneous ensembles are analyzed based on those produced by models of homogeneous ensembles composed of the 10 types of inductors we have utilized, and the majority of the results evidence a gain in performance from both approaches. Keywords: Machine learning, Committee machines, Bagging, Wagging, Boosting, MultiBoosting, Genetic algorithm.
Este trabalho apresenta um estudo quanto à caracterização e avaliação de seis novos algoritmos de comitês de máquinas heterogêneos, sendo estes destinados à resolução de problemas de classificação de padrões. Esses algoritmos são extensões de modelos já encontrados na literatura e que vêm sendo aplicados com sucesso em diferentes domínios de pesquisa. Seguindo duas abordagens, uma evolutiva e outra construtiva, diferentes algoritmos de aprendizado de máquina (indutores) podem ser utilizados para fins de indução dos componentes do ensemble a serem treinados por Bagging, Boosting ou MultiBoosting padrão sobre os dados reamostrados, almejando-se o incremento da diversidade do modelo composto resultante. Como meio de configuração automática dos diferentes tipos de componentes, adota-se um algoritmo genético customizado para a primeira abordagem e uma busca de natureza gulosa para a segunda abordagem. Para fins de validação da proposta, foi conduzido um estudo empírico envolvendo 10 diferentes tipos de indutores e 18 problemas de classificação extraídos do repositório UCI. Os valores de acuidade obtidos via ensembles heterogêneos evolutivos e construtivos são analisados com base naqueles produzidos por modelos de ensembles homogêneos compostos pelos 10 tipos de indutores utilizados, sendo que em grande parte dos casos os resultados evidenciam ganhos de desempenho de ambas as abordagens. Palavras-chave: Aprendizado de máquina, Comitês de máquinas, Bagging, Wagging, Boosting, MultiBoosting, Algoritmo genético.