SELEÇÃO GLOBAL DE ATRIBUTOS EM CLASSIFICADOR HIERÁRQUICO BASEADO EM NÓ-PAI

PIPER, Alfred Louis1; NIEVOLA, Julio Cesar2;

Resumo

Introdução:Um dos maiores desafios da área de mineração de dados é trabalhar com a previsão de hierarquia de classes em bases de dados. O principal motivo é que as técnicas utilizadas para o aprendizado de máquina consistem na utilização de classificadores de abordagem simples. Isso significa que são incapazes de gerar um resultado satisfatório já que não obedecem a hierarquia prevista em um determinado conjunto de dados. A seleção de atributos, que consiste na remoção de atributos menos importantes, pode influenciar no desempenho do classificador.

Objetivo:O objetivo desse projeto foi construir um classificador hierárquico baseado em nó-pai adaptando cinco algoritmos de classificação simples. Além disso, buscou-se analisar o desempenho com e sem a seleção de atributos.

Metodologia:Para desenvolver o algoritmo do classificador hierárquico nó-pai foram utilizadas a ferramenta Weka e suas bibliotecas, o que eliminou a necessidade de implementar os classificadores de abordagem simples. Para a validação dos resultados foi implementado um algoritmo de validação cruzada com suporte para arquitetura de um classificador hierárquico. Para a seleção de atributos foram utilizadas duas técnicas: a primeira utilizando o algoritmo de busca BestFirst, que mantém somente os atributos com maior relevância, e a segunda utilizando o algoritmo de seleção Ranker que ordena os atributos, permitindo que somente uma porcentagem fixa definida seja mantida.

Resultados:Os resultados obtidos nos testes demonstraram que a seleção de atributos apresentou impacto significativo de acordo com o tipo de classificador tradicional e as técnicas de seleção de atributos utilizadas. A seleção de atributos demonstrou que ao mesmo tempo podem melhorar ou piorar a qualidade do modelo quando aplicado em um classificador hierárquico; o que também pode ser observado é que o classificador tradicional utilizado para compor o classificador hierárquico pode ter papel significativo no impacto causado pela seleção de atributos, onde uns apresentam uma sensibilidade maior no treinamento.

Conclusões:Os resultados podem dar uma ideia de qual a melhor abordagem para a construção de um classificador hierárquico baseado em nó-pai e qual a melhor técnica de seleção de atributos, onde os ganhos que podem ser além da qualidade do modelo classificador, como também podem melhorar o uso de recursos computacionais, já que determinados dados irrelevantes para o modelo são excluídos da base de dados reduzindo o fluxo de processamento no momento do treinamento e classificação.

Palavras-chave:Classificadores. Redes Neurais. Seleção de atributos. Previsão da função de proteínas

Legendas

    1. Estudante
    2. Orientador