REDES NEURAIS CONVOLUCIONAIS E SUAS VARIANTES APLICADAS PARA PROCESSAMENTO DE IMAGENS

SILVA, Luiz Eduardo Soares Emidio da1; COELHO, Leandro dos Santos2;

Resumo

Introdução:As Redes Neurais são uma combinação das áreas de Inteligência Artificial e Aprendizagem de Máquina, elas consistem em a partir de seus dados de entrada, realizar diferentes processos para classificar a informação recebida e com base na diferença de suas respostas e a verdadeira classificação dos dados, otimizar o processo de modo a poder generalizar de forma efetiva para exemplos que não foram utilizados durantes o treinamento. Já as Redes Neurais Convolucionais executam um processo mais complexo, utilizando de filtros para que a extração de característica aconteça automaticamente e seja mais efetiva que uma simples Rede Neural.

Objetivo:Esse projeto aborda, de forma introdutória, tanto questões teóricas quanto praticas das Redes Neurais Convolucionais, além disso demonstra o processo de implementação para o problema proposto pelo MNIST de reconhecimento de dígitos escritos à mão, assim como exemplifica algumas das possíveis técnicas de otimização das Redes.

Metodologia:Para isso, o projeto foi separado em duas partes, a primeira destinada ao estudo teórico geral sobre o tópico, e a segunda para implementação, testes e otimização da Rede Final selecionada, assim como a sua avaliação geral, comparação com resultados anteriores, estudo geral de suas camadas convolucionais e de seus erros.

Resultados:Ao analisar ao primeiras topologias, foi concluído que a otimização da Rede deveria ser focada na redução de complexidade enquanto mantem-se as taxas de acerto. Para isso é importante abordar assuntos como Overfitting, Underfitting, Early Stop, MaxPolling, Drop out, One Hot Encoding, entre outros que serão essenciais no processo para garantir uma rede mais simples, entretanto eficaz e que mantenha sua capacidade de generalização para testes nas quais não foi treinada. Também foram usados métodos para possibilitar a análise de forma profunda da Rede Final gerada após otimização, assim como visualizar seus maiores erros avaliados de modo geral como de fácil ou difícil classificação.

Conclusões:Após a fase de otimização, foi possível gerar uma Rede Neural Convolucional que apresenta uma complexidade reduzida em mais de 80% em relação as redes inicialmente selecionadas e que ainda mantem à aplicabilidade a exemplos externos ao treinamento com taxa de acerto maior que 98%.

Palavras-chave: Redes Neurais Convolucionais. Inteligência Artificial. Aprendizado de Máquina. Classificação de Dígitos escritos à mão.

Legendas

    1. Estudante
    2. Orientador