VISÃO COMPUTACIONAL APLICADA AO RASTREAMENTO DE CIRCULAÇÃO PEDESTRES

LARA, André Mateus Fernandes de1; RUDEK, Marcelo2;

Resumo

Introdução:No trânsito, o controle de fluxo ocorre, geralmente, pelo uso de semáforos com tempos pré-determinados de ativação e operação. Muitas vezes, esse funcionamento acaba não sendo muito eficaz na distribuição do tráfego entre pedestres e veículos, como apresenta (Andrade, 2018). Isto pode gerar situações de risco na movimentação de ambos, seja por falta de atenção do pedestre em relação aos automóveis e vice-versa ou pelo desrespeito de leis de trânsito vigentes.por meio da aprendizagem profunda (Deep Learning) no campo da visão computacional cognitiva (Pathak, Pandey e Rautaray, 2018), esses métodos se utilizam de algoritmos capazes de identificar e classificar um objeto, que no caso desta pesquisa, são as pessoas em movimento numa sequência de imagens.

Objetivo:Selecionar e avaliar os algoritmos de visão computacional para serem aplicados na identificação de padrões de deslocamento e agrupamento de pessoas e as possíveis intenções de movimento.

Metodologia:realizou-se o estudo do referencial teórico através de uma abordagem exploratória a respeito de algoritmos de aprendizagem de máquina para classificação de objetos (pessoas). As palavras-chaves utilizadas na busca dos materiais teóricos foram “deep learning”, “object classification algorithms”, “computer vision”, “tracking”, “pedestrian detector”, “neural networks”, “openCV”. As publicações em journal e proceedings dos últimos 3 anos foram analisadas, obtendo-se uma lista de técnicas atualmente abordadas para classificação de objetos e tracking, que determinam o atual estado da arte na visão computacional. O ferramental computacional a ser utilizado também foi estudado, assim obteve-se uma base teórica sobre a biblioteca OpenCV que contém alguns algoritmos já implementados.Para testar os algoritmos e avaliar seus resultados foi utilizado o editor Microsoft Visual Studio Code.

Resultados:A partir das imagens em representação binária fornecidas, pode-se determinar um objeto e distinguir sua classe (classificação) com base na especificação/treinamento fornecido ao programa. O YOLO é um detector que atua em tempo real, ou seja, tendo a imagem recebida, o programa divide a imagem de forma precisa em caixas delimitadoras (bounding boxes) e mostra se uma determinada porção do grid corresponde a um objeto, e, a partir disso, consegue predizer as probabilidades de classe que o objeto pertence.

Conclusões:Foi possível observar que o algoritmo SVM utiliza os dados extraídos pelo algoritmo HOG cujas otimizações giram em torno do tratamento dos dados a partir da linearização. Já o SVM otimiza seus dados ao trabalhar com a transformação dos espaços utilizando a Kernel. O YOLO é o mais rápido e que possui mais acurácia.

Palavras-chave: Visão Computacional. Redes Neurais Convolucionais. Detecção de Pedestres.

Legendas

    1. Estudante
    2. Orientador