AVALIAÇÃO DE DIFERENTES MEDIDAS DE SIMILARIDADES DE INSTÂNCIAS DE PROCESSOS E DE MÉTRICAS DE AVALIAÇÃO DA QUALIDADE DE MODELO DE PROCESSOS

GRANDE, Nícolas Marinoni1; SCALABRIN, Edson Emilio2;

Resumo

Introdução:A evolução da informática nos trouxe a uma época onde dados estão se tornando essenciais na vida das pessoas e sucesso das empresas, porém, com tantos dados gerados, é grande a necessidade de saber o que fazer com eles, relacionando-os à análise de processos, além de só apenas armazena-los e praticar uma análise superficial. A mineração de processos visa descobrir modelos de processos a partir de dados, chamados de logs de eventos. Tal prática vem se tornando cada vez mais comum, porém, ainda há falta de modelos e métodos que efetivamente otimizem o fluxo de processos organizacionais.

Objetivo:O objetivo da pesquisa é avaliar diferentes medidas de similaridade aplicáveis no processo de agrupamento de instâncias de processos, assim melhorando o resultado da mineração de processos.

Metodologia:Para atingir os objetivos, foram necessários a leitura e interpretações de algoritmos de similaridade aplicáveis no grupo de instâncias escolhidos, e depois aplicar tais medidas sobre um conjunto de dados gerados artificialmente, e um conjunto de processos reais. Usando cálculo estatísticos e medidas de qualidade foi possível calcular a precisão de cada medida e seu recall, isso é, respectivamente, o quanto generalizado é tal modelo, permitindo comportamentos distantes dos presentes no log, e o quanto do log pode ser representado pelo modelo. Tais cálculos possibilitaram a visualização da direta influencia que a medida de similaridade pode afetar na qualidade de criação de agrupamentos de instâncias. Além disso, foi possível comparar a diferença de usar uma medida de similaridade em relação a outra, visto que seus cálculos podem se basear em diferentes componentes presentes no modelo e instâncias, como o comportamento, estrutura ou rotulação das atividades presentes em cada um deles.

Resultados:O trabalho fez o uso de três medidas de similaridade e foi verificado que a medida de relação de transições adjacentes é a melhor para agrupamento de instâncias, tanto em processos sintéticos como em reais. Com os resultados, novas portas são aberta para futuros projetos, possibilitando o uso da melhor medida deste trabalho para outros processos reais, para ver se é possível o uso dela em grande parte de processos reais ou só alguns.

Conclusões:A comparação de qualidade entre medidas de similaridade proporcionou visualizar como uma medida de similaridade pode obter valores diferentes de outra, mesmo com o modelo sendo o mesmo. O processo real coloca uma situação prática em relação a dois processos sintéticos, e mostra que os resultados entre os dois tipos, mesmo diferentes, não possuem divergências tão grandes. A ideia de implementação de algoritmo se mostrou uma dificuldade pois, das medidas selecionadas e apresentadas na revisão de literatura, todas tinham que satisfazer algum critério em que excluíam elas das possibilidades de serem calculada, sendo necessário o uso de outras medidas, que atendiam todas as condições desejadas. Foi possível considerar os resultados obtidos satisfatórios, visto que se percebe que, como citado na literatura, a medida de similaridade afeta diretamente a qualidade de agrupamento de instâncias, sendo que, das três apresentadas, a medida de relações de transições adjacentes se sobressaiu sobre as outras duas.

Palavras-chave: Mineração de Processos. Medidas de Similaridade. Medidas de Qualidade.

Legendas

    1. Estudante
    2. Orientador