Logo PUCPR

MÉTODO COMPUTACIONAL PARA CRIAÇÃO DE BASES SINTÉTICAS DE LOGS DE EVENTOS COM CONCEPT DRIFTS

RESUMO

INTRODUÇÃO: Os processos de negócios são sequências de atividades que visam atingir um objetivo. Porém, os processos são dinâmicos, por exemplo, a sequência de execução das atividades pode ser alterada, ou mesmo atividades podem ser removidas ou adicionadas. Essas mudanças no processo que ocorrem ao longo do tempo são chamadas de mudanças de conceito (process drift). Atualmente, existem diversos algoritmos para detecção dessas mudanças, no entanto, não existem logs artificiais que possibilitem a testagem exaustiva desses. A comunidade científica tem feito grandes esforços para gerar registros sintéticos (gerados de forma controlada). – OBJETIVOS: O projeto tem como objetivo criar um gerador de logs de eventos com drifts que possa simular registros fidedignos ao registros reais. – MATERIAIS E MÉTODO: O projeto modelou algoritmos para a geração de logs de evento usando a biblioteca pm4py. Os algoritmos recebem os modelos de processos, os parâmetros desejados pelo usuário e geram os logs de eventos. Os quatros tipos de drifts (abruptos, graduais, repentinos, recorrentes) são abordados. O usuário pode inserir o número de drifts que desejar com intervalos variáveis e diferentes tamanhos de log. Além disso, é possível inserir ruído e especificar a função de decaimento no caso dos drifts graduais. – RESULTADOS: O método gerou uma base de dados com 15 logs de eventos com drifts. Esses logs foram validados por meio da análise do arquivo XES do log e por meio da submissão a algoritmos de detecção de drift conhecidos na literatura (Apromore ProDrift e IPDD framework) que foram capazes de ler o log e identificar os drifts inseridos. Os logs de eventos foram disponibilizados para a comunidade científica. – CONSIDERAÇÕES FINAIS: A revisão da literatura mapeou os logs de eventos com drifts e os geradores de logs existentes dando embasamento teórico para a concepção do método computacional. A metodologia proposta foi implementada e obteve os primeiros resultados com a geração de logs de eventos com: diferentes tamanhos de logs de eventos, intervalos variáveis entre os drifts, tipos diferentes de drifts, número de drifts variáveis e ruído. O estudo das funções de probabilidades permitiu a implementação de drift graduais com decaimento linear ou exponencial. Além disso, foi possível sistematizar os algoritmos e permitir que o usuário escolha os parâmetros dos logs de eventos de acordo com sua necessidade. Os algoritmos propostos foram formalizados matematicamente com uma rotina de cálculos para torna-los acessíveis a comunidade científica.

PALAVRAS-CHAVE:

mineração de processos; logs artificiais com process drift; geração de logs de eventos.

APRESENTAÇÃO EM VÍDEO

Sessão Oral:
(O9.4) PIBIC Master – CCOMP, ECV, MEDVET, DIR, ARQUR, FILO : 27/10 – 10h30 – 12h00 – Auditório – Mario de Abreu
Esta pesquisa foi desenvolvida com bolsa de Iniciação Científica com recursos da PUCPR no programa PIBIC Master
Legendas:
  1. Estudante;
  2. Orientador;
  3. Colaboradores.

Compartilhe

Share on facebook
Share on linkedin
Share on twitter
Share on email