Logo PUCPR

GERADOR DE LOGS DE EVENTOS SINTÉTICOS COM CONCEPT DRIFT SUDDEN, RECURRING, GRADUAL E INCREMENTAL

BINA, Manoel Felipe De Almeida ¹; SATO, Denise Maria Vecino ³; SCALABRIN, Edson Emilio ²
faixa-semic-branco
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.
Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.

INTRODUÇÃO: A mineração de processos é uma área interdisciplinar que combina ciência da computação, mineração de dados, estatística e gerenciamento de processos para analisar e melhorar processos de negócios. Apesar de existirem diferentes técnicas para análise dos processos, a maior parte delas assume que um log de eventos contém dados sobre uma única versão do processo, considerando que não houve alteração no processo que gerou os dados no período de coleta. Porém, a realidade dinâmica dos processos de negócio não se encaixa nessa premissa. Deste modo, identificou-se a necessidade de gerar bases de dados contendo logs de eventos com concept drifts que permitam validar as técnicas de análise de processos, considerando cenários mais diversos e mais próximos da realidade. OBJETIVOS: Gerar logs de eventos com concept drifts, inserindo mudanças artificiais nos dados. Esses logs diversificados combinam diferentes tipos de drifts, tamanhos, números e intervalos entre as mudanças. MATERIAIS E MÉTODO: A geração de logs de eventos com drifts foi colocada em prática com o suporte do plugin ConceptDrift, implementado no Framework ProM, que fornece as operações básicas de geração de logs de eventos a partir de um dado modelo de processo. O método de criação de logs com drifts seguiu uma estratégia simples e bem-definida, a saber: dado dois modelos de processos M1 e M2: a) gera-se, por meio de simulação computacional, os logs de eventos L1 a partir do modelo M1 e L2 a partir do modelo M2; e b) cria-se um terceiro log de eventos L3 juntando L1 e L2 de forma alternada k vezes, onde k é o número de drifts presente em L3 no final do processo de criação. A transição de um modelo de processo para outro pode ser: abrupta, recorrente, gradual ou incremental. Cada transição ocorre em um intervalo de tempo e segue uma distribuição de probabilidades. RESULTADOS: Implementação de um método computacional que pode ser parametrizado para gerar diferentes logs de eventos com drifts, a saber: abrupto, recorrente, gradual ou incremental. O método também fornece suporte para a coleta de dados no contexto da avaliação de diferentes estratégias de detecção de drifts, já que no mesmo arquivo de log gerado (formato XES) estão presentes não apenas os dados dos eventos, mas também as marcações onde se encontram os drifts. Essas marcações são essenciais para o cálculo de métrica F-score de análise de detecção de drift. CONSIDERAÇÕES FINAIS: O método implementado permite gerar de logs de eventos com concept drifts e coletar dados sobre os drifts em questão. A principal contribuição está na capacidade do método implementado gerar logs com concept drifts e armazenar os dados sobre tais drifts em um único arquivo XES. O usuário pode usar o método de duas maneiras, a saber: por meio de uma interface gráfica para informar os parâmetros de configuração de cenário de geração de um log de eventos com drifts, ou por meio de um script para informar os parâmetros de configuração para a geração massiva de vários logs de eventos com drifts.

PALAVRAS-CHAVE: Mineração de processos; ProM; Concept drift; Logs sintéticos.

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC.
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador