Logo PUCPR

ENSEMBLE DE REPRESENTAÇÕES VISUAIS PARA A CLASSIFICAÇÃO DE SÉRIES TEMPORAIS

VEIGA, Patrickerson Dos Santos ¹; SOUZA, Vinicius Mourao Alves De ²
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba
Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba

INTRODUÇÃO: Séries temporais representam medições sequenciais de algum fenômeno observado ao longo do tempo e estão presentes em domínios variados, como engenharia, finanças e biologia. A cotação de uma moeda, a temperatura de uma cidade ou os batimentos cardíacos de um paciente observados ao longo do tempo, são exemplos de séries temporais. Entre as diferentes tarefas de Aprendizagem de Máquina que podem ser realizadas com séries temporais, classificação é uma das mais relevantes, em que um modelo supervisionado prediz um rótulo de classe que melhor descreve a série. Para isso, os algoritmos buscam padrões em dados de treinamento previamente rotulados. No entanto, em alguns casos, características importantes das séries não são evidentes em sua representação primitiva no tempo, dificultando a busca por estes padrões, sendo necessário realizar a transformação dos dados em uma diferente representação para que tais características sejam evidenciadas. Em específico, este projeto explorou representações visuais em duas dimensões. OBJETIVOS: Os objetivos deste projeto foram investigar, desenvolver e avaliar o desempenho de comitês de modelos (ensembles) treinados com diferentes representações dos dados para o problema de classificação de séries temporais. MATERIAIS E MÉTODO: Foram exploradas diferentes transformações em duas dimensões como Continuous Wavelet Transform (CWT), Markov Transition Field (MTF), Gramian Angular Summation Field (GASF) e Recurrence Plot (RP). Foi utilizado o algoritmo de Floresta Aleatória (Random Forest) para o treinamento dos classificadores do comitê utilizando diferentes representações visuais. Para combinar as respostas dos diferentes modelos e retornar uma resposta única, foram utilizadas estratégias de votação como hard voting, soft voting e weighted soft voting. A abordagem de ensemble investigada foi avaliada em dados de benchmark da UCR, composta por 128 conjuntos de dados. RESULTADOS: Os resultados indicam que a estratégia weighted soft voting é capaz de superar o desempenho preditivo das demais estratégias, bem como dos classificadores treinados individualmente com cada representação visual dos dados. CONSIDERAÇÕES FINAIS: A investigação conduzida neste projeto reforça a eficiência das representações visuais de duas dimensões para a tarefa de classificação de séries temporais. Além disso, pode-se observar que a abordagem de combinação de classificadores treinados com diferentes representações e baseada em votação foi capaz de superar os resultados dos classificadores individuais. Para isso, é necessário considerar estratégias de votação adequadas, como a weighted soft voting, que pondera os classificadores do comitê com base em resultados obtidos com dados de treinamento.

PALAVRAS-CHAVE: Séries temporais; Classificação supervisionada; Comitê de classificadores; Ensembles; Representações visuais.

APRESENTAÇÃO EM VÍDEO

Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador
Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC.