Logo PUCPR

EXPLORANDO REPRESENTAÇÕES VISUAIS E MEDIDAS DE SIMILARIDADE ENTRE IMAGENS PARA A CLASSIFICAÇÃO DE SÉRIES TEMPORAIS

RIBEIRO, André Gustavo Da Rosa ¹; SOUZA, Vinicius Mourao Alves De ²
faixa-semic-branco
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.
Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.

INTRODUÇÃO: Séries temporais são dados gerados a partir de medições sequenciais de algum fenômeno observado ao longo do tempo, como registros de eletrocardiogramas ou cotação de moedas. Estes dados são utilizados em diferentes tarefas de Aprendizado de Máquina, como classificação supervisionada, foco desse projeto de pesquisa. Para o treinamento de classificadores, é essencial a identificação de padrões nos dados. Porém, muitos padrões estão ocultos na representação primitiva de séries temporais, sendo necessária a transformação desses, como a transformação para o domínio das frequências. Nesse projeto, foram exploradas transformações capazes de gerar imagens de duas dimensões para a representação de séries temporais. OBJETIVOS: O principal objetivo deste projeto de pesquisa foi investigar, comparar e avaliar o desempenho preditivo de soluções para o problema de classificação de séries temporais envolvendo a transformação dos dados a partir de diferentes representações visuais, configurações e algoritmos baseados em busca por similaridade entre imagens. MATERIAIS E MÉTODO: Foram investigadas cinco representações visuais: Continuous Wavelet Transform (CWT), Markov Transition Field (MTF), Gramian Angular Field (GAF), Recurrence Plot (RP) e uma combinação de três representações em uma única imagem (MTF-GAF-RP). Também foi investigado o impacto do mapa de cor considerado para a geração das imagens, sendo avaliados 5 mapas de cores. Para a comparação de similaridade entre imagens, o projeto envolveu o estudo e implementação do algoritmo 1NN com o uso das medidas Structural Similarity Index (SSIM), Peak Signal to Noise Ratio (PSNR) e Campana-Keogh distance (CK-1). A medida CK-1, baseada em compressão de vídeo, utiliza codecs de vídeo no processo de comparação. Assim, também foram estudados e avaliados 11 codecs: hevc, vp9, mpeg1video, mpeg2video, flv1, mpeg4, flashsv2, gif, zmbv, h264 e snow. Todos os resultados foram analisados considerando uma avaliação experimental envolvendo 85 conjuntos de dados provenientes do repositório UCR. RESULTADOS: Os resultados dessa pesquisa indicam que a representação CWT obteve os maiores valores de médios de acurácia. Estes resultados foram obtidos independentemente do mapa de cores. Assim, a escolha de um mapa de cor é pouco importante, sendo o binary capaz de retornar resultados com menor variação. Além disso, foi possível identificar que os melhores resultados foram obtidos, em geral, a partir da medida de similaridade CK-1. A medida PSNR também se destaca. Também observa-se que o codec utilizado pela medida CK-1 é responsável por um impacto significativo nos resultados, sendo o codec vp9 responsável por gerar os melhores resultados. Em resumo, os resultados indicam que a melhor configuração é a partir do uso da representação CWT com o mapa de cor binary e a medida CK-1 utilizando o codec vp-9. CONSIDERAÇÕES FINAIS: Este projeto de pesquisa foi realizado com o objetivo principal de investigar e avaliar o desempenho preditivo de diferentes combinações de representações visuais, medidas de similaridade e configuração de algoritmos na classificação de séries temporais. A hipótese inicial de que seria possível superar o desempenho de classificação em relação a métodos tradicionais, como o algoritmo 1NN, foi confirmada a partir de uma ampla avaliação experimental.

PALAVRAS-CHAVE: Séries temporais; Classificação; Similaridade entre imagens; Campana-Keogh distance.

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC.
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador