Logo PUCPR

PREVISÃO DE SÉRIES TEMPORAIS BASEADA EM XGBOOST E REDES NEURAIS RECORRENTES

RESUMO

INTRODUÇÃO: A água é um elemento essencial para a sobrevivência do ser humano e a previsão do consumo de água constitui um fator relevante para o planejamento e gerenciamento dos sistemas de distribuição de água. No Brasil, os serviços prestados para abastecimento de água são geralmente efetuados por companhias municipais e estaduais, cujas operações de captação, estocagem, tratamento e distribuição de água são financiadas por meio de tarifas. No município de Curitiba (Paraná) este serviço é prestado pela Companhia de Saneamento do Paraná (SANEPAR). – OBJETIVOS: O objetivo deste projeto foi aplicar conceitos e métodos de aprendizado de máquina visando a previsão de séries temporais em uma base de dados fornecida pela SANEPAR. – MATERIAIS E MÉTODO: Para a análise e previsão de séries temporais com dados da SANEPAR foram abordados procedimentos de análise exploratória de dados incluindo análise de correlação de Pearson e de Spearman. Além disso, o projeto de modelos de previsão incluindo modelo clássico do tipo Autorregressivo Integrado de Médias Móveis (do inglês Auto Regressive Integrated Moving Average, ARIMA) e modelo de ensemble learning denominado XGBoost (do inglês eXtreme Gradient Boosting) foi realizado e os seus resultados comparados. – RESULTADOS: Pela comparação de resultados em termos de métricas de desempenho utilizadas em previsão de séries temporais observa-se que o modelo XGBoost apresentou resultados superiores aos obtidos com o modelo ARIMA para a base de dados fornecida pela SANEPAR de um bairro da cidade de Curitiba, PR. – CONSIDERAÇÕES FINAIS: Os objetivos previstos para este projeto foram alcançados com sucesso. Pelos resultados obtidos no projeto observou-se a necessidade de aprimorar os modelos de previsão de séries temporais de consumo de água quanto ao uso de variáveis exógenas, otimização de hiperparâmetros dos modelos testados e projeto de redes neurais recorrentes. Além disso, existe a necessidade de futura avaliação de outras bases de dados de outros bairros de Curitiba. No entanto, para tal tarefa ser realizada necessita-se da adoção de dados de consumo de água a serem fornecidos pela SANEPAR.

PALAVRAS-CHAVE:

previsão de séries temporais; aprendizado de máquina; modelo ARIMA; Modelo XGBoost.

APRESENTAÇÃO EM VÍDEO

Sessão E-Pôster:
(P3.4.8) Sessão Pôster: PIBITI – Todas áreas e PIBIC – Ciências Exatas e Agrarias (P.4) : 26/10 – 11h30 – 12h00 – Hall – Bloco Verde B08
Esta pesquisa foi desenvolvida com bolsa de Iniciação Científica com recursos da PUCPR
Legendas:
  1. Estudante;
  2. Orientador;
  3. Colaboradores.

Compartilhe

Share on facebook
Share on linkedin
Share on twitter
Share on email