Logo PUCPR

EXPLORAÇÃO E APLICAÇÃO DE ALGORITMOS DE APRENDIZAGEM DE MÁQUINA PARA RECONHECIMENTO DE DÍGITOS A PARTIR DE IMAGENS USANDO SVM E ÁRVORE DE DECISÃO

CHUNG, Yejin ¹; SCALABRIN, Edson Emilio ²
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba
Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba

INTRODUÇÃO: Este projeto foca na análise e comparação de desempenho entre dois modelos de aprendizado de máquina — a rede neural convolucional LeNet e a Máquina de Vetores de Suporte (SVM) — utilizando o conjunto de dados MNIST, conhecido por suas imagens de dígitos manuscritos. A comparação entre LeNet e SVM, com e sem aumento de dados, é essencial para entender as vantagens e limitações de cada abordagem. OBJETIVOS: O principal objetivo deste projeto é identificar qual modelo oferece melhor desempenho na classificação de dígitos manuscritos e como as técnicas de aumento de dados podem impactar essa performance. MATERIAIS E MÉTODO: O método envolve várias etapas: (a) Inicialmente, carregamos e pré-processamos o conjunto de dados MNIST, normalizando os valores dos pixels e transformando as etiquetas em codificação one-hot. (b) Em seguida, aplicamos técnicas de aumento de dados a uma parte do conjunto de treinamento para aumentar a diversidade dos exemplos. (c) Treinamos o modelo LeNet e o modelo SVM com os conjuntos de dados originais e aumentados. (d) Finalmente, avaliamos o desempenho de cada modelo utilizando métricas de acurácia e matrizes de confusão, permitindo uma análise detalhada dos erros de classificação. RESULTADOS: Os resultados indicam que o modelo LeNet supera consistentemente a SVM em termos de acurácia na classificação de dígitos manuscritos, tanto com dados originais quanto com dados aumentados. As matrizes de confusão mostram que os dígitos ‘3’, ‘5’ e ‘8’ apresentam mais confusões devido à sua semelhança visual, variações na escrita, características ambíguas e menor frequência no treinamento. O uso de aumento de dados melhorou o desempenho de ambos os modelos, reduzindo os erros de classificação, embora a melhoria tenha sido mais pronunciada no modelo LeNet. CONSIDERAÇÕES FINAIS: Estes achados destacam a eficácia das redes neurais convolucionais em capturar características complexas de imagens e a utilidade das técnicas de aumento de dados em melhorar a generalização dos modelos de aprendizado de máquina. O modelo LeNet demonstrou ser mais robusto na classificação de dígitos manuscritos, especialmente quando técnicas de aumento de dados foram aplicadas.

PALAVRAS-CHAVE: Reconhecimento de Dígitos Manuscritos; Aumento de Dados;LeNet;SVM

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa CNPq no programa PIBITI (MAI-DAI).
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador