Logo PUCPR

DEEP LEARNING PARA A SEGMENTAÇÃO DE ÓRGÃOS EM IMAGENS MÉDICAS UTILIZANDO SELEÇÃO DINÂMICA E AUMENTO DE DADOS

LIMA, Daniela Dos Santos ¹; HOCHULI, Andre Gustavo ²
faixa-semic-branco
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba

INTRODUÇÃO: Este projeto concentra-se no desenvolvimento de algoritmos de Deep Learning para a segmentação de órgãos em imagens médicas, especificamente de órgãos torácicos, como o coração, traqueia, esôfago e aorta. A diversidade de formas e tamanhos desses órgãos apresenta um desafio para a segmentação em 3D. O conjunto de dados utilizado é o SegTHOR, e para superar a escassez de dados rotulados, empregam-se técnicas avançadas de aprendizado de máquina e Deep Learning, automatizando a segmentação e gerando imagens artificiais e rotuladas. Também avaliamos se a combinação de diferentes classificadores por meio de fusão de informações aprimora a precisão da segmentação, enquanto a geração de imagens sintéticas ajuda a superar a falta de dados rotulados. OBJETIVOS: O objetivo deste trabalho é desenvolver uma solução baseada em algoritmos de Deep Learning para a segmentação semântica de órgãos torácicos em imagens de tomografia computadorizada, com o propósito de auxiliar no diagnóstico de tumores e avaliar o grau de afetação dos órgãos. Para atingir esse objetivo, são definidas metas que incluem a obtenção de um conjunto de dados adequado, uma revisão bibliográfica abrangente, a seleção e adaptação de uma arquitetura de Deep Learning, o desenvolvimento de melhorias no modelo, a realização de validações e testes, a comparação de resultados com outros métodos de segmentação e a proposição de melhorias com base nas análises realizadas. Também, a avaliação de métodos de combinação para melhorar os estado da arte. MATERIAIS E MÉTODO: A metodologia consiste no treinamento e validação de uma Rede Neural Convolucional para segmentação dos órgãos anteriormente citados a partir de tomografias torácicas. Para isto o experimento foi dividido em duas principais etapas: pré-processamento, aumento dos dados e concepção da arquitetura do modelo. O treinamento consistiu em gerar modelos de segmentação específico para cada orgão e por fim combiná-los através de seleção dinâmicaa fim de obter a segmentação final da imagem de entrada. Para isso, foi definida a arquitetura de rede denominada U-NET, e o dataset SegTHOR, amplamente conhecido no estado da arte. Técnicas de aumento de dados, como rotação, translação, zoom, ajuste de contraste e brilho, dentre outros foram aplicadas. RESULTADOS: Ao examinar os resultados, identificamos que a falta de diversidade nas amostras rotuladas pode ser uma fonte de erro significativa na avaliação do modelo, levando a uma acurácia média de apenas 22%. As métricas utilizadas precisam ser revistas, a fim de detectar e minimizar a ocorrência de overfitting. A abordagem ainda não é descartada, mas uma revisão da forma como está desenhada deve ser revista para atingir resultados mais satisfátorios. CONSIDERAÇÕES FINAIS: Evidente que a abordagem apresentou um desempenho insatisfatório. A ocorrência de underfitting acarretou em falta de generalização comprometendo a performance. Para a continuidade deste projetos, exploraremos outras técnicas de aumento de dados e funções de perda, evoluindo assim neste tópico de pesquisa e aprendizado pessoal. PALAVRAS-CHAVE: Segmentação Semântica; Processamento de Imagens Médicas; Deep Learning

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador