Logo PUCPR

DETECÇÃO DE EXOPLANETAS USANDO ALGORITMOS DE APRENDIZADO DE MÁQUINA E O MÉTODO DE TRÂNSITO

LOPES, Alex Cohen Dambrós ¹; JUNIOR, Alceu De Souza Britto ²
faixa-semic-branco
Curso do(a) Estudante: Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.<br Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba, PR.

INTRODUÇÃO: Desde as antigas civilizações já havia uma compreensão da existência de planetas no Sistema Solar, mas por muito tempo, as informações sobre os corpos celestes eram imprecisas e limitadas. Com o avanço tecnológico nas últimas décadas e a criação de observatórios e telescópios espaciais, foi possível realizar um aperfeiçoamento na definição dos corpos celestes, além da possibilidade de se realizar novos estudos e aquisição de uma grande quantidade de dados, resultando em novas descobertas sobre diversos fenômenos existentes no universo. As missões de explorações espaciais conduzidas por satélites, como Kepler, TESS e K2, têm desempenhado um papel significativo na revelação ampla de diversos novos fenômenos que ocorrem no universo. Um desses fenômenos astronômicos é a ocorrência do trânsito planetário em estrelas-alvo observadas, o que possibilita a identificação e a descoberta de novos exoplanetas. OBJETIVOS: O objetivo deste projeto é desenvolver e analisar o desempenho de diferentes abordagens de aprendizado de máquina na identificação de candidatos a exoplanetas em observações realizadas por satélites espaciais. Isso será feito por meio da análise de curvas de luz e na identificação de trânsitos planetários nos mesmos, utilizando dados brutos de satélites espaciais. MATERIAIS E MÉTODO: Para o desenvolvimento deste trabalho, optamos por treinar quatro algoritmos específicos: Adaboost, XGBoost, SVM (Support Vector Machine) e MLPClassifier. Utilizamos técnicas como Grid Search e validação cruzada com 10 folds para treinamento dos modelos e por fim, foi realizado a análise do desempenho dos modelos previamente definidos. Nesta fase, foi buscado compreender o desempenho dos modelos na classificação dos dados utilizando métricas como acurácia, precisão, recall, F1-score, AUC (Area Under the Curve), KS (Kolmogorov Smirnov) e matriz de confusão. RESULTADOS: Ao empregar as técnicas de aprendizado de máquina selecionadas em nosso projeto, foi possível obter os resultados abrangentes de todas as métricas previamente definidas. Após analisar os resultados obtidos, verificamos que, para a representação local dos dados, o modelo SVM se destacou, apresentando a melhor acurácia de 69,25%. Por outro lado, ao considerarmos a representação global dos dados, o modelo XGBoost se destacou, alcançando uma acurácia de 79,64%. CONSIDERAÇÕES FINAIS: Concluídas todas as etapas do projeto, é importante destacar que os resultados obtidos foram satisfatórios, apesar de ainda haver espaço para melhorias na acurácia dos modelos avaliados. Os modelos ainda apresentam um percentual considerável de erros na classificação dos dados que acreditamos ser possível reduzir com a futura fusão destes em um ensemble heterogêneo.

PALAVRAS-CHAVE: Detecção exoplanetas; Método de trânsito, Aprendizagem de máquina; Modelos preditivos.

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBIC.
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador