INTRODUÇÃO: Muitas aplicações IoT que utilizam redes sem fio envolvem arquiteturas com múltiplos saltos (multi-hop) e a coleta simultânea de informações de vários sensores. Portanto, reduzir a quantidade de dados e eliminar dados redundantes provenientes de diferentes sensores, é uma estratégia importante para se minimizar o congestionamento e o consumo energético nas redes sem fio em aplicações IoT. Neste contexto, este projeto de pesquisa visa investigar as técnicas de aprendizagem de máquina não supervisionas para realizar a agregação distribuída de dados. – OBJETIVOS: Este projeto de pesquisa tem como objetivo investigar o desempenho de diferentes estratégias de clusterização para agregação de dados distribuída (In-Network Aggregation) em redes sem fio para IoT, utilizando técnicas de aprendizagem de máquina (Machine Learning – ML) não supervisionas para realizar a agregação distribuída de dados em redes de sensores sem fio (RSSF). – MATERIAIS E MÉTODO: Os dados de sensoriamento utilizados nesta pesquisa foram coletados do projeto Argo. O Argo é um programa internacional que mede as propriedades da água em todo os oceanos, usando um conjunto de sensores que flutuam com as correntes oceânicas. Todos os dados vieram de 10 sensores espalhados pelo oceano pacífico e são divididos entre três tipos de dados: salinidade (PSAL), pressão (PRES) e temperatura (TEMP). Os dados estão organizados em trinta arquivos, três de cada sensor, cada arquivo contendo 529 leituras. A linguagem escolhida para realizar a clusterização foi Python, e os algoritmos analisados foram o DBSCAN, OPTICS, KMeans, Aglomerative Clustering e Spectral Clustering. – RESULTADOS: A partir da análise comparativa dos algoritmos de clusterização aplicados aos dados reais dos sensores, foi possível avaliar quais técnicas são mais adequadas para serem utilizadas neste tipo de aplicação de RSSF para telemetria de dados físicos. O desempenho de cada algoritmo foi testado verificando-se o tempo de clusterização e a silhueta dos clusters. Considerando a complexidade do processamento e a qualidade da clusterização, identificamos que o método Agglomerative Clustering foi o que apresentou melhor desempenho. – CONSIDERAÇÕES FINAIS: A partir dos estudos realizados é possível aprimorar algumas estratégias de clusterização para aplicação na agregação de dados in-network em redes de sensores sem fio. A agregação in-network permite reduzir o volume de tráfego de dados das RSSF de larga escala em diversas aplicações no contexto IoT.