Logo PUCPR

APLICAÇÃO E AVALIAÇÃO DE TÉCNICAS DE SPEECH-TO-TEXT NO PROCESSO PERICIAL DE EXTRAÇÃO DE PALAVRAS-CHAVE DE CHATS EM DISPOSITIVOS MÓVEIS

VENETIKIDES, Rafael Honorio ¹; BARDDAL, Jean Paul ²
Curso do(a) Estudante: Engenharia De Computação – Escola Politécnica – Câmpus Curitiba
Curso do(a) Orientador(a): Ciência Da Computação – Escola Politécnica – Câmpus Curitiba

INTRODUÇÃO: O projeto SICRET nasceu com o objetivo de auxiliar a perícia criminal na análise de mensagens de texto extraídas de telefones móveis para auxiliar peritos na identificação e entendimento do contexto das conversas disponíveis nestes dispositivos. OBJETIVOS: O objetivo é a análise das mensagens trocadas por WhatsApp, extraindo as palavras-chave que definem os contextos das conversas feitas com o dispositivo. Neste trabalho, analisamos a incorporação dos áudios nesta extração com o auxílio de métodos speech-to-text para a conversão de áudio em texto e qual o ganho que a inserção dos áudios na análise fornece na precisão da ferramenta. MATERIAIS E MÉTODO: Realizamos a identificação de ferramentas de transcrição de áudios que fossem offline e preferencialmente Open Source, devido a confidencialidade dos dados trabalhados. Nesta pesquisa, duas ferramentas se destacaram, o toolkit Vosk da Alpha Cephei e o sistema Whisper da OpenAI. Aplicamos estas ferramentas em casos selecionados pela perícia, extraindo as palavras chaves com e sem os áudios, e fizemos uma análise estatística das palavras-chave extraídas, comparando com um conjunto de palavras resposta fornecido pela equipe da delegacia. RESULTADOS: Utilizando F1 Score, observamos que a extração com os áudios resultou em uma melhoria da extração, aproximadamente de 8 pontos percentuais e através da análise estatística, concluímos que a aplicação de diferentes conversores de áudio em texto (speech-to-text) melhorou significativamente a extração de palavras-chave. CONSIDERAÇÕES FINAIS: Com a análise dos resultados, foi possível perceber que a inserção dos áudios resultou em um ganho significativo para a ferramenta, existindo alguns casos em que os dados fornecidos pelas mensagens de voz foram necessários para compreender o contexto da conversa.

PALAVRAS-CHAVE: Processamento de Linguagem Natural; Aprendizagem de Máquina; Inteligência Artificial; Análises Forenses; Extração de Palavras-chave

APRESENTAÇÃO EM VÍDEO

Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador
Esta pesquisa foi desenvolvida com bolsa Fundação Araucária no programa PIBIC.