GRANDES MODELOS DE LINGUAGEM NA CODIFICAÇÃO DE TERMOS DE NARRATIVAS CLÍNICAS EM PORTUGUÊS
INTRODUÇÃO: Na área da saúde, a cada dia a necessidade de codificar os termos presentes nas narrativas clínicas aumenta. Os sistemas de codificação, apesar da grande evolução ao longo do tempo, ainda não foram completamente aperfeiçoados, pecam especialmente para países que não têm inglês como primeira língua. Junto ao inegável crescimento da tecnologia, surgiram diversos softwares de Inteligência Artificial, que, de acordo com alguns autores, realizam tarefas de processamento de linguagem natural. Apesar de grandes modelos de linguagem não serem especificamente projetados para serem usados em ambientes e situações médicas, acabam sendo bastante usados por pacientes e profissionais como um elemento de apoio. Junto a esses avanços, há a tecnologia médica, que também vai para frente em seus métodos, tornando os prontuários eletrônicos cada vez mais usados, e consequentemente deixando a codificação dos termos mais essencial ainda. Um prompt é uma espécie de pergunta proposta a um grande modelo de linguagem buscando receber a resposta mais próxima do correto e esperado. Treinar uma grade modelo de linguagem compreende uma técnica de ensiná-los como gerar e entender a linguagem humana, esta técnica corresponde a um pré-processamento, seguido da configuração e treinamento do modelo, finalizando com ajustes finos. Seguindo os treinamentos, o few-shot é um tipo de prompt que apresenta exemplos parecidos com o que será perguntado, junto às respostas, para que o grande modelo possa se contextualizar. OBJETIVOS: Aprimorar grandes modelos de linguagem para a codificação de termos extraídos de narrativas clínicas em português, utilizando terminologia padronizada. MATERIAIS E MÉTODO: O trabalho foi realizado a partir de 5 etapas, mas no início foi realizado o desenvolvimento de um prompt que extraísse os termos relevantes das narrativas clínicas de origem. Após este desenvolvimento, iniciou-se a realização do prompt que faria a codificação de tais termos, seguindo a técnica utilizada no prompt anterior. RESULTADOS: Por meio das respostas obtidas, é visível como o Gemini não conseguiu pegar códigos reais, o MariTalk simplesmente respondia que não poderia ajudar na situação, e o ChatGPT não chegou a acertar todos os códigos esperados, mas trouxe erros mínimos no último prompt. CONSIDERAÇÕES FINAIS: Os resultados não atenderam o esperado, porém, chegaram muito próximo de sair sem defeitos, apenas com erros superficialmente mínimos. Ainda que a inteligência artificial e os LLM’s sejam de fato capazes de ajudar bastante no dia a dia de muitas pessoas em diversos trabalhos e cenários diferentes, um ambiente médico não é o lugar para correr este risco, especialmente quando é mais seguro ir diretamente ao site e achar exatamente o que se quer que seja expresso.
PALAVRAS-CHAVE: Codificação; Inteligência Artificial; Grandes Modelo de Linguagem; Few-shot; ChatGPT