Esta tese objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática de artigos publicados em português na área de saúde pública, com o apoio teórico da mineração de textos. Propõe-se uma análise de coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi apresentada de 104 textos publicados em português em seis jornais brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library - SciELO, publicados no ano de 2020. A pesquisa baseadaou-se na bibliometria, desenvolvida no processamento da linguagem natural , com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, representação do volume e desses textos para a indexação automática dessa produção. O estudo aponta que a coerência do conteúdo dos artigos treinados com seus termos representativos poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da recuperação da informação. Foi também possível perceber como esse processo pode colaborar no aprimoramento da representação de conteúdo de artigos na área da saúde pública, apesar de a área apresentar possuir um vocabulário controlado.
SANTOS, Fátima Cristina Lopes dos. A representação temática de artigos da área de saúde pública em português: um olhar exploratório da indexação automática. 2023. 186f. Tese (Doutorado em Informação e Comunicação em Saúde) - Programa de Pós-Graduação em Informação e Comunicação em Saúde, Instituto de Comunicação e Informação Científica e Tecnológica em Saúde, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2023.