A representação temática de artigos da área de saúde pública em português: um olhar particular da indexação automática

Esta tese objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática de artigos publicados em português na área de saúde pública, com o apoio teórico da mineração de textos. Propõe-se uma análise de coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi apresentada de 104 textos publicados em português em seis jornais brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library - SciELO, publicados no ano de 2020. A pesquisa baseadaou-se na bibliometria, desenvolvida no processamento da linguagem natural , com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, representação do volume e desses textos para a indexação automática dessa produção. O estudo aponta que a coerência do conteúdo dos artigos treinados com seus termos representativos poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da recuperação da informação. Foi também possível perceber como esse processo pode colaborar no aprimoramento da representação de conteúdo de artigos na área da saúde pública, apesar de a área apresentar possuir um vocabulário controlado.

Orientador
Cicera Henrique da Silva
Segundo orientador
Rosane Abdala Lins
Autor
Fatima Cristina Lopes dos Santos
Citação

SANTOS, Fátima Cristina Lopes dos. A representação temática de artigos da área de saúde pública em português: um olhar exploratório da indexação automática. 2023. 186f. Tese (Doutorado em Informação e Comunicação em Saúde) - Programa de Pós-Graduação em Informação e Comunicação em Saúde, Instituto de Comunicação e Informação Científica e Tecnológica em Saúde, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2023.

Ano
2023
Palavras-chave
Indexação automática
Linguagem Natural
Coerência Semântica
Artigos Científicos
Saúde Pública
Brasil
Banca (Integrantes PPGICS)
Maria Cristina Soares Guimarães
Josué Laguardia
Banca (Integrantes Externos)
Rogério Henrique de Araújo Júnior (Unib)
Jeorgina Gentil Rodrigues (Icict/Fiocruz)
Tipo de documento
Tese