Termos como big data e ciência de dados ganharam visibilidade nas últimas décadas, sendo em geral associados aos desafios de análise de grandes bases de dados. Pretende-se com este trabalho reunir teorias e métodos da Ciência de Dados em Saúde como uma contribuição à Saúde Pública, estudando o ciclo de geração e disseminação de informação em saúde e aplicar técnicas de coleta, extração e visualização de dados com métodos de ciência de dados. Partindo de uma perspectiva histórica, a relação entre dados e saúde foi visitada, apresentando um novo paradigma da ciência de dados em saúde, considerando as possibilidades hibridas de uma ciência theory & data driven para a Saúde Pública. Os métodos e modelos de processo de ciência de dados, especificamente o KDD, SEMMA e CRISP-DM, foram explorados criticamente. Avaliando seus pontos em comum, um novo modelo de processos denominado KDD-PH (Knowledge Discovery in Databases for Public Health) foi proposto, sugerindo etapas específicas para um modelo de processos de ciência de dados para a pesquisa em saúde pública. Produções acadêmicas autorais foram apresentadas como resultados da aplicação prática destes métodos.
SALDANHA, Raphael de Freitas. Da aquisição a visualização de dados: aplicações da ciência de dados em saúde. 2021. 167f. Tese (Doutorado em Informação e Comunicação em Saúde) - Instituto de Comunicação e Informação Científica e Tecnológica em Saúde, Fundação Oswaldo Cruz, Rio de Janeiro, 2021.