Por Fernando Timoteo Fernandes, Tecnologista, Fundacentro, São Paulo, SP, Brasil
Ensaio “Perspectivas do uso de mineração de dados e aprendizado de máquina em saúde e segurança no trabalho” publicado pela Revista Brasileira de Saúde Ocupacional (vol. 44) discute e apresenta técnicas de mineração de dados (data mining) e aprendizado de máquina (machine learning). Os algoritmos de machine learning em conjunto com o processo de data mining são ferramentas poderosas para facilitar o processamento, a visualização e, consequentemente, a criação de modelos preditivos a partir de dados de distintas fontes. Tais técnicas podem potencializar as análises estatísticas, auxiliar na tomada de decisões e gerar conhecimentos na área de Saúde e Segurança no Trabalho (SST).
Os autores realizaram revisão bibliográfica na Biblioteca Virtual em Saúde (BVS) utilizando os termos data mining e machine learning como chaves de busca. Foram identificados estudos que utilizaram tais técnicas e as tendências de uso.
O ensaio discute o que é inteligência no contexto computacional e conceitos de inteligência artificial (RUSSEL; NORVIG, 2013); como o processo de mineração de dados (HAN; KAMBER; PEI, 2012) pode ser utilizado para a descoberta de novos conhecimentos; de que maneira os computadores podem auxiliar no diagnóstico de doenças, na predição de eventos futuros com o uso da estatística e na criação de modelos que utilizam aprendizado de máquina (HASTIE; TIBSHIRANI; FRIEDMAN, 2016). O processo de mineração de dados é abordado com aplicações práticas e são exemplificadas as principais categorias de aprendizado de máquina, assim como as maneiras de “ensinar” o computador a identificar padrões em grandes massas de dados e quais técnicas podem auxiliar na predição de acontecimentos futuros, como o surgimento de doenças e a incidência de óbitos.
As ferramentas e técnicas tradicionais apresentam desempenho insatisfatório ou limitam-se à estrutura de dados tabulares. O uso das técnicas apresentadas no ensaio insere-se no atual contexto de divulgação de dados abertos e de amplos volumes, por setores governamentais e privados, e da necessidade de integração e análise de dados de diferentes fontes e tipos: dados tabulares, dados textuais provenientes de redes sociais, dados audiovisuais e outros.
A preparação, o processamento e a análise de grandes volumes de dados de origens distintas, estruturados e não estruturados é, ao mesmo tempo, um desafio e uma oportunidade para a área de SST. Algoritmos de machine learning em conjunto com técnicas de data mining podem permitir a elaboração de modelos preditivos a partir de dados disponíveis no Sistema de Informação sobre Mortalidade (SIM), no Sistema de Informações de Nascidos Vivos (Sinasc), no Sistema de Informações Hospitalares do Sistema Único de Saúde (SIH-SUS), na Relação Anual de Informações Sociais (RAIS), no Sistema de Informação de Agravos de Notificação (Sinan) e também em imagens e textos (incluindo descrições em prontuários eletrônicos e registros tradicionais em papel).
Referências
HAN, J., KAMBER, M. and PEI, J. Data mining: concepts and techniques. San Francisco: Morgan Kaufmann, 2012.
HASTIE, T., TIBSHIRANI, R. and FRIEDMAN, J. (2nd ed.) The elements of statistical learning. Amsterdam: Springer, 2016.
RUSSEL, S. and NORVIG, P. Inteligência artificial. Rio de Janeiro: Elsevier, 2013.
Para ler o artigo, acesse
FERNANDES, F.T. and CHIAVEGATTO FILHO, A.D.P. Perspectivas do uso de mineração de dados e aprendizado de máquina em saúde e segurança no trabalho. Rev. bras. saúde ocup. [online]. 2019, vol. 44, e13, ISSN: 0303-7657 [viewed 27 November 2019]. DOI: 10.1590/2317-6369000019418. Available from: http://ref.scielo.org/r53t2t
Link externo
Revista Brasileira de Saúde Ocupacional – RBSO: <http://www.scielo.br/rbso>
Como citar este post [ISO 690/2010]:
Últimos comentários