Título
Mineração segura de dados de saúde na nuvem: Uma abordagem de computação homomórfica para análises preditivas com preservação de privacidade
Autor
Bergano, André Filipe Inácio Ramos
Resumo
pt
A partilha de dados e a reutilização de serviços no setor de saúde são problemas significativos devido a questões de privacidade e segurança. A Comissão Europeia classificou os dados de saúde como um recurso único devido à capacidade de realizar pesquisas prospetivas e retrospetivas a baixo custo. Da mesma forma, a OCDE incentiva os países membros a criarem e implementarem sistemas de governação de dados de saúde que protejam a privacidade individual, permitindo o compartilhamento de dados. Técnicas como data mining ou text mining podem ser aplicadas aos registos médicos com o intuito de ganhar conhecimento acerca dos dados disponíveis, em particular, na identificação de padrões que facilitem o processo de diagnóstico ou na criação de modelos de previsão de doenças.
Esta dissertação propõe o uso de computação homomórfica, efetuada na cloud, através da qual técnicas de mineração de dados possam ser aplicadas aos dados, por forma manter a privacidade dos pacientes e baseou-se num conjunto de dados do Hospital Santa Maria em Lisboa, obtidos através de Acordos de Prestação de Serviços Digitais desenvolvidos no âmbito do projeto FCT DSAIPA/AI/0122/2020 AIMHealth - Aplicações Móveis Baseadas em Inteligência Artificial para Resposta de Saúde Pública.
Foi seguida a metodologia de mineração de dados CRISP-DM e foi possível aplicar modelos de aprendizagem automática que pudessem efetuar predições referentes a picos de frequência cardíaca.
Os modelos aplicados previram com êxito problemas cardíacos com uma taxa de sucesso positiva, mesmo no contexto de computação homomórfica. Esta dissertação demonstrou que a utilização de aprendizagem automática pode ser uma ferramenta valiosa tanto na cloud usando técnicas de encriptação de dados como em ambientes privados.
en
Data sharing and service reuse in the health sector is a significant problem due to privacy and security issues. The European Commission has classified health data as a unique resource owing to the ability to do both prospective and retrospective research at a low cost. Similarly, the OECD encourages member nations to create and implement health data governance systems that protect individual privacy while allowing data sharing. Techniques like data mining or text mining may be applied to medical records to gain knowledge about the data available, particularly in identifying patterns that might ease the diagnosis process or in creating illnesses predicting models.
This dissertation proposes the use of homomorphic computing, carried out in the cloud, through which data mining techniques can be applied, in order to maintain patient privacy and was based on a set of data from Hospital Santa Maria in Lisbon, obtained through Digital Service Provision Agreements developed within the scope of the FCT project DSAIPA/AI/0122/2020 AIMHealth - Mobile Applications Based on Artificial Intelligence for Public Health Response.
The CRISP-DM data mining methodology was followed, and it was possible to apply machine learning models that could make predictions regarding heart rate peaks.
The applied models successfully predicted heart problems with a positive success rate, even in the context of homomorphic computing. This dissertation demonstrated that the use of machine learning can be a valuable tool both in the cloud using data encryption techniques and in private environments.