Título
Implementing a data integration infrastructure for healthcare data: A case study
Autor
Mira, Miguel Pratas Ferreira
Resumo
pt
Nesta tese de mestrado são abordados os desafios e oportunidades na integração de dados de saúde,
com foco em pacientes com histórico de doenças cardiovasculares diagnosticados com COVID-19. O
objetivo principal desta pesquisa foi desenvolver uma abordagem abrangente para a integração de
dados de saúde de um hospital português num repositório comum compartilhado, no âmbito de um
Projeto europeu.
Para o efeito, foram analisadas as características e especificidades dos dados disponibilizados pelo
hospital, bem como da base de dados de destino, garantindo a privacidade da informação utilizada.
Além disso, foi desenvolvida uma arquitetura ETL para realizar o processo de extração, transformação
e carregamento dos dados do hospital para a base de dados de destino.
A metodologia de pesquisa envolveu uma revisão bibliográfica que identificou lacunas nas práticas
atuais, incluindo a interoperabilidade entre sistemas de saúde, padronização de formatos e
terminologias, questões de privacidade, bem como desafios técnicos e organizacionais.
O sucesso do processo ETL e a completude da base de dados de destino foram avaliados por meio
de métricas apropriadas, demonstrando a eficácia desse processo. Este trabalho contribui para o
campo de pesquisa da integração de dados de saúde, abordando os desafios e oportunidades na
gestão e análise de dados de saúde em pacientes com histórico de doenças cardiovasculares
diagnosticados com COVID-19.
A arquitetura ETL desenvolvida e a avaliação do processo ETL confirmam a viabilidade da
abordagem proposta. Os resultados destacam a importância da privacidade dos dados,
interoperabilidade e técnicas avançadas de análise de dados na área da saúde.
en
In this master thesis, the challenges and opportunities in health data integration are addressed,
focusing on data from patients with a history of cardiovascular disease diagnosed with COVID-19. The
main objective of this research was to develop a comprehensive approach for integrating health data
from a Portuguese hospital into a common shared repository within the scope of a European Project.
For this purpose, the characteristics and specificities of the hospital and target database data were
analyzed, ensuring the privacy and security of all the information used. In addition, an ETL architecture
was developed to perform the hospital's data extraction, transformation and loading to the target
database.
The research methodology involved a literature review that identified gaps in current practices,
including interoperability between healthcare systems, standardization of formats and terminologies,
privacy issues, and technical and organizational challenges.
The success of the ETL process and the completeness of the target database were evaluated using
appropriate metrics, demonstrating the effectiveness of this process. This work contributes to the
research field of health data integration by addressing the challenges and opportunities in health data
management and analysis in patients with a history of cardiovascular disease diagnosed with COVID-
19.
The developed ETL architecture and ETL process evaluation confirm the feasibility of the proposed
approach. The results highlight the importance of data privacy, interoperability, and advanced data
analysis techniques in healthcare.