Título
Extracting clinical knowledge from electronic medical records
Autor
Lamy, Manuel Maria Vilela Pestana de Moura
Resumo
pt
Com a adopção cada vez maior das instituições de saúde face aos Processos Clínicos
Electrónicos (PCE), estes documentos ganham cada vez mais importância em contexto
clínico, devido a toda a informação clínica que contêm relativamente aos pacientes. No
entanto, a informação não estruturada na forma de narrativas clínicas presente nestes
documentos electrónicos, faz com que seja difícil extrair e estruturar deles conhecimento
clínico. Esta informação não estruturada limita o potencial dos PCE, uma vez que essa
mesma informação, caso seja extraída e estruturada devidamente, pode servir para que as
instituições de saúde possam efectuar actividades importantes com maior eficiência e
sucesso, como por exemplo actividades de pesquisa, sumarização, apoio à decisão,
análises estatísticas, suporte a decisões de gestão e de investigação. Este tipo de
actividades apenas podem ser feitas com sucesso caso a informação clínica não
estruturada presente nos PCE seja devidamente extraída, estruturada e processada em
conhecimento clínico. Habitualmente, esta extração é realizada manualmente pelos
profissionais médicos, o que não é eficiente e é susceptível a erros. Esta dissertação
pretende então propôr uma solução para este problema, ao utilizar técnicas de Tradução
Automática (TA) da língua portuguesa para a língua inglesa, Processamento de
Linguagem Natural (PLN) e Extração de Informação (EI). O objectivo é desenvolver um
sistema protótipo de módulos em série que utilize estas técnicas, possibilitando a extração
de conhecimento clínico, de uma forma automática, de informação clínica não estruturada
presente nos PCE de um hospital português. O principal objetivo é ajudar os PCE a
atingirem todo o seu potencial em termos de conhecimento clínico que contêm e
consequentemente ajudar o hospital português em questão envolvido nesta dissertação,
demonstrando também que este sistema protótipo e esta abordagem podem
potencialmente ser aplicados a outros hospitais, mesmo que não sejam de língua
portuguesa.
en
As the adoption of Electronic Medical Records (EMRs) rises in the healthcare
institutions, these resources’ importance increases due to all clinical information they
contain about patients. However, the unstructured information in the form of clinical
narratives present in these records makes it hard to extract and structure useful clinical
knowledge. This unstructured information limits the potential of the EMRs because the
clinical information these records contain can be used to perform essential tasks inside
healthcare institutions such as searching, summarization, decision support and statistical
analysis, as well as be used to support management decisions or serve for research. These
tasks can only be done if the unstructured clinical information from the narratives is
appropriately extracted, structured and processed in clinical knowledge. Usually, this
information extraction and structuration in clinical knowledge is performed manually by
healthcare practitioners, which is not efficient and is error-prone. This research aims to
propose a solution to this problem, by using Machine Translation (MT) from the
Portuguese language to the English language, Natural Language Processing (NLP) and
Information Extraction (IE) techniques. With the help of these techniques, the goal is to
develop a prototype pipeline modular system that can extract clinical knowledge from
unstructured clinical information contained in Portuguese EMRs, in an automated way,
in order to help EMRs to fulfil their potential and consequently help the Portuguese
hospital involved in this research. This research also intends to show that this generic
prototype system and approach can potentially be applied to other hospitals, even if they
don’t use the Portuguese language.