Teses e dissertações

Mestrado
Engenharia Informática
Título

Applying federated learning to a Covid-19 anomaly detection pipeline

Autor
Polido, Susana Isabel de Carvalho
Resumo
pt
A pandemia de COVID-19 de 2020 espalhou-se rapidamente, sobrecarregando os sistemas de saúde e causando milhões de mortes em todo o mundo. Investigadores e cientistas concentraram esforços em encontrar soluções para ajudar a detetar e conter a propagação da doença, incluindo ferramentas alimentadas por modelos de aprendizagem automática. Entre os estudos efetuados, vários exploram diferenças entre sinais biométricos de pessoas que contraíram COVID-19, recolhidos antes e depois da infeção, em busca de padrões que possam ajudar a detetar a doença o mais rápido possível. Em particular, em sinais relacionados com a frequência cardíaca recolhidos através de dispositivos como smartwatches. Esses estudos resultaram em algumas ferramentas de deteção, mas precisam que os utilizadores tenham dados anteriores a contraírem a doença para serem usados, contendo elementos de personalização com base nos dados saudáveis para funcionarem. Mas e se um novo utilizador não possuir dados saudáveis? Poderá um modelo treinado com dados de uns indivíduos detetar a doença noutros, com sucesso? Este trabalho explora essa situação transportando uma ferramenta de deteção de anomalia personalizada para um ambiente de Aprendizagem Federada, a fim de ver seu comportamento em dados de indivíduos que participaram no treino do modelo e de novos indivíduos, incluindo dados recolhidos por dispositivos hospitalares de indivíduos internados numa unidade de cuidados intensivos, que dificilmente contém dados saudáveis. Embora os modelos resultantes em média, não detetem mais anomalias verdadeiras do que os modelos personalizados, seu desempenho ´e semelhante quando aplicado a dados de indivíduos de treino e novos indivíduos.
en
The COVID-19 pandemic of 2020 spread around the world fast, overwhelming healthcare systems and causing millions of deaths all over the globe. Researchers and scientists rushed to find tools to help detect and contain the spread of the disease, including automatic ones powered by machine learning models. Amongst the efforts, several studies focused on exploring differences between biometric signals in people with the disease collected before and after the infection, in search of patterns that can help detect it as soon as possible. In particular, heart rate related signals collected via devices such as smartwatches. These studies have resulted in some detection tools, but they always require users to have data from before the infection occurred in order to be used and often contain personalization based on this healthy data. But what if a new user has not yet collected healthy data? Can a model trained with the data of other individuals successfully detect the illness on a novel one? This work explores that situation by taking an individual based anomaly detection and transporting into a Federated Learning environment in order to see its behavior on the data from individuals that trained the model and novel individuals, including data collected via hospital devices from individuals admitted to the intensive care unit which is unlikely to contain healthy data. Although the resulting models, on average, did not detect more true anomalies than the personalized ones, their performance is similar when applied to the training individuals and novel ones.

Data

03-jan-2024

Palavras-chave

Machine learning
Aprendizagem automática
Anomaly detection
Deteção de anomalias
Federated learning
Health model
Aprendizagem federada
Modelo na saúde

Acesso

Acesso livre

Ver no repositório  
Voltar ao topo