Teses e dissertações

Mestrado
Sistemas Integrados de Apoio à Decisão
Título

Social media insights about COVID-19 in Portugal: A text mining approach

Autor
Marreiros, Carolina Ferraz
Resumo
pt
A rápida propagação da COVID-19 em todo o mundo teve um impacto significativo na vida quotidiana. Tal como noutros países, foram tomadas medidas em Portugal para combater o aumento exponencial de casos, tais como o recolher obrigatório e o uso de máscaras. Assim, em paralelo com as consequências diretas na saúde e no seu sector, a pandemia causou também mudanças no comportamento humano a nível sociológico. O objetivo da presente dissertação é obter uma perceção da realidade relativa à COVID-19. Nesse sentido, foram extraídos dados de três fontes, sendo duas delas redes sociais - Twitter e Reddit - e a outra o Público, um site de notícias português. A abordagem desenvolvida, baseada em identificação de tópicos e análise de sentimentos, foi validada no contexto português com um período de dados superior a um ano, mas pode ser aplicada em situações semelhantes e noutros países de modo a contribuir para o apoio à tomada de decisão. Após a extração dos dados, estes foram preparados para aplicação de ferramentas de processamento de linguagem natural (PNL) específicas da língua portuguesa, o que representa um desafio devido ao vasto vocabulário. Com a informação obtida, foi construído um conjunto de visualizações, para posteriormente extrair conhecimento sobre o contexto pandémico em Portugal. Concluiu-se que os tópicos discutidos nas redes sociais refetem os eventos relacionados com a pandemia. Numa fase final, estas visualizações foram avaliadas por peritos na área, que destacaram o potencial dos resultados. Os dados e visualizações serão disponibilizados à comunidade científica, mediante pedido prévio.
en
The rapid spread of COVID-19 around the world had a significant impact on daily life. As in other countries, measures were taken in Portugal to combat the exponential increase of cases, such as curfews and the use of masks. Thus, in parallel with the direct consequences on health and the healthcare sector, the pandemic also caused changes in human behavior from a sociological viewpoint. The objective of this dissertation is to attain a perception of the reality concerning COVID-19. For this purpose, real-time data was extracted from three sources, two of them being social media platforms - Twitter and Reddit - and the other one being Público, a Portuguese online newspaper. The adopted approach, based on topic modeling and sentiment analysis, was validated within the Portugal context, concerning data over a period of one year, but it can equally be employed in similar situations and other countries and provide decision-making support. After the data extracting, it was prepared for application of natural language processing (NLP) tools specific to the Portuguese language, which can represent a challenge due to the lexical richness. With the gathered information, a dashboard was built, with the purpose of gaining insights on the COVID-19 pandemic in Portugal. It was concluded that the topics discussed on social media reflect the events related to the pandemic. In a final stage, these dashboards were evaluated by public health experts, who highlighted the potential of the results obtained. The data and dashboards will be made available to the scientific community upon request.

Palavras-chave

Opinião pública
Public opinion
Sentiment analysis
Análise de sentimentos
Natural language processing
Processamento da língua natural
COVID-19
Media sociais -- Social media
Topic modeling
Modelagem de tópicos

Acesso

Acesso livre

Ver no repositório  
Voltar ao topo