Título
Anti-Russia or anti-Ukraine: How do Twitter users feel about the ongoing conflict between August 2022 and February 2023? A sentiment analysis approach
Autor
Rodrigues, Márcia Pico
Resumo
pt
A investigação apresentada nesta tese teve como objetivo analisar a evolução do sentimento dos utilizadores do Twitter face ao conflito Ucrânia-Rússia entre agosto de 2022 e fevereiro de 2023. Para melhor compreender esta evolução de sentimento e da opinião pública, pesquisámos literatura relativa às relações entre a Ucrânia e a Rússia desde 1991, o ano da dissolução da União Soviética. Utilizando uma combinação de técnicas de análise descritiva, Análise de Sentimento, Topic Modelling e algoritmos de Machine Learning, como Regressão Logística, Árvore de Decisão, Naïve Bayes, AdaBoost e XGBoost, analisámos a evolução dos sentimentos Anti-Ucrânia e Anti-Rússia expressos pelos utilizadores do Twitter durante o segundo semestre do conflito. Concluímos que, dentro dos nossos conjuntos de dados, existe uma maior prevalência de tweets que expressam sentimentos Anti-Ucrânia em comparação com sentimentos Anti-Rússia. O modelo XGBoost apresentou as melhores métricas de performance, com uma taxa de accuracy de 90% para o dataset com dados de agosto e setembro de 2022 e uma taxa de accucary de 93% para o dataset com dados de fevereiro de 2023.
en
The research presented in this thesis aimed to investigate the shifting sentiment among Twitter users regarding the Ukraine-Russia conflict between August 2022 and February 2023. To comprehend this sentiment variation and public opinion, we travelled back to 1991, the year of the Soviet Union's dissolution, and reviewed literature to gain deeper insights into the Ukraine-Russia relationship. Employing a combination of descriptive analysis techniques, Sentiment Analysis, Topic Modelling, and Machine Learning algorithms such as Logistic Regression, Decision Tree, Naïve Bayes, AdaBoost, and XGBoost, we examined the evolving Anti-Ukraine and Anti-Russia sentiments expressed by Twitter users during the second semester of the conflict. Our findings revealed that, within our datasets, there was a higher prevalence of tweets expressing Anti-Ukraine sentiments than those expressing Anti-Russia sentiments. Notably, the XGBoost model exhibited the most promising performance metrics, achieving an accuracy rate of 90% for the dataset with data from August and September 2022 and 93% accuracy for the dataset with data from February 2023.