Título
Machine learning models to predict electricity consumption and the impacts of COVID-19 in Portugal
Autor
Sucena, Ana Sofia Lobato
Resumo
pt
Esta tese analisa a forma como os modelos de “machine learning” e os dados provenientes de fontes
de dados públicas podem ser utilizados para prever o consumo de eletricidade em Portugal. Boas
previsões são cruciais para uma gestão eficiente do setor energético, nomeadamente devido ao
aumento da procura global de energia. Portugal apresenta um ótimo caso para a previsão de consumo,
uma vez que depende significativamente de importações de energia e sofre de pobreza energética.
O estudo utiliza uma metodologia baseada em dados para analisar doze anos de padrões de
consumo energético e analisar a forma como a pandemia do COVID-19, os padrões climáticos e o PIB
afetam o consumo de eletricidade. Foram estudados cinco modelos preditivos - SARIMA, SARIMAX,
VAR, SVR e LSTM – e os seus indicadores de desempenho em dois períodos diferentes (um para os
doze anos de analise, incluído durante o Covid-19, e outro apenas para dados antes do Covid-19).
Assim, este estudo permite avaliar a prestação dos modelos de machine learning em periodos estáveis
e não estáveis
O estudo reconhece as suas limitações, como a falta de dados na era pós-COVID, mas continua a
fornecer informações úteis para o desenvolvimento e a gestão de políticas energéticas.
en
This thesis analyzes how data from public data sources and machine learning models can be used to
forecast electricity consumption in Portugal. Accurate forecasts are crucial for efficient energy
management, given the rising global demand for energy. Portugal presents a compelling case for
consumption projections since it significantly relies on energy imports and suffers from poverty.
The study uses a data-driven methodology to analyze twelve years of consumption patterns and
examine how the COVID-19 pandemic, weather patterns, and GDP affect electricity use. Five predictive
models were studied - SARIMA, SARIMAX, VAR, SVR and LSTM - and their performance indicators in
two different periods (one for the twelve years of analysis, including during Covid-19, and the other
only for data before Covid-19). Thus, this study makes it possible to evaluate the performance of
machine learning models in stable and non-stable periods.
The study acknowledges its limitations, such as the lack of data in the post-COVID era, while
providing valuable insights for developing and managing energy policies.