Teses e dissertações

Mestrado
Ciência de Dados
Título

Classificação de tendências e previsão de preço do Índice S&P 500: Trading recorrendo a deep learning e XGBoost

Autor
Neves, Marta Sofia Morgado das
Resumo
pt
Esta dissertação visa otimizar as estratégias de investimento no índice S&P 500 através do desenvolvimento de dois modelos: previsão dos seus movimentos, discernindo se o preço subirá ou declinará no dia subsequente, além de antecipar o respetivo valor de fecho. Os algoritmos escolhidos foram o eXtreme Gradient Boosting (XGBoost) e o Long Short-Term Memory (LSTM), devido aos seus desempenhos comprovados empiricamente. Para aprimorar o desempenho dos modelos, foram incorporadas variáveis exógenas, a saber: preço do petróleo, Índice VIX e Índice Dow Jones, com o objetivo de capturar eventos de maior imprevisibilidade que possam influenciar o comportamento do referido Índice. No problema de classificação, o modelo atingiu uma accuracy de 94%, sugerindo a capacidade de discernir com confiabilidade se o preço subirá ou descerá no dia subsequente. No que concerne ao problema de previsão do preço de fecho, o modelo registou um Root Mean Square Error (RMSE) de 8.94, indicando que, em média, as previsões distanciam-se 8.94 dólares do valor real. Este resultado mostra que o modelo possui uma boa capacidade de previsão, apesar da margem de erro presente. A inclusão das variáveis exógenas permitiu aumentar a accuracy do problema de classificação, em 20 pontos percentuais, desempenhando, assim, um papel significativo na melhoria das previsões sobre o movimento do índice S&P 500. Porém, no problema de regressão, esta inclusão, não contribuiu de forma positiva para o desempenho do modelo. Realça-se que, qualquer aplicação prática dos modelos propostos requer análises adicionais e ponderações devido à volatilidade e complexidade dos mercados financeiros.
en
This dissertation aimed to optimize investment strategies in the S&P 500 index by developing two models: predicting its movements, discerning whether the price will rise or decline the following day and anticipating its closing value. Due to their empirically proven performances, the algorithms chosen were eXtreme Gradient Boosting (XGBoost) and Long Short-Term Memory (LSTM). To improve the performance of the models, exogenous variables were incorporated, namely: oil price, VIX Index and Dow Jones Index, to capture events of greater unpredictability that may influence the behaviour of the Index. In the classification problem, the model achieved an accuracy of 94%, suggesting the ability to reliably discern whether the price will rise or fall the following day. Regarding the problem of predicting the closing price, the model recorded a Root Mean Square Error (RMSE) of 8.94, indicating that, on average, the predictions are 8.94 dollars away from the actual value. This result shows that the model has a good predictive capacity, despite the margin of error present. Including the exogenous variables increased the accuracy of the classification problem by 20 percentage points, thus playing a significant role in improving predictions about the movement of the S&P 500 index. However, in the regression problem, this inclusion did not contribute positively to the model's performance. It should be noted that any practical application of the proposed models requires additional analysis and weighting due to the volatility and complexity of financial markets.

Palavras-chave

Previsão
Forecasting
LSTM
Classificação -- Ranking
Índice Standard and Poor's -- S&P 500
Variáveis exógenas
XGBoost
Exogenous variables

Acesso

Acesso livre

Ver no repositório  
Voltar ao topo