Título
Classificação de tendências e previsão de preço do Índice S&P 500: Trading recorrendo a deep learning e XGBoost
Autor
Neves, Marta Sofia Morgado das
Resumo
pt
Esta dissertação visa otimizar as estratégias de investimento no índice S&P 500 através do
desenvolvimento de dois modelos: previsão dos seus movimentos, discernindo se o preço subirá ou
declinará no dia subsequente, além de antecipar o respetivo valor de fecho. Os algoritmos escolhidos
foram o eXtreme Gradient Boosting (XGBoost) e o Long Short-Term Memory (LSTM), devido aos seus
desempenhos comprovados empiricamente.
Para aprimorar o desempenho dos modelos, foram incorporadas variáveis exógenas, a saber:
preço do petróleo, Índice VIX e Índice Dow Jones, com o objetivo de capturar eventos de maior
imprevisibilidade que possam influenciar o comportamento do referido Índice.
No problema de classificação, o modelo atingiu uma accuracy de 94%, sugerindo a capacidade de
discernir com confiabilidade se o preço subirá ou descerá no dia subsequente.
No que concerne ao problema de previsão do preço de fecho, o modelo registou um Root Mean
Square Error (RMSE) de 8.94, indicando que, em média, as previsões distanciam-se 8.94 dólares do
valor real. Este resultado mostra que o modelo possui uma boa capacidade de previsão, apesar da
margem de erro presente.
A inclusão das variáveis exógenas permitiu aumentar a accuracy do problema de classificação, em
20 pontos percentuais, desempenhando, assim, um papel significativo na melhoria das previsões sobre
o movimento do índice S&P 500. Porém, no problema de regressão, esta inclusão, não contribuiu de
forma positiva para o desempenho do modelo.
Realça-se que, qualquer aplicação prática dos modelos propostos requer análises adicionais e
ponderações devido à volatilidade e complexidade dos mercados financeiros.
en
This dissertation aimed to optimize investment strategies in the S&P 500 index by developing two
models: predicting its movements, discerning whether the price will rise or decline the following day
and anticipating its closing value. Due to their empirically proven performances, the algorithms chosen
were eXtreme Gradient Boosting (XGBoost) and Long Short-Term Memory (LSTM).
To improve the performance of the models, exogenous variables were incorporated, namely: oil
price, VIX Index and Dow Jones Index, to capture events of greater unpredictability that may influence
the behaviour of the Index.
In the classification problem, the model achieved an accuracy of 94%, suggesting the ability to
reliably discern whether the price will rise or fall the following day.
Regarding the problem of predicting the closing price, the model recorded a Root Mean Square
Error (RMSE) of 8.94, indicating that, on average, the predictions are 8.94 dollars away from the actual
value. This result shows that the model has a good predictive capacity, despite the margin of error
present.
Including the exogenous variables increased the accuracy of the classification problem by 20
percentage points, thus playing a significant role in improving predictions about the movement of the
S&P 500 index. However, in the regression problem, this inclusion did not contribute positively to the
model's performance.
It should be noted that any practical application of the proposed models requires additional
analysis and weighting due to the volatility and complexity of financial markets.