Aplicação de modelos de machine learning para previsão do housing price em Singapura
Francisco, António Muinga
A habitação constitui uma das necessidades mais essenciais da vida humana assim como outras
necessidades fundamentais como a comida, água, segurança. Mas simultaneamente é um bem de
investimento e os imóveis são ativos reais cujo preço se relaciona com o ciclo económico e, portanto,
com a inflação, a taxa de juro, etc., razão pela qual, flutuações no preço da habitação sempre constituem
preocupações para a sociedade, tornando o setor imobiliário num campo interessante de pesquisa.
Este trabalho representa um contributo inovador pelos métodos e técnicas utilizados ao aplicar
Machine Learning (ML), uma abordagem recente, para fazer previsões com elevado nível de acurácia e
precisão. O trabalho utiliza algoritmos de regressão LASSO e Random Forest, para criar modelos de ML
e, como principais métricas para avaliar a sua performance, o RMSE (Root Mean Squared Error), R2,
(coeficiente de determinação) e MAE (Mean Absolute Error).
O mercado de habitação analisado é Singapura, para o qual existe informações sobre as transações
de venda de imoveis disponibilizados pelo Housing & Development Board (HDB), e o período
considerado foi Janeiro de 1990 a Dezembro de 2023. O modelo Random Forest apresentou a melhor
performance, tendo sido selecionado como o modelo final para a previsão do preço da habitação, cujos
resultados ajudaram identificar os principais fatores determinantes do preço da habitação, e fornecem
informações valiosas para formulação de políticas de habitação, especialmente para o controle e
regulação de preços da habitação em Singapura.
Housing constitutes one of the most essential needs of human life, as well as other fundamental needs
such as food, water and security. But at the same time, it is an investment good and real estate is a real
asset whose price is related to the economic cycle and, therefore, to inflation, interest rates, etc., which
is why fluctuations in the price of housing are always concerns for society, making the real estate sector
an interesting field of research.
This work represents an innovative contribution due to the methods and techniques used when
applying Machine Learning (ML), a recent approach, to make predictions with a high level of accuracy
and precision. The work uses LASSO and Random Forest regression algorithms to create ML models
and, as main metrics to evaluate their performance, RMSE (Root Mean Squared Error), R2, (coefficient
of determination) and MAE (Mean Absolute Error).
The housing market analysed is Singapore, for which there is information on property sales
transactions made available by the Housing & Development Board (HDB), and the period considered
was January 1990 to December 2023. The Random Forest model presented the best performance, having
been selected as the final model for forecasting housing prices, the results of which helped identify the
main factors determining housing prices, and provide valuable information for the formulation of
housing policies, especially for the control and regulation of housing prices in Singapore.