Título
Sentiment analysis in the stock market based on Twitter data
Autor
Sacramento, José Maria Guerreiro Ferreira Félix do
Resumo
pt
Nesta dissertação, é analisada a forma como a plataforma Twitter pode ajudar a detectar sentimento
público relativamente a empresas cotadas em bolsa, com foco em empresas que fazem
parte do indíce americano S&P 500. A obtenção de dados é feita através de um web scrapper, que
recolhe tweets através de funções de pesquisa avançada, baseada em queries associadas às empresas
em análise. O conteúdo dos tweets são classificados como positivos, neutros ou negativos,
sendo os resultados comparados de seguida com os preços das ações. Nesse sentido, é proposta
um arquitectura de trabalho, com a respetiva implementação, que inclui vários modelos de
análise de sentimento e técnicas de Machine Learning. Por outro lado, de modo a estabelecer
quais são os modelos mais adequados para detectar e classificar sentimentos, são criados várias
representações visuais para avaliar e comparar resultados.
Como conclusão, os resultados obtidos mostram que um aumento do número de tweets conduz
a oscilações, quer no preço, quer na quantidade de ações transacionadas. Além disso, a análise
de dados levada a cabo relativamente a algumas empresas em estudo, mostra que a utilização
de médias móveis de resultados de sentimento torna a leitura da análise mais clara e evidente,
o que é bastante útil para medir a força ou fraqueza do preço de determinada ação. Acima de
tudo, tal poderá ser percecionado como um indicador de momento para o mercado de capitais.
en
In this dissertation, we discuss how Twitter can help detecting public sentiment towards companies
listed in the stock market, in particular listed in the S&P 500 index (S&P 500). The
collection of data is done through a web scrapper that collects tweets from Twitter, using advanced
search features based on queries related to the companies under scrutiny. The content
of tweets are classified as positive, neutral or negative sentiments and the outcome is then
compared against stock market prices. To do so, it is proposed and implemented a framework
with different Sentiment Analysis (SA) models and Machine Learning (ML) techniques. Also, to
establish which models are more appropriate in detecting and classifying sentiments, a series
of visual representations were created to evaluate and compare results.
As a conclusion, the results obtained show that an increase in the volume of tweets leads to
oscillations in both stock price and trading volume. Furthermore, the data analysis performed
in relation to some companies under scope shows that the use of moving averages of sentiment
scores makes the analysis clearer and more insightful, which is particular useful when measuring
the strength or weakness of the price of a stock. In the end, it can be perceived as a
momentum indicator for the stock market.