Título
Stripping customers' feedback on hotels evaluation through data mining
Autor
Coelho, Joana Pinto
Resumo
pt
Com a constante evolução tecnológica e a consequente afluência de partilha de informação entre os consumidores, as plataformas online, como é o caso do TripAdvisor, começaram a ser usadas para análise, principalmente na indústria hoteleira. Estas plataformas permitem aos clientes a partilha de opiniões e a respectiva atribuição de uma avaliação quantitativa aos hotéis visitados. Os estudos publicados têm-se focado, fundamentalmente, na análise dos comentários; contudo, estudos relacionados com a avaliação quantitativa são mais escassos.
Este estudo foi desenvolvido através de técnicas de data mining por forma a modelar a pontuação atribuída no TripAdvisor. Foram recolhidos dois comentários por cada mês do ano de 2015 referentes a 21 hotéis localizados na avenida mais emblemática de Las Vegas, a Strip, num total de 504 comentários. A localização foi seleccionada por ser um destino de elevado impato turístico já que a cidade persiste devido à hotelaria e aos casinos. Foram seleccionadas 19 variáveis que representam o utilizador, o hotel e as suas características para alimentarem uma máquina de vectores de suporte objectivando a modelação da avaliação quantitativa para extração de conhecimento. Os resultados atestaram a utilidade do modelo na sua capacidade preditiva. Após esta validação foi aplicada uma análise de sensibilidade ao modelo para compreender a relevância das variáveis.
Os resultados revelaram que as variáveis diretamente relacionadas com o utilizador e a sua experiência na utilização do TripAdvisor têm maior influência na atribuição das pontuações, comparativamente com as variáveis relacionadas com o hotel.
en
The emergence of online reviews’ platforms such as TripAdvisor provided tools for tourists to write their opinions and rate hotels with a quantitative score. While numerous studies are found based on textual comments of users, research on the score is rather scarce.
This study presents a data mining approach for modeling TripAdvisor score using 504 reviews published in 2015 for the 21 hotels located in the Strip, Las Vegas. Nineteen features characterizing the reviews, hotels and the users were prepared and used for feeding a support vector machine for modeling the score. The results achieved reveal the model is a good approximation for predicting the score. Therefore, a sensitivity analysis was applied over the model for extracting useful knowledge translated into features’ relevance for the score. The findings unveiled user features related to TripAdvisor membership experience play a key role in influencing the scores granted, clearly surpassing hotel features.