Título
Unveiling the features of successful ebay sellers of smartphones: a data mining sales predictive model
Autor
Silva, Ana Teresa Nunes Biscaia Correia da
Resumo
pt
O EBay é uma das plataformas e retalho online de maior dimensão e abarca inúmeras
oportunidades de extração de dados de feedback dos consumidores sobre vários
vendedores. Em concordância, o advento da Web 2.0 e das compras online está
fortemente associado à geração de dados em abundância e à possibilidade da sua respetiva
recolha através de variados dispositivos e plataformas. Estes dados encontram-se,
frequentemente, desestruturados o que inevitavelmente revela a necessidade da sua
normalização e tratamento mais aprofundado de modo a possibilitar tarefas de
classificação, descoberta de padrões e tendências ou de previsão. A complexidade dos
métodos estatísticos aplicados para executar essas tarefas aumenta ao mesmo tempo que
a dimensão das bases de dados. Atualmente, existem bases de dados que atingem vários
exabytes e que se constituem como oportunidades para extração de conhecimento dado
que métodos apropriados e particularizados sejam utilizados. Pretende-se, então, com o
presente estudo quantificar e analisar quais e de que modo as características de
vendedores e produtos influenciam as vendas de smartphones no eBay, recorrendo ao
enquadramento conceptual e técnicas de mineração de dados. Os métodos utilizados
incluem máquinas de vetores de suporte (SVMs) visando a modelação das vendas de
smartphones por vendedores do eBay em combinação com validação cruzada 10-fold de
modo a assegurar a robustez do modelo e com recurso às métricas de avaliação de
desempenho erro absoluto médio (MAE), erro absoluto relativo (RAE) e erro absoluto
médio normalizado (NMAE) para garantir a precisão do modelo preditivo. Seguidamente,
é implementada a análise de sensibilidade para aferir a contribuição individual de cada
atributo para as vendas. Os métodos são considerados eficazes tanto na avaliação do
modelo como na extração de conhecimento visto que viabilizam resultados positivos
ainda que sejam verificadas discrepâncias entre as estimativas para diferentes métricas de
desempenho. Finalmente, foi possível descobrir que número de itens em leilão, o preço
médio e a variedade de produtos disponibilizada por cada vendedor foram os atributos
mais significantes, i.e., os que mais contribuíram para as vendas.
en
EBay is one of the largest online retailing corporations worldwide, providing numerous
ways for customer feedback on registered sellers. In accordance, with the advent of Web
2.0 and online shopping, an immensity of data is collected from manifold devices. This
data is often unstructured, which inevitably asks for some form of further treatment that
allows classification, discovery of patterns and trends or prediction of outcomes. That
treatment implies the usage of increasingly complex and combined statistical tools as the
size of datasets builds up. Nowadays, datasets may extend to several exabytes, which can
be transformed into knowledge using adequate methods. The aim of the present study is
to evaluate and analyse which and in what way seller and product attributes such as
feedback ratings and price influence sales of smartphones on eBay using data mining
framework and techniques. The methods used include SVM algorithms for modelling the
sales of smartphones by eBay sellers combined with 10-fold cross-validation scheme
which ensured model robustness and employment of metrics MAE, RAE and NMAE for
the sake of gauging prediction accuracy followed by sensitivity analysis in order to assess
the influence of individual features on sales. The methods were considered effective for
both modelling evaluation and knowledge extraction reaching positive results although
with some discrepancies between different prediction accuracy metrics. Lastly, it was
discovered that the number of items in auction, average price and the variety of products
available from a given seller were the most significant attributes, i.e., the largest
contributors for sales.