ATENÇÃO: Esta página foi traduzida automaticamente pelo Google Translate. Isto pode ter consequências inesperadas no conteúdo apresentado e, portanto, não nos responsabilizamos pelo resultado dessa tradução automática.


ATTENTION: this page has been automatically translated by Google Translate. This can have unexpected consequences and, therefore, we do not take responsibility for the result of that automatic translation.

menu
menu close
MestradoMestrado em Informática e Gestão

Attribute-value inference using deep neural networks

Autor
Ramos, Kevin Almeida
Data de publicação
27 Mar 2020
Acesso
Acesso livre
Palavras-chave
Extração de informação
Information extraction
Named entity recognition
Neural sequence labeling
Reconhecimento do nome da entidade
Etiquetagem sequencial neuronal
Resumo
PT
Os padrões de consumo da população alteraram-se nos últimos anos e o e-commerce foi um dos grandes responsáveis. O consumidor tornou-se muito exigente e bastante conhecedor do produto e os websites foram-se adaptando, disponibilizando mais informação e melhorando o sistema de filtragem, adicionando descrições detalhadas dos produtos e as suas características. Extrair diferentes características de milhares de produtos é uma tarefa com um custo bastante elevado. Neste trabalho, criamos três conjuntos de dados que posteriormente foram usados pelo nosso modelo com três camadas, CNN-BiLSTM-CRF, para inferir valores de atributos de produtos anteriormente desconhecidos através da descrição dos produtos. Inferiu com 64% de macro média de f1-score, não sendo relacionável com o estado de arte devido ao contexto dos testes serem distinto.
EN
The population’s consumption patterns have changed over the last few years and e-commerce has been one of the main drivers. The consumer became very demanding and very knowledgeable about the product and the websites were adapting, providing more information and improving the filtering system by adding detailed descriptions of the products and their characteristics. Extracting different characteristics from thousands of products is a task with a very high cost. In this work, we created three datasets that were later used by our model with three layers, CNN-BiLSTM-CRF, to infer values of attributes of previously unknown products through the description of products. It inferred with 64% of macro average of f1-score, not being related to the state of the art due to the different context of the tests.

Relacionadas