Comparação de arquiteturas de redes neurais em NER para E-commerce brasileiro

dc.contributor.advisorNascimento, André Câmara Alves do
dc.contributor.advisorLatteshttp://lattes.cnpq.br/0622594061462533
dc.contributor.authorLins, Lucas Fernandes
dc.contributor.authorLatteshttp://lattes.cnpq.br/4135478250838033
dc.date.accessioned2025-08-26T12:28:36Z
dc.date.issued2023-04-19
dc.degree.departamentComputação
dc.degree.graduationBacharelado em Ciência da Computação
dc.degree.levelbachelor's degree
dc.degree.localRecife
dc.description.abstractNas plataformas de e-commerce a busca é a etapa mais importante para achar seus produtos, por isso a importância de pesquisas visando sua melhoria, uma das formas de fazer essa melhoria é o uso de query understanding (QU). O QU compreende um conjunto de processos que geralmente ocorrem antes das etapas principais de recuperação de documentos. Assim, o QU é fundamental para classificar e reescrever consultas quando se trata de sistemas de grande volume, como é o caso do domínio de e-commerce, especialmente quando seu foco é enriquecer a entrada fornecida. O Reconhecimento de Entidades Nomeadas (NER) é uma das partes mais importantes do entendimento de consultas, dentre outras etapas de processamento de linguagem natural (PLN). O principal objetivo do NER é possibilitar saber quais entidades ou classes estão presentes em uma consulta. Neste artigo, diferentes tipos de técnicas para NER são avaliados em um conjunto de dados de e-commerce em português, com foco em aspectos práticos para uso industrial. Neste trabalho, serão avaliadas diferentes redes neurais, como CNN do framework Spacy, as redes BI-LSTM-CRF, BI-GRU-CRF do framework PyTorch e diferentes métodos de embbedings, alcançando resultados satisfatórios como 0,97 de f1-score na base de testes.
dc.description.abstractxOn e-commerce platforms, the search is the most important step to find your products, hence the importance of seeking to improve them. One of the ways to do this is to use query understanding (QU). The QU comprises a set of processes that usually occur before the main document recovery steps. Thus, QU is critical to sorting and rewriting queries. when it comes to large-volume systems, such as the domain of ecommerce, especially when your focus is on enriching the provided input. Named Entity Recognition (NER) is one of the most important parts of understanding queries, among other processing steps of natural language (NLP). The main objective of NER is to make it possible to know which entities or classes are present in a query. In this article, different types of techniques for NER are evaluated on a dataset of e-commerce in Portuguese, focusing on practical aspects for industrial use. For this experiment, the CNN network from the Spacy framework, the BI-LSTM-CRF, BI-GRU-CRF networks from the PyTorch framework and different embedding methods were used, achieving satisfactory results such as 0.97 f1-score in the test base.
dc.format.extent30 f.
dc.identifier.citationLINS, Lucas Fernandes. Comparação de arquiteturas de redes neurais em NER para E-commerce brasileiro. 2023. 30 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2023.
dc.identifier.urihttps://arandu.ufrpe.br/handle/123456789/7574
dc.language.isopt_BR
dc.publisher.countryBrazil
dc.publisher.initialsUFRPE
dc.rightsopenAccess
dc.rights.licenseAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectComércio eletrônico
dc.subjectMétodos de compreensão de consulta
dc.subjectReconhecimento de Entidades Nomeadas (REN)
dc.titleComparação de arquiteturas de redes neurais em NER para E-commerce brasileiro
dc.typebachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
tcc_lucasfernandeslins_01.12.2025.pdf
Tamanho:
703.09 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura Disponível
Nome:
license.txt
Tamanho:
1.87 KB
Formato:
Item-specific license agreed upon to submission
Descrição: