Sistema ChatBot para recomendação de refeições: uma abordagem Retrieval-Augmented Generation

Nenhuma Miniatura Disponível

Data

2024-09-26

Orientação Docente

Lattes da Orientação Docente

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Com o lançamento do ChatGPT, aumentou o interesse por assistentes chatbots capazes de interagir com linguagem semelhante à humana. Umas das formas de melhorar o desempenho destes assistentes é através da abordagem Retrieval-Augmented Generation (RAG). Nesta abordagem, um conjunto de documentos é extraído da base de dados e usado como contexto na geração das respostas. Porém, a qualidade do sistema RAG depende diretamente dos large language models (LLMs) que o integram. Plataformas como a Azure disponibilizam LLMs de altíssimo desempenho e que executam uma ampla gama de tarefas de inteligência artificial (IA). A desvantagem de usar estes LLMs, no entanto, é custo no uso da API, que é calculado em função do número de tokens de entrada e de saída. Por outro lado, em comunidades de machine learning (ML), como a Hugging Face, são publicados semanalmente dezenas de novos modelos de LLMs. Estes LLMs são treinados para tarefas específicas em inteligência artificial, podendo, alguns deles, ser reutilizados em tarefas diversas. Com base nisso, este trabalho faz um comparativo entre os LLMs disponíveis na Hugging Face para implementação de um chatbot de recomendação de refeições e restaurantes usando a abordagem RAG. Foram avaliados 8 LLMs de similaridade de sentença e 117 de geração de texto para compor o assistente chatbot. As saídas dos modelos de similaridade de sentença foram validadas por membros do departamento de computação da UFRPE. Já as respostas dos modelos de geração de texto foram avaliadas tanto por alunos da UFRPE, como pelo GPT-4. O ptbr-similarity-e5-small do repositório João Brito foi o modelo de similaridade de sentença com o maior número de saídas validadas, com 60% de validações. Por sua vez, o modelo de geração de texto Mistral-Nemo-Instruct-2407-Q5_0.gguf do repositório Second State obteve o score médio de 72,65, nas respostas avaliadas pelo GPT-4, assim como 4 vitórias em 4 disputas com outros modelos, julgadas por alunos da UFRPE.

Resumo em outro idioma

With the launch of ChatGPT, interest in chatbot assistants capable of interacting with human-like language has increased. One of the ways to improve the performance of these assistants is through the Retrieval-Augmented Generation (RAG) approach. In these approach, a set of documents is extracted from the database and used as context in generating responses. However, the quality of the RAG system directly depends onthe large language models (LLMs) that integrate it. Platforms like Azure provide veryhigh-performance LLMs that perform a wide range of artificial intelligence (AI) tasks.The disadvantage of using these LLMs, however, is the cost of using the API, whichis calculated in function of the number of input and output tokens. On the other hand,in machine learning communities, such as Hugging Face, dozens of new LLM modelsare published weekly. These LLMs are trained for specific artificial intelligence tasks,and some of them can be reused in different tasks. Based on this, this work makesa comparison between the LLMs available at Hugging Face for implementation of a meal and restaurant recommendation chatbot using the approach RAG. 8 sentence similarity LLMs and 117 text generation LLMs were evaluated to compose the chatbot assistant. The outputs of the sentence similarity models were validated by members of the UFRPE computing department. The responses to the text generation models were evaluated by both UFRPE students and GPT-4. The ptbr-similarity-e5-small from the João Brito repository was the sentence similarity model with the highest number of validated outputs, with 60% validations. In turn, the text generation model Mistral- Nemo-Instruct-2407-Q5_0.gguf from the Second State repository obtained an averagescore of 72.65, in the responses evaluated by GPT-4, as well as 4 victories in 4 disputes with other models, judged by UFRPE students.

Descrição

Referência

LIMA, Wallace Santana de. Sistema ChatBot para recomendação de refeições: uma abordagem Retrieval-Augmented Generation. 2024. 82 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2024.

Identificador dARK

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess