Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem

dc.contributor.advisorGarrozi, Cícero
dc.contributor.advisorLatteshttp://lattes.cnpq.br/0488054917286587
dc.contributor.authorSilva, Carlos Gabriel Farias da
dc.date.accessioned2025-12-05T21:18:45Z
dc.date.issued2025-08-06
dc.degree.departamentEstatística e Informática
dc.degree.graduationBacharelado em Sistemas da Informação
dc.degree.levelbachelor's degree
dc.degree.localRecife
dc.description.abstractCom o avanço das inteligências artificiais multimodais, cresce o interesse em sua aplicação na área da saúde para facilitar a análise nutricional e auxiliar no combate à obesidade. No entanto, a confiabilidade desses modelos para identificar alimentos e estimar porções a partir de imagens ainda é incerta, sendo fundamental mensurar seu desempenho de forma objetiva. Este trabalho avalia a capacidade do modelo Gemini de classificar ingredientes e estimar seus respectivos pesos (em gramas) a partir de fotografias de refeições. Para isso, foi desenvolvido um sistema automatizado que envia requisições à API do Gemini, utilizando um prompt textual padronizado, elaborado com técnicas de engenharia de prompt, e uma lista de ingredientes de referência. As respostas do modelo, obtidas em formato JSON, foram comparadas com dados reais para análise de desempenho. Os resultados obtidos nos experimentos indicaram um baixo desempenho geral. Na classificação de ingredientes, o modelo apresentou baixa precisão e sensibilidade (recall), com dificuldade em detectar itens como temperos e condimentos (por exemplo, azeite e sal) que estavam misturados a outros alimentos, embora tenha obtido altas taxas de aceno para ingredientes visualmente distintos, como morangos e ovos mexidos. Na estimativa de peso, o desempenho também foi insatisfatório, com altos valores de erro (MAE e RMSE) e coeficiente de determinação (R2) negativo, evidenciando tendência à superestimação e desempenho inferior a uma simples predição pela média.
dc.description.abstractxWith the rapid development of multimodal artificial intelligence systems, there is growing interest in their application in healthcare to support nutritional analysis and help combat obesity. However, the reliability of these models in identifying foods and estimating portion sizes from images remains uncertain, making it essential to objectively assess their performance. This study evaluates the ability of the Gemini model to classify ingredients and estimate their respective weights (in grams) from meal photographs. An automated system was developed to send requests to the Gemini API, using a standardized text prompt, designed with prompt engineering techniques, along with a reference list of ingredients. The model’s responses, provided in JSON format, were compared against ground truth data to assess performance.The results showed generally low performance. In ingredient classification, the model exhibited low precision and recall, struggling to detect items such as condiments and seasonings (e.g., olive oil and salt) mixed with other foods, although it achieved high detection rates for visually distinct ingredients such as strawberries and scrambled eggs. In weight estimation, performance was also poor, with high error values (MAE and RMSE) and a negative coefficient of determination (R²), indicating a tendency to overestimate weights and performance worse than a simple mean-based prediction.
dc.format.extent21 f.
dc.identifier.citationSILVA, Carlos Gabriel Farias da. Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem. 2025. 21 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2025.
dc.identifier.urihttps://arandu.ufrpe.br/handle/123456789/8056
dc.language.isopt_BR
dc.publisher.countryBrazil
dc.publisher.initialsUFRPE
dc.rightsopenAccess
dc.rights.licenseAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectInteligência artificial
dc.subjectVisão computacional
dc.subjectAprendizado do computador
dc.subjectProcessamento de imagens
dc.subjectRefeições
dc.subjectPesos e medidas
dc.titleAnálise de desempenho do Gemini na estimativa de peso de alimentos por imagem
dc.typebachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
tcc_art_carlosgabrielfariasdasilva.pdf
Tamanho:
1.12 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura Disponível
Nome:
license.txt
Tamanho:
1.87 KB
Formato:
Item-specific license agreed upon to submission
Descrição: