Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem
| dc.contributor.advisor | Garrozi, Cícero | |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/0488054917286587 | |
| dc.contributor.author | Silva, Carlos Gabriel Farias da | |
| dc.date.accessioned | 2025-12-05T21:18:45Z | |
| dc.date.issued | 2025-08-06 | |
| dc.degree.departament | Estatística e Informática | |
| dc.degree.graduation | Bacharelado em Sistemas da Informação | |
| dc.degree.level | bachelor's degree | |
| dc.degree.local | Recife | |
| dc.description.abstract | Com o avanço das inteligências artificiais multimodais, cresce o interesse em sua aplicação na área da saúde para facilitar a análise nutricional e auxiliar no combate à obesidade. No entanto, a confiabilidade desses modelos para identificar alimentos e estimar porções a partir de imagens ainda é incerta, sendo fundamental mensurar seu desempenho de forma objetiva. Este trabalho avalia a capacidade do modelo Gemini de classificar ingredientes e estimar seus respectivos pesos (em gramas) a partir de fotografias de refeições. Para isso, foi desenvolvido um sistema automatizado que envia requisições à API do Gemini, utilizando um prompt textual padronizado, elaborado com técnicas de engenharia de prompt, e uma lista de ingredientes de referência. As respostas do modelo, obtidas em formato JSON, foram comparadas com dados reais para análise de desempenho. Os resultados obtidos nos experimentos indicaram um baixo desempenho geral. Na classificação de ingredientes, o modelo apresentou baixa precisão e sensibilidade (recall), com dificuldade em detectar itens como temperos e condimentos (por exemplo, azeite e sal) que estavam misturados a outros alimentos, embora tenha obtido altas taxas de aceno para ingredientes visualmente distintos, como morangos e ovos mexidos. Na estimativa de peso, o desempenho também foi insatisfatório, com altos valores de erro (MAE e RMSE) e coeficiente de determinação (R2) negativo, evidenciando tendência à superestimação e desempenho inferior a uma simples predição pela média. | |
| dc.description.abstractx | With the rapid development of multimodal artificial intelligence systems, there is growing interest in their application in healthcare to support nutritional analysis and help combat obesity. However, the reliability of these models in identifying foods and estimating portion sizes from images remains uncertain, making it essential to objectively assess their performance. This study evaluates the ability of the Gemini model to classify ingredients and estimate their respective weights (in grams) from meal photographs. An automated system was developed to send requests to the Gemini API, using a standardized text prompt, designed with prompt engineering techniques, along with a reference list of ingredients. The model’s responses, provided in JSON format, were compared against ground truth data to assess performance.The results showed generally low performance. In ingredient classification, the model exhibited low precision and recall, struggling to detect items such as condiments and seasonings (e.g., olive oil and salt) mixed with other foods, although it achieved high detection rates for visually distinct ingredients such as strawberries and scrambled eggs. In weight estimation, performance was also poor, with high error values (MAE and RMSE) and a negative coefficient of determination (R²), indicating a tendency to overestimate weights and performance worse than a simple mean-based prediction. | |
| dc.format.extent | 21 f. | |
| dc.identifier.citation | SILVA, Carlos Gabriel Farias da. Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem. 2025. 21 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2025. | |
| dc.identifier.uri | https://arandu.ufrpe.br/handle/123456789/8056 | |
| dc.language.iso | pt_BR | |
| dc.publisher.country | Brazil | |
| dc.publisher.initials | UFRPE | |
| dc.rights | openAccess | |
| dc.rights.license | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Inteligência artificial | |
| dc.subject | Visão computacional | |
| dc.subject | Aprendizado do computador | |
| dc.subject | Processamento de imagens | |
| dc.subject | Refeições | |
| dc.subject | Pesos e medidas | |
| dc.title | Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem | |
| dc.type | bachelorThesis |
