01.1 - Graduação (Sede)

URI permanente desta comunidadehttps://arandu.ufrpe.br/handle/123456789/2

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 58
  • Imagem de Miniatura
    Item
    Aplicação web para detecção automática de URLs maliciosas com aprendizado de máquina
    (2025-08-08) Souza, Celso Soares Cassiano de; Oliveira, Lidiano Augusto Nóbrega de; http://lattes.cnpq.br/7399493881755815
    A segurança cibernética tem se tornado uma das principais preocupações da era digital, impulsionada pelo crescimento acelerado da internet e pela proliferação de ameaças como phishing, malware e roubo de dados. Este trabalho propõe uma abordagem baseada em aprendizado de máquina para classificar URLs como legítimas ou maliciosas, utilizando um conjunto abrangente de atributos extraídos diretamente das URLs e de fontes complementares, como registros WHOIS e informações de rede. Foram aplicados e analisados algoritmos como Random Forest, SVM e XGBoost sobre um conjunto de dados coletado de fontes confiáveis, como PhishTank e Kaggle. As características consideradas englobam aspectos léxicos, informações de rede, conexão e reputação. A avaliação dos modelos foi conduzida por meio de métricas como acurácia, precisão, recall e F1-score, evidenciando um desempenho satisfatório na detecção de sites maliciosos. Como aplicação prática, foi desenvolvida uma plataforma interativa com Streamlit, permitindo que qualquer usuário insira urna URL e receba uma análise imediata sobre sua legitimidade. A análise de importância das variáveis forneceu insights valiosos sobre os fatores mais influentes no processo de classificação, contribuindo tanto para a transparência quanto para a evolução futura do sistema.
  • Imagem de Miniatura
    Item
    Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem
    (2025-08-06) Silva, Carlos Gabriel Farias da; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587
    Com o avanço das inteligências artificiais multimodais, cresce o interesse em sua aplicação na área da saúde para facilitar a análise nutricional e auxiliar no combate à obesidade. No entanto, a confiabilidade desses modelos para identificar alimentos e estimar porções a partir de imagens ainda é incerta, sendo fundamental mensurar seu desempenho de forma objetiva. Este trabalho avalia a capacidade do modelo Gemini de classificar ingredientes e estimar seus respectivos pesos (em gramas) a partir de fotografias de refeições. Para isso, foi desenvolvido um sistema automatizado que envia requisições à API do Gemini, utilizando um prompt textual padronizado, elaborado com técnicas de engenharia de prompt, e uma lista de ingredientes de referência. As respostas do modelo, obtidas em formato JSON, foram comparadas com dados reais para análise de desempenho. Os resultados obtidos nos experimentos indicaram um baixo desempenho geral. Na classificação de ingredientes, o modelo apresentou baixa precisão e sensibilidade (recall), com dificuldade em detectar itens como temperos e condimentos (por exemplo, azeite e sal) que estavam misturados a outros alimentos, embora tenha obtido altas taxas de aceno para ingredientes visualmente distintos, como morangos e ovos mexidos. Na estimativa de peso, o desempenho também foi insatisfatório, com altos valores de erro (MAE e RMSE) e coeficiente de determinação (R2) negativo, evidenciando tendência à superestimação e desempenho inferior a uma simples predição pela média.
  • Imagem de Miniatura
    Item
    Aprendizado de máquina não supervisionado aplicado na dinâmica de preços de combustíveis no Brasil
    (2025-08-05) Lima, Andressa Luana Santana de; Gouveia, Roberta Macedo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0993590347039876
    Este trabalho realiza uma análise exploratória e de clusterização dos dados públicos da Agência Nacional do Petróleo (ANP) para os preços de combustíveis no Brasil em 2024. A partir de variáveis numéricas agregadas por região e por produto, foi aplicado o algoritmo K-means para identificar padrões de comportamento no mercado. As variáveis selecionadas buscaram representar aspectos como níveis médios de preço, variações sazonais, volume de registros e distribuição de revendas. Os resultados apontaram diferenças estruturais entre regiões e entre combustíveis, evidenciando a heterogeneidade do setor. O estudo evidencia a importância do uso de técnicas de agrupamento para explorar padrões relevantes no mercado de combustíveis.
  • Imagem de Miniatura
    Item
    Classificação multi-rótulo para análise de qualidade de feedback
    (2025-08-06) Batista, Hyan Hugo Noá; Mello, Rafael Ferreira de Leite; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/4262454011553103
    O feedback é um fator muito importante no processo de ensino-aprendizagem e crucial na Educação a Distância, pois, como professores e alunos estão separados no espaço e/ou tempo, é através do feedback que o aluno vai entender como está o seu desempenho na disciplina e quais são os próximos passos do aprendizado. Existem na literatura modelos de feedback que ajudam o professor a estruturar e fornecer um feedback de qualidade ao aluno. Nesse trabalho utilizamos o conceituado modelo de feedback de Hattie e Timperley que divide o feedback em categorias (tarefa, processamento da tarefa, regulação e pessoal). É possível encontrar na literatura trabalhos que analisam feedback automaticamente com base nesse modelo. Contudo, esses trabalhos utilizam algoritmos tradicionais de aprendizagem de máquina e treinam classificadores binários para cada nível de feedback. Dessa forma, este trabalho tem como objetivo utilizar algoritmos de deep learning para classificação multi-classe de feedback com base no modelo de Hattie e Timperley.
  • Imagem de Miniatura
    Item
    Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro
    (2025-07-30) Barbosa, Gabriel Augusto; Miranda, Péricles Barbosa Cunha de; http://lattes.cnpq.br/8649204954287770; http://lattes.cnpq.br/7161363389816372
    A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em português ainda são escassas, e ainda há muito a ser estudado e descoberto nesse contexto. Assim, este artigo propõe um estudo experimental que investiga o uso de algoritmos de aprendizado de máquina para classificar textos em português considerando tipos textuais. Para isso, propomos um novo corpus composto por textos em português de dois tipos textuais: narrativo e dissertativo. Três algoritmos de aprendizado de máquina tiveram seu desempenho avaliado no corpus criado em termos de precisão, revocação e pontuação F1. Além disso, também foi realizada uma análise dos atributos envolvidos no processo para identificar quais características textuais são mais importantes na tarefa atual. Os resultados mostraram que é possível alcançar altos níveis de precisão e rememoração na classificação de textos narrativos e dissertativos. Os algoritmos obtiveram níveis de métricas semelhantes, demonstrando a qualidade das características extraídas.
  • Imagem de Miniatura
    Item
    Análise da previsibilidade do preço spot do milho na determinação do preço futuro: um estudo utilizando Random Forest
    (2025-07-21) Lima, Luiz Felipe Dias de; Duarte, Gisleia Benini; http://lattes.cnpq.br/6349616407324519; http://lattes.cnpq.br/2985117696253378
    Este estudo investigou a relevância do preço do contrato futuro de milho como variável preditora do preço spot da commodity para o período de 2018 a 2020 e de 2022 a 2024, com periodicidade diária e assim para as demais variáveis. Para tanto, adotou-se como metodologia o algoritmo Random Forest, considerando como variáveis explicativas a cotação do dólar, o preço futuro da soja e o próprio preço presente (spot) do milho. O principal objetivo foi avaliar se o preço atual do milho constitui um bom predito para o comportamento do mercado futuro. Dessa forma o Random Forest demostrou alto desempenho na previsão do contrato futuro do milho, indicando boa capacidade de generalização a partir do preço spot, além disso demostrando que a cotação do dólar é uma variável importante no comportamento do preço futuro do milho.
  • Imagem de Miniatura
    Item
    Recomendação sensível ao contexto para comunicação aumentativa e alternativa baseada em aprendizagem de máquina
    (2024-02-23) Silva, Ulisses Chaves; Nascimento, André Câmara Alves do; http://lattes.cnpq.br/0622594061462533; http://lattes.cnpq.br/8993061329549653
    Comumente, observa-se a adoção de novas técnicas baseadas em inteligência artificial e aprendizagem de máquina (AM) em diversos contextos. Com o avanço das redes neurais artificiais, que possibilitam a representação de diversos tipos de dados e a compreensão das complexas relações entre eles, essa tendência foi ainda mais impulsionada. No entanto, a literatura atual mostra-se escassa ao tentar encontrar estudos atualizados que relacionem essas tecnologias a metodologias pedagógicas para resolver os diversos problemas sociais e promover a inclusão. Este trabalho propõe abordagens atuais utilizadas em AM para a recomendação de pictogramas em um sistema de Comunicação Aumentativa e Alternativa (AAC). Diante da complexidade das necessidades de usuários de AAC, neste trabalho dois modelos neurais sensíveis ao contexto são apresentados e comparados. Esses modelos utilizam técnicas de aprendizagem de máquina para considerar o contexto dinâmico do usuário para gerar recomendações, adaptando-se à localização e ao tempo específicos desse usuário que possui alguma deficiência na comunicação. Adicionalmente, são destacados outros trabalhos que foram usados como base para a criação dessa solução para o problema de recomendação de pictogramas existente na aplicação móvel Livox.
  • Imagem de Miniatura
    Item
    Xphide: um sistema especialista para a detecção de phishing
    (2023-08-25) Barros, Mateus Lins e Silva Duque de; Miranda, Péricles Barbosa da Cunha; http://lattes.cnpq.br/6425827511465244
    Phishing é um tipo de crime cibernético que visa o roubo de dados pessoais do usuário por meios de disfarces e enganação. Este artigo propõe o Xphide, um sistema especialista para a detecção de páginas maliciosas. A base da construção do sistema foi feita através de uma análise aprofundada a respeito de atributos relevantes para descrição de páginas web. Esta análise serviu de insumo para a elaboração das regras do processo decisório do Xphide, que foram separadas em 3 categorias: estáticas, de lista e dinâmicas. O sistema proposto foi avaliado em três diferentes bases de dados, extraídas de repositórios públicos, sendo 2 de phishing válidos, e 1 de phishing inválidos. Os resultados mostraram que o Xphide superou algoritmos de classificação tradicionais em termos de precisão e revocação, se mostrando uma alternativa promissora para a classificação de página web.
  • Imagem de Miniatura
    Item
    The digital behavior of voters in interactions with the social media posts of candidates running for elections
    (2022-10-06) Silva Filho, Heriberto Alexandre da; Brito, Kellyton dos Santos; http://lattes.cnpq.br/8750956715158540; http://lattes.cnpq.br/6181814500468590
    The extensive use of digital tools and digital marketing strategies over the last few years has become increasingly more frequent and characteristic in political campaigns Within this scenario, this study aims to investigate the use of SM in contemporary political communication, seeking to understand the features that influence the engagement of voters in posts by politicians on their social media profiles. As a case study, we have focused on the Brazilian presidential election in 2018. The investigation was based on an analysis of politicians’ posts on Instagram, Twitter, and Facebook (N = 1319) in the last two weeks before the elections, which investigated features such as functional approach, the Aristotelian rhetoric adopted, and the type of content, among others, and established relationships between these features and user engagement. This study also proposes to investigate the feasibility of using machine learning models to predict the level of engagement of the candidate's posts. Finally, another objective of this paper is to find similarities or differences between the digital campaign strategies, and their impacts on the level of engagement, of the two candidates with the best electoral results. Our main results indicate that the platform with the highest level of engagement was Instagram, together with polarized discourses that presented speeches of attack and defense or emotionally charged topics tended to engage more. Regarding the predictions, the Gradient Boosting model proved to be efficient, R² =0.77, to make the predictions. Regarding the digital campaign strategies, although the two candidates are from opposite political sides, it was possible to find more similarities, such as: functional approach, content structure, and content type, and others...than differences. However the few differences found also represent a valuable result for the understanding of the political landscape, there were divergences for example in Aristotelian rhetoric, content type, and rhetorical device. All these results helped to understand how the electorate interacts with the candidates' speeches in a new era of digital campaigning.
  • Imagem de Miniatura
    Item
    Detecção de fake news: uma abordagem baseada em Large Language Models e Prompt Engineering
    (2025-03-20) Fonseca, Pablo Weslley Silva da; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/6258598537884813
    Este trabalho aborda o uso de Large Language Models (LLMs) para a detecção de fake news ou notícias falsas no idioma inglês e português. As notícias falsas têm gerado impactos negativos, como desinformação e conflitos sociais, sendo amplamente disseminadas pelas redes sociais. Embora métodos tradicionais de verificação sejam eficazes, como checagem manual e agências de verificação de fatos, a aplicação de algoritmos de machine learning e deep learning trouxe avanços importantes. No entanto, esses modelos apresentam limitações, como perda de contexto semântico e custos de treinamento. A introdução da arquitetura Transformers possibilitou avanços significativos com LLMs, como BERT, GPT e T5, devido à sua capacidade de compreender padrões linguísticos complexos. Este trabalho propõe uma abordagem de detecção de notícias falsas a partir recuperações de informações pela Web e o modelo Qwen2.5-7B-Instruct, comparando o desempenho com propostas que combina recuperação de informações com modelos tradicionais e LLMs. Os resultados destacam vantagens e desvantagens, contribuindo para futuras melhorias em sistemas automatizados de detecção de notícias falsas.