TCC - Bacharelado em Sistemas da Informação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 11
  • Imagem de Miniatura
    Item
    Implementação de um sistema mobile colaborativo para acompanhamento do quadro de pacientes com esclerose múltipla por meio de análise de sentimento
    (2024-10-02) Araujo, Paula Priscila da Cruz; Gouveia, Roberta Macêdo Marques; Tschá, Elizabeth Regina; http://lattes.cnpq.br/9598413463162759; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0280090820230057
    O estudo visa desenvolver um sistema mobile para facilitar o acompanhamento de pacientes acometidos por Esclerose Múltipla (EM) baseado no Toolkit Human-Centered Design (HCD) para atender as necessidades dos pacientes. O aplicativo permite que eles registrem e monitorarem emoções, sintomas e tratamentos, oferecendo relatórios mensais e alertas personalizados. Para a análise de sentimentos, foram utilizados os algoritmos de aprendizado de máquina XGBoost e Naive Bayes, sendo o XGBoost demonstrando melhor desempenho, com uma acurácia de 87,56% e um F1-Score de 0,876, enquanto o Naive Bayes, obteve 62,25% de acurácia e um F1-Score de 0,524. Os resultados indicam a eficácia da ferramenta no acompanhamento emocional e médico, contribuindo para a melhoria na qualidade de vida.
  • Imagem de Miniatura
    Item
    Análise de sentimentos em reviews de jogos digitais da Plataforma Steam
    (2024-09-26) Albuquerque, Júlia de Melo; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584
    A análise de sentimento é uma área que investiga as expressões emocionais da linguagem humana, buscando compreender as necessidades e opiniões subjacentes expressas em textos. Sua complexidade existe na habilidade de discernir não apenas o conteúdo textual, mas também as matrizes emocionais implícitas. Com o avanço tecnológico, a facilidade de expressar a opinião publicamente se dissemina por diversos meios, sendo campo dos jogos online uma vertente que atrai inúmeras publicações de jogadores sobre os diversos títulos disponíveis. No entanto, essa diversidade de públicos e temas torna desafiador compreender o sentimento expresso que permeia esse universo. O objetivo deste estudo é aplicar técnicas de análise de sentimento em avaliações de jogos digitais, adotando uma abordagem focada em algoritmos de aprendizado de máquina supervisionados e bibliotecas pre-polarizadas, a fim de identificar o melhor caminho de classificação capaz de discernir os sentimentos expressos pelos usuários nas avaliações. Nessa operação está sendo considerada uma abordagem com todas as opiniões e outra focada em gênero específico de cada jogo. Essa análise foi conduzida por meio da exploração de dados provenientes de uma empresa de distribuição de jogos online (Steam), seguindo com uma preparação desses dados devido às particularidades presentes nos registros. Os resultados revelam que os modelos de aprendizado de máquina superam as abordagens tradicionais, como a utilização da biblioteca VADER, apresentando uma precisão maior em aproximadamente 10% nas capturas, observou-se uma diferença de 20% a mais em métricas como recall e F1-score. Esse estudo representa uma contribuição analítica para a área da análise de sentimento, destacando a capacidade do modelo construído em lidar com a complexidade da linguagem humana.
  • Imagem de Miniatura
    Item
    An implementation of a mathematical-computational method for the detection and treatment of financial outliers in higher education
    (2023-09-06) Freitas, Nathan Cavalcante; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1613649528791400
    O Censo da Educação Superior ocorre anualmente, coletando dados de Instituições de Ensino Superior (IES) no Brasil. Diferentes fatores podem levar a anomalias ou outliers em alguns destes dados coletados. Este trabalho propõe um método matemático-computacional para detectar e tratar valores financeiros atípicos das IES. Para tanto, adota-se as análises univariadas e bivariadas dos dados. Foram analisados dados de despesas e receitas das IES do Censo de 2016 a 2019. Esta análise revelou que 204 de 2.224 IES, aproximadamente 10%, reportaram algum dado atípico.
  • Imagem de Miniatura
    Item
    Técnica de clusterização aplicada à análise de perfis socioeconômicos de estudantes concluintes de cursos de computação
    (2022-07-03) Souza, Clarissa Cordeiro de; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1046530929912898
    As diferentes classes sociais e econômicas de estudantes de cursos de graduação podem impactar no percurso de formação acadêmica e na permanência de tais alunos nas instituições de ensino superior brasileiras. Este trabalho de conclusão de curso aplicou uma técnica de mineração de dados chamada de clusterização K-means aos microdados do Exame Nacional de Desempenho dos Estudantes (ENADE) do ano de 2017, exame aplicado pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), com o objetivo de analisar os contextos que separam os concluintes dos diversos cursos de computação, seja bacharelado ou licenciatura, utilizando os dados socioeconômicos. Os resultados apontaram para quatro grandes grupos de estudantes e, a partir das suas análises é possível elencar um perfil de estudante concluinte de computação no ano analisado, visto que os clusters apresentam várias características em comum, tais como: a maioria dos estudantes são do sexo masculino, solteiros, de cor branca, optaram pela modalidade presencial, cursaram o ensino médio em escolas públicas, entre outras. Contudo algumas características foram encontradas em grupos específicos, como por exemplo existe um grupo de concluintes que são de instituições públicas de turno integral.
  • Imagem de Miniatura
    Item
    Análise de sentimentos em Tweets relacionados ao desmatamento da Floresta Amazônica
    (2021-12-17) Silva, Vinicius José Paes e; Andrade, Ermeson Carneiro de; http://lattes.cnpq.br/2466077615273972; http://lattes.cnpq.br/7437953784606274
    A Floresta Amazônica está sendo devastada no maior ritmo dos últimos anos. Em 2021, Amazônia registra o maior acúmulo de desmatamento em 5 anos, passando de 13 mil km2 entre agosto de 2020 a julho de 2021. Um aumento de 22% no desmatamento, em relação ao mesmo período do ano anterior, sendo o maior número desde 2006. Embora muitos trabalhos abordem o tema de desmatamento, nenhum deles foca em analisar os sentimentos da população brasileira com relação ao tema. Este trabalho apresenta uma análise dos sentimentos dos usuários brasileiros do Twitter relacionados ao desmatamento da Floresta Amazônica através da mineração de texto do Twitter e busca entender como os usuários brasileiros opinam e dialogam sobre a desmatamento da Floresta Amazônica. Os resultados revelam que os usuários brasileiros tendem a reagir a acontecimentos relacionados ao desmatamento da floresta Amazônica no Twitter e, que em sua maioria, os usuários apresentam sentimento negativo sobre o tema, alcançando picos de aproximadamente 60% dos tweets em determinado momento.
  • Imagem de Miniatura
    Item
    Raspagem de Dados Jurídicos Utilizando Scrapy
    (2021-12-20) Barbosa, Jadiel Eudes Mendonça; Bocanegra, Silvana; http://lattes.cnpq.br/4596111202208863; http://lattes.cnpq.br/8044959053132773
    A raspagem de dados é uma técnica computacional na qual através de um programa é realizada extração de dados que estão escondidos em páginas da web. Dessa forma, este trabalho acadêmico tem como objetivo utilizar técnicas de raspagem de dados para extrair dados de processos jurídicos dos sites dos tribunais com o intuito de auxiliar empresas contratantes a tomarem decisões estratégicas junto a seus departamentos jurídicos.
  • Imagem de Miniatura
    Item
    Técnicas de aprendizado de máquina para descoberta de conhecimento sobre dados abertos do ensino superior público brasileiro
    (2021-12-10) Rodrigues, Ebony Marques; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/5929185711837204
    Este trabalho trata do uso de técnicas dos métodos de Knowledge Discovery in Databases — KDD — e Cross Industry Standard Process for Data Mining — CRISPDM — sobre bases de dados educacionais disponibilizadas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira — INEP — visando à descoberta de conhecimento que permita a identificação, assim como a compreensão, do contexto de formação de discentes de Instituições de Ensino Superior — IES — públicas brasileiras. Três cenários de mineração de dados são observados, tendo em vista métodos do Aprendizado de Máquina Supervisionado e do Aprendizado de Máquina Não Supervisionado, abrangendo experimentos de classificação, agrupamento e associação de dados. O primeiro cenário, que contempla dados de concluintes de cursos de graduação de graus bacharelado e licenciatura, objetiva prever o tempo aproximado de conclusão da graduação, considerando informações socioeconômicas dos estudantes, por meio de 16 modelos de classificação construídos com o emprego de algoritmos de Árvore de Decisão, Floresta Aleatória, XGBoost e Rede Neural Perceptron Multicamadas. Os modelos XGBoost tiveram os melhores resultados em todos os experimentos. Por sua vez, o segundo cenário utiliza o algoritmo KMeans para a execução de um agrupamento de IES públicas que, a partir da análise de quatro grupos obtidos com a consideração de informações sobre despesas, quantidades de docentes e técnicos, localização e categoria administrativa das IES, entre outras, possibilitou a identificação de similaridades e dissimilaridades entre as instituições. Os grupos em questão, além de dados utilizados no primeiro cenário, que incluem informações sobre os estudantes, como faixa etária, tempo de graduação e forma de ingresso na graduação, observando se esse ocorreu por meio de políticas de ação afirmativa ou de inclusão social, entre outras, são considerados nos experimentos do terceiro cenário, com o uso do algoritmo Apriori, para a geração de regras de associação que podem suportar a descoberta de conhecimento no âmbito do ensino superior público brasileiro.
  • Imagem de Miniatura
    Item
    Uma proposta para agrupamento automático de horas de trabalho
    (2022-06-03) Félix, Matheus Rodrigues de Souza; Monteiro, Cleviton Vinicius Fonsêca; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/9362573782715504; http://lattes.cnpq.br/6209976572558281
    O registro de horas utilizadas em projetos é uma tarefa recorrente no dia-a-dia de grande parte dos profissionais. Esta tarefa é crucial em processos relacionados à administração e recursos humanos para análise de alinhamento com cronogramas e produtividade. Entretanto, o preenchimento correto e em prazo são pontos importantes para que o ciclo de realização de atividades e registro seja efetivo. Quando o profissional trabalha em diversos projetos de forma alternada no seu cotidiano, o registro dessas atividades tende a ganhar imprecisão. Neste artigo, será apresentada uma proposta para possibilitar a automatização do registro de horas através do uso de técnicas de mineração de texto. O objetivo deste projeto é criar uma abordagem que auxilie o usuário reduzindo horas diárias registrando atividades.
  • Imagem de Miniatura
    Item
    Estudo comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos
    (2019) Albuquerque, Rotsen Diego Rodrigues de; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/6441716676783585
    Com o grande aumento de dados na internet, mostra-se uma rica fonte para a avaliação da opinião pública sobre uma entidade específica. Consequentemente, o número de opiniões disponíveis torna impossível uma tomada de decisão se for necessário ler e analisar todas as opiniões. Como o uso de Machine Learning tem sindo bastante usado, irei apresentar um estudo comparativo de dois algoritmos para classificar oscomentários usando técnicas de processamento de linguagem natural e Análise de Sentimentos. O dados obtidos foram obtidos manualmente onde através do site de competições chamado Kaggle temos cerca de 50.000 comentários sobre diversos filmes. Este estudo tem por finalidade usar também os conceitos da ciência de dados e Machine Learning, processamento de linguagem natural e analises de sentimentos para agregar mais informação sobre a industria de entretenimento e cinema. Por isso esses algoritmos foram criados para que seja possível mostrar os resultados para esse domínio nos reviews de filmes registrados no site da grande industria cinematográfica o famoso IMDB. Após a aplicação dos treinos e testes, a máquina teve uma Acuráciade 86% sobre a predição de textos comentados de filmes.
  • Imagem de Miniatura
    Item
    Aspect term extraction in aspect-based sentiment analysis
    (2019) Francisco, Alesson Delmiro; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340
    O uso crescente da Internet criou a necessidade de analisar uma vasta quantidade dedados. Uma grande quantia de dados é apresentada como Texto em Linguagem Naturalnão estruturado, com várias maneiras de expressar a mesma informação. É uma tarefaimportante extrair informação e significado destes conteúdos não estruturados, comoopiniões em produtos ou serviços. A necessidade de extrair e analisar a vasta quantidadede dados criados todos os dias na Internet ultrapassou as capacidades humanas, comoresultado, várias aplicações de mineração de texto que extraem e analisam dados textuaisproduzidos por humanos estão disponíveis atualmente, uma destas aplicações é a Análise deSentimentos usada para que empresas e provedores de serviços possam usar o conhecimentoextraído de documentos textuais para melhor entender como seus clientes pensam sobreeles. No entanto, a tarefa de analisar texto não estruturado é difícil, por isso é necessárioprover informação coerente e resumos concisos para as revisões. Análise de Sentimentoé o processo de identificar e categorizar computacionalmente opiniões expressadas numtexto, especialmente para determinar a atitude do autor sobre um tópico ou produto emparticular. Análise de Sentimentos Baseada em Aspectos (ABSA) é um sub-campo daAnálise de Sentimentos que tem como objetivo extrair opiniões mais refinadas e exatas,quebrando o texto em aspectos. A maior parte dos trabalhos atuais na literatura não lucramde recursos baseados em semântica ou análises baseadas em Processamento de LinguagemNatural na fase de pré-processamento. Para tratar essas limitações, um estudo nestesrecursos é feito com o objetivo de extrair as características necessárias para a execuçãoda tarefa, e para fazer a melhor combinação para Extração de Termo de Aspecto. Estetrabalho tem como o principal objetivo implementar e analisar um método de Extraçãode Termo de Aspecto (ATE) de críticas de usuários (restaurantes e laptops). O métodoproposto é baseado em uma abordagem supervisionada chamada Campos CondicionaisAleatórios (CRF) que otimiza o uso de características para classificação, esta escolha éjustificada pelos trabalhos relacionados anteriores que demonstram a eficácia do CRFpara ATE. Um estudo também é feito em métodos para propor novas características eexperimantar com combinações de características para obter as melhores combinações.O estudo detalhado é feito a partir da experimentação com características de palavra,n-gramas e características customizadas utilizando um algoritmo supervisionado CRF pararealizar a tarefa de Extração de Termo de Aspecto com resultados em termo de Precisão,Cobertura e F-Measure, as métricas padrões de avaliação adotadas na área. Por fim, umaavaliação comparativa entre o método proposto para ATE contra outros trabalhos daliteratura mostra que o método apresentado neste trabalho é competitivo.