01. Universidade Federal Rural de Pernambuco - UFRPE (Sede)

URI permanente desta comunidadehttps://arandu.ufrpe.br/handle/123456789/1

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 4 de 4
  • Imagem de Miniatura
    Item
    Comparação de técnicas de redução de dimensionalidade aplicadas à clusterização de dados do censo da educação superior
    (2025-08-08) Mercês, Thamires Lopes das; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8266687622316308
    A grande quantidade de informações coletadas em censos da educação e avaliações nacionais demanda métodos eficientes para extração de conhecimento, permitindo identificar padrões e tendências relevantes. Nesse contexto, a clusterização se destaca como uma ótima técnica para segmentar e interpretar grandes volumes de dados educacionais, sendo o K-Means um dos algoritmos mais utilizados devido à sua simplicidade e eficiência. No entanto, quando aplicado a conjuntos de dados de alta dimensionalidade, seu desempenho pode ser comprometido, tornando necessário o uso de técnicas de redução de dimensionalidade como Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) e Uniform Manifold Approximation and Projection (UMAP). Este trabalho investiga o impacto dessas técnicas na qualidade dos agrupamentos gerados pelo K-Means em uma base de dados composta pela junção dos Microdados do Censo da Educação Superior de 2022 e os indicadores de qualidade educacional Conceito Enade e CPC. A análise é realizada utilizando o índice de silhueta como métrica de avaliação e comparando o tempo de execução de cada método. Com dois componentes, o PCA superou o t-SNE e o UMAP na maioria dos testes. Com três componentes, o PCA teve melhor desempenho que o t-SNE em todos os testes, mas ficou equilibrado com o UMAP, onde foi superior em cinco dos nove cenários. Observou-se, ainda, que a quantidade de clusters teve influência relevante nos resultados, especialmente no desempenho crescente do UMAP à medida que se aumentava o número de clusters. O UMAP e o t-SNE mostraram resultados equilibrados com dois componentes. Porém, com três componentes, o UMAP se mostrou melhor em todos os cenários. Além disso, o PCA foi a técnica mais rápida em todos os cenários avaliados, superando tanto o t-SNE quanto o UMAP em termos de tempo de execução.
  • Imagem de Miniatura
    Item
    Panorama da licenciatura em computação: uma análise das particularidades acadêmico-profissionais dos docentes de informática/computação no Brasil
    (2024-09-30) Gonçalves, Alexandre Fernandes; Rodrigues, Rodrigo Lins; http://lattes.cnpq.br/5512849006877767; http://lattes.cnpq.br/5960541042758316
    O presente trabalho tem como objetivo verificar a atual situação dos docentes de informática/computação no ensino básico brasileiro, mais precisamente sobre a formação específica de licenciatura em computação (LC) e os quantitativos destes, com sua distribuição em algumas variáveis como região, sexo e região político-administrativa. A pesquisa foi realizada com dados dos docentes de informática/computação ao nível de Brasil, oriundas do Censo Escolar do ano de 2020. Após essa etapa, foi utilizada a técnica de Análise de Correspondência Múltipla (MCA), para verificar as características dos atributos encontrados e as associações existentes entre as categorias das variáveis, relacionando a formação docente com o perfil. Concluímos com esse estudo que há um baixo quantitativo de profissionais docentes de informática/computação. São apenas 478 (2,19% do total de registros) com formação específica na área de LC, existindo uma grande quantidade de professores (15.059 - 69,09%) que são licenciados em outras áreas distintas da computação. A formação em pedagogia é a fonte da maioria dos professores de informática/computação, com cerca de 11.101 (50,93%) destes profissionais; e que a carência é ainda maior nas regiões Norte e Centro-Oeste do país, que possuem apenas 56 professores, o que corresponde a 11,71% dos licenciados em computação (LCs) em atividade.
  • Imagem de Miniatura
    Item
    Elaboração do conjunto de dados agregados do censo da educação básica
    (2022-10-07) Barros, Abílio Nogueira; Mello, Rafael Ferreira Leite de; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/2576549853650823
    O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) disponibiliza o Censo da Educação Básica, o maior levantamento anual de dados sobre a educação brasileira. Os dados são disponibilizados anualmente e com cerca de 370 colunas e pouco mais de 230 mil registros por ano. Este trabalho apresenta o processo que foi utilizado para criar um conjunto de dados que unificasse os anos de 2010-2021 e o disponibilizasse de forma a garantir boas práticas de disponibilização de dados na web. Foi gerado um conjunto de dados abrangendo todos os anos mencionados, posteriormente dividido em subconjuntos dada a natureza dos dados apresentados.
  • Imagem de Miniatura
    Item
    Técnicas de aprendizado de máquina para descoberta de conhecimento sobre dados abertos do ensino superior público brasileiro
    (2021-12-10) Rodrigues, Ebony Marques; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/5929185711837204
    Este trabalho trata do uso de técnicas dos métodos de Knowledge Discovery in Databases — KDD — e Cross Industry Standard Process for Data Mining — CRISPDM — sobre bases de dados educacionais disponibilizadas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira — INEP — visando à descoberta de conhecimento que permita a identificação, assim como a compreensão, do contexto de formação de discentes de Instituições de Ensino Superior — IES — públicas brasileiras. Três cenários de mineração de dados são observados, tendo em vista métodos do Aprendizado de Máquina Supervisionado e do Aprendizado de Máquina Não Supervisionado, abrangendo experimentos de classificação, agrupamento e associação de dados. O primeiro cenário, que contempla dados de concluintes de cursos de graduação de graus bacharelado e licenciatura, objetiva prever o tempo aproximado de conclusão da graduação, considerando informações socioeconômicas dos estudantes, por meio de 16 modelos de classificação construídos com o emprego de algoritmos de Árvore de Decisão, Floresta Aleatória, XGBoost e Rede Neural Perceptron Multicamadas. Os modelos XGBoost tiveram os melhores resultados em todos os experimentos. Por sua vez, o segundo cenário utiliza o algoritmo KMeans para a execução de um agrupamento de IES públicas que, a partir da análise de quatro grupos obtidos com a consideração de informações sobre despesas, quantidades de docentes e técnicos, localização e categoria administrativa das IES, entre outras, possibilitou a identificação de similaridades e dissimilaridades entre as instituições. Os grupos em questão, além de dados utilizados no primeiro cenário, que incluem informações sobre os estudantes, como faixa etária, tempo de graduação e forma de ingresso na graduação, observando se esse ocorreu por meio de políticas de ação afirmativa ou de inclusão social, entre outras, são considerados nos experimentos do terceiro cenário, com o uso do algoritmo Apriori, para a geração de regras de associação que podem suportar a descoberta de conhecimento no âmbito do ensino superior público brasileiro.