De vilão a solução: o sobreajuste na geografia da desigualdade oculta do ENEM

dc.contributor.advisorAlbuquerque Junior, Gabriel Alves de
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1399502815770584
dc.contributor.authorSilva, Carlos Vinícius Martins da
dc.contributor.authorLatteshttp://lattes.cnpq.br/9995481931022767
dc.date.accessioned2026-03-31T11:48:32Z
dc.date.issued2026-02-19
dc.degree.departamentEstatística e Informática
dc.degree.graduationBacharelado em Sistemas da Informação
dc.degree.levelbachelor's degree
dc.degree.localRecife
dc.description.abstractO ENEM é uma base essencial para a análise educacional brasileira, mas aplicações de aprendizado de máquina na área costumam ter como objetivo a predição. Este trabalho propõe uma abordagem distinta: utiliza modelos interpretáveis para mapear padrões de desempenho e perfis socioeconômicos. A metodologia combina estatística descritiva com árvores de decisão submetidas ao sobreajuste (overfitting) intencional. O objetivo não é a generalização, mas a exaustão descritiva da base original, utilizando a renda familiar como alvo (target) instrumental para extrair regras que influenciam o desempenho em cada estrato social. Para quantificar a relevância dos fatores, aplicou-se a técnica SHAP (XAI) em cenário multiclasse. Os resultados confirmam que o desempenho acadêmico cresce proporcionalmente à renda, mas revelam nuances críticas: embora a posse de automóvel seja o principal determinante global de renda, a exclusão digital superou a imobilidade física como principal marcador de vulnerabilidade no estrato rural feminino em 2023. Adicionalmente, candidatos rurais têm maior dificuldade em converter renda em notas superiores, embora mulheres nesse contexto apresentem maior eficiência nessa conversão que homens. Conclui-se que esta abordagem revela desigualdades interseccionais que modelos preditivos convencionais ocultam.
dc.description.abstractxENEM is an essential database for Brazilian educational analysis, but machine learning applications in the field typically aim for prediction. This work proposes a distinct approach: it utilizes interpretable models to map performance patterns and socioeconomic profiles. The methodology combines descriptive statistics with decision trees subjected to intentional overfitting. The goal is not generalization, but rather the descriptive exhaustion of the original database, using family income as an instrumental target to extract rules that influence performance within each social stratum. To quantify the relevance of the factors, the SHAP (XAI) technique was applied in a multiclass scenario. The results confirm that academic performance increases proportionally with income, but reveal critical nuances: although car ownership is the main global determinant of income, digital exclusion surpassed physical immobility as the primary marker of vulnerability in the female rural stratum in 2023. Additionally, rural candidates face greater difficulty in converting income into higher scores, although women in this context demonstrate greater efficiency in this conversion than men. It is concluded that this approach reveals intersectional inequalities that conventional predictive models obscure.
dc.format.extent44 f.
dc.identifier.citationSILVA, Carlos Vinícius Martins da. De vilão a solução: o sobreajuste na geografia da desigualdade oculta do ENEM. 2026. 44 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2026.
dc.identifier.urihttps://arandu.ufrpe.br/handle/123456789/8413
dc.language.isopt_BR
dc.publisher.countryBrazil
dc.publisher.initialsUFRPE
dc.rightsopenAccess
dc.rights.licenseAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectAvaliação educacional
dc.subjectAprendizado de máquina
dc.subjectRendimento escolar
dc.subjectDesigualdades sociais
dc.subjectRenda familiar
dc.titleDe vilão a solução: o sobreajuste na geografia da desigualdade oculta do ENEM
dc.typebachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
tcc_art_carlosviniciusmartinsdasilva.pdf
Tamanho:
1.41 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura Disponível
Nome:
license.txt
Tamanho:
1.87 KB
Formato:
Item-specific license agreed upon to submission
Descrição: