Aplicação de reconhecimento de texto manuscrito para a digitalização de redações do ensino médio em português
Data
2025-08-07
Autores
Lattes da Autoria
Orientação Docente
Lattes da Orientação Docente
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
A digitalização de redações manuscritas é uma etapa crucial para sistemas de correção automática, mas representa um desafio significativo devido à variabilidade caligráfica e às particularidades linguísticas. Este artigo aborda essa lacuna ao realizar uma análise comparativa do desempenho de seis modelos de Reconhecimento de Texto Manuscrito de aprendizado profundo (HTR-Flor, StackMix, OrigamiNet, TrOCR, HTR-VT, DTrOCR) e dois serviços comerciais (AWS Textract, GCP Vision). Os modelos foram avaliados em um novo conjunto de dados composto por 22.927 linhas de texto extraídas de 1.071 redações manuscritas de alunos do ensino médio em português. Os resultados, medidos por Taxa de Erro de Caractere (CER) e Palavra (WER), indicam que os modelos HTR-VT (CER 9,20%) e Stackmix (CER 11,72%) demonstraram maior robustez e eficácia neste domínio específico. Notavelmente, modelos baseados em Transformer como TrOCR e DTrOCR, que são estado da arte em benchmarks padronizados, apresentaram desempenho significativamente inferior (CER > 48%), evidenciando uma fraca generalização para a caligrafia variada encontrada nas redações. O estudo conclui que a especialização do modelo ao domínio e a robustez a diferentes estilos de caligrafia são mais cruciais para o desempenho prático do que a performance em datasets genéricos, fornecendo um panorama sobre o estado da arte e os desafios do HTR para o cenário educacional brasileiro.
Resumo em outro idioma
The digitization of handwritten essays is a crucial step for automated grading systems, yet it poses a significant challenge due to calligraphic variability and linguistic particularities. This paper addresses this gap by conducting a comparative performance analysis of six deep learning-based Handwritten Text Recognition (HTR) models (HTR-Flor, StackMix, OrigamiNet, TrOCR, HTR-VT, DTrOCR) and two commercial services (AWS Textract, GCP Vision). The models were evaluated on a new dataset comprising 22,927 text lines extracted from 1,071 handwritten essays by Brazilian high school students in Portuguese. The results, measured by Character Error Rate (CER) and Word Error Rate (WER), indicate that the HTR-VT (9.20% CER) and Stackmix (11.72% CER) models demonstrated greater robustness and effectiveness in this specific domain. Notably, Transformer-based models like TrOCR and DTrOCR, which are state-of-the-art on standard benchmarks, showed significantly inferior performance (CER > 48%), highlighting poor generalization to the varied handwriting found in the essays. The study concludes that model specialization to the domain and robustness to diverse handwriting styles are more critical for practical performance than performance on generic datasets, providing an overview of the state-of-the-art and challenges of HTR for the Brazilian educational scenario.
Descrição
Referência
DIAS, Lucas Valentim. Aplicação de reconhecimento de texto manuscrito para a digitalização de redações do ensino médio em português. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.
Identificador dARK
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess

