Application of a combined RL and PID algorithm in a mask controller for apnea

dc.contributor.advisorSampaio, Pablo
dc.contributor.advisor-coWanderley, Hatus Vianna
dc.contributor.authorOliveira, Victor Gabriel Tenório
dc.date.accessioned2025-08-18T12:07:06Z
dc.date.issued2025-03-24
dc.degree.departamentComputação
dc.degree.graduationBacharelado em Ciência da Computação
dc.degree.levelbachelor's degree
dc.degree.localRecife
dc.description.abstractEste estudo investiga a integração do algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) com o controle Proporcional-Integral-Derivativo (PID) para gerenciar sistemas não lineares, com foco no controle de Pressão Positiva Contínua nas Vias Aéreas (CPAP), buscando mostrar a viabilidade dessa integração. Um modelo matemático foi desenvolvido para representar a dinâmica do CPAP, e o algoritmo PIME-TD3 foi implementado e testado. Experimentos foram conduzidos nos ambientes Cascade Water Tank e CPAP, utilizando Optuna para otimizar hiperparâmetros. No ambiente Cascade Water Tank, o PIME-TD3 apresentou dificuldades em replicar os resultados da literatura, exigindo um ajuste exaustivo de hiperparâmetros e estrutura da rede. Já no ambiente CPAP, os resultados indicaram que as limitações da simulação impactaram o aprendizado, impedindo um controle eficaz da pressão. O estudo destaca a importância de modelos matemáticos realistas para treinar agentes de aprendizado por reforço e a necessidade de validação em hardware real para aplicação clínica. Além disso, sugere direções para pesquisas futuras, como a melhoria da modelagem do CPAP, experimentação com diferentes arquiteturas de rede e validação do controlador em dispositivos reais.
dc.format.extent17 f.
dc.identifier.citationOLIVEIRA, Victor Gabriel Tenório. Application of a combined RL and PID algorithm in a mask controller for apnea. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.
dc.identifier.urihttps://arandu.ufrpe.br/handle/123456789/7530
dc.language.isopt_BR
dc.publisher.countryBrazil
dc.publisher.initialsUFRPE
dc.rightsopenAccess
dc.rights.licenseAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAprendizado por reforço profundo
dc.subjectVias aéreas (Medicina)
dc.subjectEquipamentos e provisões
dc.subjectInstrumentos e aparelhos médicos
dc.subjectControladores PID
dc.subjectApneia
dc.titleApplication of a combined RL and PID algorithm in a mask controller for apnea
dc.typebachelorThesis

Arquivos