Application of a combined RL and PID algorithm in a mask controller for apnea
| dc.contributor.advisor | Sampaio, Pablo | |
| dc.contributor.advisor-co | Wanderley, Hatus Vianna | |
| dc.contributor.author | Oliveira, Victor Gabriel Tenório | |
| dc.date.accessioned | 2025-08-18T12:07:06Z | |
| dc.date.issued | 2025-03-24 | |
| dc.degree.departament | Computação | |
| dc.degree.graduation | Bacharelado em Ciência da Computação | |
| dc.degree.level | bachelor's degree | |
| dc.degree.local | Recife | |
| dc.description.abstract | Este estudo investiga a integração do algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) com o controle Proporcional-Integral-Derivativo (PID) para gerenciar sistemas não lineares, com foco no controle de Pressão Positiva Contínua nas Vias Aéreas (CPAP), buscando mostrar a viabilidade dessa integração. Um modelo matemático foi desenvolvido para representar a dinâmica do CPAP, e o algoritmo PIME-TD3 foi implementado e testado. Experimentos foram conduzidos nos ambientes Cascade Water Tank e CPAP, utilizando Optuna para otimizar hiperparâmetros. No ambiente Cascade Water Tank, o PIME-TD3 apresentou dificuldades em replicar os resultados da literatura, exigindo um ajuste exaustivo de hiperparâmetros e estrutura da rede. Já no ambiente CPAP, os resultados indicaram que as limitações da simulação impactaram o aprendizado, impedindo um controle eficaz da pressão. O estudo destaca a importância de modelos matemáticos realistas para treinar agentes de aprendizado por reforço e a necessidade de validação em hardware real para aplicação clínica. Além disso, sugere direções para pesquisas futuras, como a melhoria da modelagem do CPAP, experimentação com diferentes arquiteturas de rede e validação do controlador em dispositivos reais. | |
| dc.format.extent | 17 f. | |
| dc.identifier.citation | OLIVEIRA, Victor Gabriel Tenório. Application of a combined RL and PID algorithm in a mask controller for apnea. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025. | |
| dc.identifier.uri | https://arandu.ufrpe.br/handle/123456789/7530 | |
| dc.language.iso | pt_BR | |
| dc.publisher.country | Brazil | |
| dc.publisher.initials | UFRPE | |
| dc.rights | openAccess | |
| dc.rights.license | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Aprendizado por reforço profundo | |
| dc.subject | Vias aéreas (Medicina) | |
| dc.subject | Equipamentos e provisões | |
| dc.subject | Instrumentos e aparelhos médicos | |
| dc.subject | Controladores PID | |
| dc.subject | Apneia | |
| dc.title | Application of a combined RL and PID algorithm in a mask controller for apnea | |
| dc.type | bachelorThesis |
