Application of a combined RL and PID algorithm in a mask controller for apnea

Oliveira, Victor Gabriel Tenório

Application of a combined RL and PID algorithm in a mask controller for apnea

Arquivos

Primário tcc_art_victorgabrieltenoriooliveira.pdf (990.87 KB)

Data

2025-03-24

Autores

Oliveira, Victor Gabriel Tenório

Orientação Docente

Sampaio, Pablo

Resumo

Este estudo investiga a integração do algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) com o controle Proporcional-Integral-Derivativo (PID) para gerenciar sistemas não lineares, com foco no controle de Pressão Positiva Contínua nas Vias Aéreas (CPAP), buscando mostrar a viabilidade dessa integração. Um modelo matemático foi desenvolvido para representar a dinâmica do CPAP, e o algoritmo PIME-TD3 foi implementado e testado. Experimentos foram conduzidos nos ambientes Cascade Water Tank e CPAP, utilizando Optuna para otimizar hiperparâmetros. No ambiente Cascade Water Tank, o PIME-TD3 apresentou dificuldades em replicar os resultados da literatura, exigindo um ajuste exaustivo de hiperparâmetros e estrutura da rede. Já no ambiente CPAP, os resultados indicaram que as limitações da simulação impactaram o aprendizado, impedindo um controle eficaz da pressão. O estudo destaca a importância de modelos matemáticos realistas para treinar agentes de aprendizado por reforço e a necessidade de validação em hardware real para aplicação clínica. Além disso, sugere direções para pesquisas futuras, como a melhoria da modelagem do CPAP, experimentação com diferentes arquiteturas de rede e validação do controlador em dispositivos reais.

Palavras-chave

Aprendizado por reforço profundo; Vias aéreas (Medicina); Equipamentos e provisões; Instrumentos e aparelhos médicos; Controladores PID; Apneia

Referência

OLIVEIRA, Victor Gabriel Tenório. Application of a combined RL and PID algorithm in a mask controller for apnea. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.

URI

https://arandu.ufrpe.br/handle/123456789/7530

Coleções

TCC - Bacharelado em Ciência da Computação (Sede)

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess

Página do item completo

Application of a combined RL and PID algorithm in a mask controller for apnea

Arquivos

Data

Autores

Lattes da Autoria

Orientação Docente

Lattes da Orientação Docente

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Resumo em outro idioma

Descrição

Palavras-chave

Referência

URI

Identificador dARK

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons