01. Universidade Federal Rural de Pernambuco - UFRPE (Sede)
URI permanente desta comunidadehttps://arandu.ufrpe.br/handle/123456789/1
Navegar
2 resultados
Resultados da Pesquisa
Item Controle de temperatura de estufas utilizando método de controle supervisório(2020-10-29) Araújo, Guilherme Matheus de; Gonçalves, Glauco Estácio; http://lattes.cnpq.br/6157118581200722; http://lattes.cnpq.br/1992687962116742Estufas são estruturas utilizadas para obtenção de condições ambientais ideais para o desenvolvimento de plantas. Elas são de fácil construção e manutenção e variam em formato, componentes estruturais e outros fatores. São feitas para serem reguladas de acordo com as necessidades de quem as implanta, para dado grupo de plantas. Um dos principais fatores que influenciam o crescimento das plantas é a temperatura no ambiente interno da estufa. Para que as condições de temperatura ideais para cada grupo de plantas fosse alcançada de forma automática, um sistema de controle de temperatura, que modela os atuadores do ambiente de uma estufa e os eventos que nela ocorrem, foi desenvolvido. A validação deste sistema de controle foi propiciada graças à criação de um simulador desenvolvido segundo os princípios de balanço de massa e energia. A comunicação entre as duas entidades ocorre através de uma interface de aplicação REST. Três propostas de modelagem e regras para o sistema de controle são apresentadas neste trabalho. O principal objetivo é determinar qual delas apresenta a melhor relação de viabilidade e eficiência no controle da temperatura dentro da estufa, considerando fatores de consumo energético, taxa de erro em graus e porcentagem de tempo em que o ambiente permanece dentro das condições ideais. Todas as propostas baseiam-se no controle dos estados de dois atuadores específicos de uma estufa: os sistemas de aquecimento e resfriamento. Os cenários simulados utilizam configurações específica para a estufa e um pequeno plantio de tomate, em períodos de 24 horas de dias escolhidos a partir de estações do ano distintas. Os modelos de controle apresentaram níveis de eficiência significativamente distintos, chegando a atingir 33% de diferença.Item Um currículo de aprendizagem por reforço para recompensas modeladas no Lunar Lander(2021-07-19) Albuquerque, Renilson da Silva; Sampaio, Pablo Azevedo; http://lattes.cnpq.br/8865836949700771; http://lattes.cnpq.br/3364503614448061A aprendizagem por reforço é um paradigma de aprendizagem de máquina onde o agente aprende a resolver problemas interagindo com um ambiente através de ações executadas em uma lógica de tentativa e erro. A cada ação executada, o agente recebe uma recompensa do ambiente indicando o quão efetiva foi em relação a resolução do problema, de forma que o objetivo do agente consiste em maximizar a recompensa total recebida. Porém, em alguns sistemas de aprendizagem por reforço o agente precisa aprender tarefas muito complexas que atribuem recompensas não muito informativas, gerando assim o problema de atribuição de crédito que torna a aprendizagem do agente muito lenta. A modelagem de recompensas e a aprendizagem por currículo, são técnicas que podem acelerar o tempo de treinamento do agente ao separar o problema em tarefas menores a serem resolvidas sequencialmente, atribuindo recompensas menores e mais informativas por ação executada. O Lunar lander é um simulador 2D simplificado, utilizado como referencial para a aplicação de soluções de aprendizagem por reforço para o problema de otimização do controle de pouso de um módulo lunar. Porém o seu sistema de recompensas padrão atribui muito mais recompensas punitivas pelo uso dos motores, não sendo muito construtivo para o agente, o que pode levar ao problema de atribuição de crédito. Neste sentido, este trabalho propôs um currículo utilizando dois novos modelos de recompensas, onde foram realizados experimentos a fim de minimizar o tempo de aprendizado do Lunar Lander. Foi constatado neste trabalho que ambos os novos modelos e o currículo, foram mais efetivos em treinar o agente do Lunar Lander, em comparação ao modelo de recompensas padrão.
