Estratégias de recuperação para planejamento multiagente em ambientes dinâmicos

Moreira, Leonardo Henrique

Veuillez utiliser cette adresse pour citer ce document : http://repositorio.unb.br/handle/10482/49810

Fichier(s) constituant ce document :

Fichier	Taille	Format
LeonardoHenriqueMoreira_TESE.pdf	7,2 MB	Adobe PDF	Voir/Ouvrir

Titre:	Estratégias de recuperação para planejamento multiagente em ambientes dinâmicos
Autre(s) titre(s):	Recovery strategies for multi-agent planning in dynamic environments
Auteur(s):	Moreira, Leonardo Henrique
Orientador(es)::	Ralha, Célia Ghedini
Assunto::	Sistemas Multiagentes (SMA) Planejamento multiagente Planejamento automatizado
Date de publication:	13-aoû-2024
Data de defesa::	30-jui-2023
Référence bibliographique:	MOREIRA, Leonardo Henrique. Recovery Strategies for Multi-agent Planning in Dynamic Environments. 2023. 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2023.
Résumé:	Planejamento é o processo de deliberação tomado por um agente, humano ou robô, ao escolher ações para mudar o ambiente para uma condição desejável [Ghallab et al., 2016]. O processo de planejamento concentra-se na escolha e organização das ações por meio de seus efeitos esperados. Outrossim, o planejamento depende da coordenação das ações selecionadas para fornecer a ordem e o tempo corretos para permitir a cooperação e evitar a competição entre os agentes. Além disso, um agente não é apenas um executor e, portanto, deve integrar planejamento e raciocínio ao longo do processo de execução [Ghallab et al., 2014]. Planejamento multiagente (PMA) é uma área de pesquisa em ciência da computação que integra o planejamento de inteligência artificial com sistemas multiagentes. Embora o planejamento seja uma área de pesquisa madura da inteligência artificial, geralmente com foco em tarefas de agente único, os sistemas multiagentes envolvem agentes inteligentes que trabalham cooperativamente ou competitivamente para atingir objetivos individuais ou de grupo. Além disso, técnicas e modelos de PMA podem ser aplicados em diversas áreas, desde ambientes com alto nível de controle até cenários onde a incerteza é uma condição presente. Assim, as aplicações PMA podem ser adotadas em cenários comuns a complexos. A pesquisa na área de PMA é aplicável a problemas de mundo real, com interesse crescente em veículos autônomos, logística e automação de armazéns, sistemas multi-robôs e muitos outros domínios. Nesse contexto, dois pontos importantes podem ser destacados em tais aplicações. Primeiro, os agentes dependem ou afetam outros agentes em diferentes níveis, no que diz respeito à interação entre as execuções de suas ações. Em segundo lugar, os agentes precisam reagir dinamicamente às mudanças no estado do ambiente. Em ambos os casos, cada agente depende da capacidade de monitorar seu próprio estado, possibilitando identificar falhas no sistema. Além disso, os agentes devem se comunicar e negociar para se adaptar efetivamente às mudanças no ambiente. A cooperação desempenha um papel crucial na organização de agentes dentro de um sistema, mas seu significado vai além da mera organização. A cooperação permite que os agentes prestem assistência uns aos outros quando necessário e ajuda a evitar interferências na coordenação de atividades individuais. Portanto, a competição entre os agentes pode ser eliminada, permitindo que eles trabalhem para alcançar objetivos comuns. Vários fatores influenciam o processo de tomada de decisão e a complexidade de execução dentro de um PMA. A quantidade e capacidade dos recursos envolvidos, as condições operacionais e os procedimentos estratégicos são alguns dos aspectos que impactam significativamente as fases de planejamento, coordenação e execução. Em organizações hierárquicas, como empresas ou unidades militares, uma abordagem centralizada pode ser adotada para otimizar a utilização de recursos. Por outro lado, a execução pode ser descentralizada para permitir ações simultâneas. Sempre que possível, a execução das tarefas deve priorizar o desdobramento pontual e modular das capacidades, evitando a duplicação de ações e a dispersão de recursos, garantindo assim a eficácia e minimizando os custos operacionais e logísticos. Além disso, em cenários onde os agentes não têm controle total sobre o ambiente, os processos de planejamento, coordenação e execução tornam-se significativamente mais desafiadores. Nesses casos, os agentes operam em um ambiente dinâmico onde os resultados de suas ações não são determinísticas. Consequentemente, ambientes dinâmicos são suscetíveis a eventos inesperados que podem resultar em falhas de planejamento. Uma extensa pesquisa tem sido dedicada a explorar a integração das dimensões de planejamento, coordenação e execução no contexto de múltiplos agentes. No entanto, existe a necessidade de aprofundar a investigação e resolução de questões relativas à dimensão de execução. Dentro do domínio da pesquisa em planejamento, certas características tipicamente definem as abordagens propostas. Nos estudos classificados como PMA, a responsabilidade pelas capacidades de planejamento ou execução é distribuída entre os agentes. Normalmente, esses estudos introduzem modelos que consideram as ações como a única fonte de mudanças nos estados do ambiente, desconsiderando eventos inesperados decorrentes de interações [Chouhan and Niyogi, 2017, Štolba and Komenda, 2015, Torreño et al., 2014]. Consequentemente, essas abordagens assumem um ambiente totalmente observável e determinístico, sem incerteza quanto aos efeitos das ações. No entanto, essas características limitam a aplicabilidade dessas abordagens em ambientes dinâmicos onde os agentes devem possuir a capacidade de lidar com falhas. Por exemplo, os agentes podem encontrar falhas de execução, problemas de comunicação e conhecimento limitado sobre os fatos circundantes. Como resultado, essas abordagens, com o planejamento sendo realizado em uma fase única e separada da execução, têm aplicações limitadas. Nesses casos, é impossível lidar com eventos inesperados devido à dificuldade inerente de prever todos os estados possíveis dentro de um sistema multiagente. Diante disso, este trabalho verificou os modelos de PMA existentes e buscou abordar os problemas referentes à avaliação de desempenho e à combinação de estratégias de recuperação. Dessa forma, uma etapa crucial foi a realização de uma revisão de literatura abordando conceitos, técnicas e desafios do estado-da-arte. A revisão foi um processo conduzido com adoção de protocolos tradicionais e complementares para fornecer uma visão abrangente da área de pesquisa de PMA. Assim sendo, trabalhos de pesquisa no campo de ambientes dinâmicos frequentemente propõem duas estratégias de recuperação de planos. A primeira estratégia é o replanejamento, que envolve retirar ações de um plano anterior e gerar um novo plano a partir do estado atual para alcançar o estado desejado [Gouidis et al., 2018, Komenda et al., 2012, 2014]. A segunda estratégia é a reparação, que visa reutilizar ações de um plano anterior para restaurar uma condição prevista e desejável [Cashmore et al., 2019, Komenda et al., 2012, 2014, Mohalik et al., 2018]. Embora a estratégia de reparo geralmente exija menos tempo de planejamento em comparação com o replanejamento, a abordagem de replanejamento tende a gerar planos com um número menor de ações do que o reparo [Babli et al., 2023]. Neste ponto, dois problemas podem ser identificados. Em primeiro lugar, os estudos de MAP normalmente analisam valores médios de tempo de planejamento, número de ações e ocorrências de falhas. Portanto, muitas vezes carecem de uma avaliação abrangente que inclua fatores como desvio padrão, nível de confiança dos resultados, e métodos estatísticos de avaliação de estratégias de recuperação. Basear-se apenas em valores médios pode levar a conclusões prematuras sem considerar a distribuição geral dos dados. Além disso, apesar das vantagens e desvantagens associadas a cada estratégia, existe uma lacuna de pesquisa na literatura sobre a integração de técnicas de replanejamento e reparo em modelos PMA. Assim, um segundo problema identificado é que os modelos apresentados não que combinam replanejamento e reparo de maneira coesa e unificada. Como soluções, um método de avaliação de estratégias de recuperação em ambientes dinâmicos foi proposto para resolver o primeiro problema. Além disso, um processo de recuperação de planos que combina replanejamento e reparo também foi desenhado para ser uma solução para o segundo problema apresentado. Sendo assim, o objetivo deste trabalho foi apresentar uma análise abrangente das estratégias de recuperação de planos em ambientes dinâmicos para propor um modelo que explore as duas opções de maneira complementar. Logo, esse propósito foi dividido em dois objetivos específicos. O primeiro foi avaliar o desempenho e definir as características de reparação e replanejamento utilizando técnicas estatísticas de teste de hipótese e correlação. Em seguida, combinar as duas estratégias em um único modelo de tal maneira que suas potencialidades sejam exploradas. Para explorar a lacuna referente ao método de avaliação, essa tese apresenta uma análise mais ampla sobre o desempenho das estratégias de recuperação de planos em ambientes dinâmicos. De maneira diferente dos trabalhos correlatos, foi apresentada uma verificação da correlação entre as métricas que influenciam o rendimento destas estratégias. Assim, como um dos resultados obtidos, destaca-se a análise de que o nível de acomplamento, caracterizado pelo nível de ações públicas, é um fator influenciador das correlações entre as métricas. Além disso, a lacuna referente à combinação entre as estratégias de recuperação foi trabalhada na prosposta de modelo apresentado. Nesse quesito, o modelo proposto explora o uso de reparação de maneira individual pelos agentes, reservando o uso do replanejamento para uma fase posterior e centralizada, acionada caso a tentativa anterior não tenha tido sucesso. Com isso, as características das estratégias são exploradas de forma complementar, ou seja, a rapidez da reparação com a qualidade e robustez do replanejamento. Cabe também destacar que esse modelo minimiza a troca de mensagens em situações em que uma solução local é viável, o que é particularmente importante em ambientes complexos ou quando os agentes precisam deliberar rapidamente sobre soluções. Outrossim, os resultados forneceram condições para concluir que o número de objetivos e as falhas afetam a execução em diferentes condições. Por fim, os resultados apontam que o desenho do processo de recuperação do plano é adequado para vários cenários, destacando que a reparação deve ser explorada de forma descentralizada enquanto o replanejamento é feito de forma centralizada. Em resumo, esta tese apresenta e avalia um modelo de PMA aplicável a ambientes dinâmicos, que combina a estratégia de replanejamento e de reparo. Cabe destacar algumas contribuições para a área de pesquisa em PMA. Em primeiro lugar, ressalta-se um método para comparar o desempenho das estratégias de recuperação de planos em diferentes cenários, considerando tanto o planejamento centralizado quanto o distribuído com níveis variados de acoplamento. Ademais, a revisão da literatura traz outra contribuição ao fornecer uma visão abrangente da área de pesquisa de PMA. Ao examinar uma ampla gama de trabalhos acadêmicos, a revisão viabilizou identificar autores e organizações que fizeram contribuições substanciais para o campo de estudo, bem como os documentos mais citados.
Abstract:	This thesis explores Multi-Agent Planning (MAP) and its application in dynamic environments. MAP combines artificial intelligence planning with multi-agent systems to coordinate intelligent agents achieving individual or group goals. Planning in dynamic environments introduces challenges in coordination and execution due to non-deterministic outcomes. Plan recovery strategies, like replanning and repairing, aim to handle failures and restore desired conditions. A comprehensive literature review highlighted key contributors and institutions in the MAP research offering insights into concepts, techniques, and open challenges. However, combining different recovery strategies for MAP models is a research challenge yet to be accomplished in the present literature. Two problems are discussed in this thesis: incomplete assessments and a need for more research on cohesively integrating replanning and repair techniques. These problems are addressed to improve effectiveness and provide a comprehensive performance evaluation of the strategies. As solutions, we proposed an evaluation method for recovery strategies in dynamic environments to address the first issue. In addition, we designed a plan recovery process that combines replanning and repairing. This approach considers the complexity of planning, coordination during execution, and agents attempting local repairs before seeking assistance from other agents. The results highlight that recovery strategies perform similarly in scenarios with low agent coupling levels. Also, the results provided conditions to conclude that the number of goals and the failures affect execution under different conditions. Finally, the results point out that the plan recovery process design is suitable for various scenarios, highlighting that repairing should be explored in a decentralized approach while replanning in and centralized way.
metadata.dc.description.unidade:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Description:	Tese (Doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.
metadata.dc.description.ppg:	Programa de Pós-Graduação em Informática
Licença::	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Collection(s) :	Teses, dissertações e produtos pós-doutorado

Affichage détaillé " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/49810/statistics">