Exploração de Ambientes Não- Estruturados com Terreno Acidentado por Robôs Móveis Pedro Eduardo Gonzales Panta PUC-Rio pedro.gonzales@gmail.com Resumo: A exploração de ambientes não estruturados, como é o caso do ambiente apresentado pela Amazônia, tem sido alvo de interesse na área de pesquisa nos últimos anos. Fazem-se necessários novos Métodos de Planejamento que permitam aos robôs moveis explorar estas áreas com alto nível de autonomia baseado no modelo físico do robô e o ambiente. Neste trabalho se apresenta um algoritmo de planejamento de trajetória que considera as restrições físicas (gradiente do terreno, tipo de solo, incerteza) que ambiente impõe ao robô. O algoritmo proposto consegue projetar uma trajetória eficiente até o robô chegar no objetivo. Palavras-chave: robôs moveis, algoritmos genéticos, ambientes nãoestruturados, planejamento de trajetórias. 1. Introdução: A exploração de ambientes nãoestruturados por robôs móveis tem sido objeto de intenso estudo nos últimos anos devido à sua crescente aplicação. Em referencia à exploração de ambientes de difícil acesso para o ser humano, encontram casos menos divulgados, como a exploração de ambientes com características florestais. Este é o caso da Amazônia brasileira. Para este tipo de exploração, o Laboratório de Robótica do CENPES tem proposto a criação de sistemas móveis que possam dar condições para que o homem consiga penetrar em ambientes florestais e realizar atividades em locais inacessíveis e conseqüentemente pouco conhecidos e estudados. Para conseguir este objetivo, foram criados dois protótipos de um robô móvel, um de pequeno e outro de mediano porte, que têm como principal característica o acesso e transporte de equipamento de monitoramento em ditas regiões. Estes protótipos são apresentado na Figura 1. Figura 1. Protótipos do Robô Ambiental Híbrido. Pretende-se, com este trabalho, apresentar um algoritmo que facilite a condução do robô com alto nível de autonomia através do planejamento da trajetória que este deve seguir para chegar a um ponto determinado. Para explorar estas áreas precisa-se de métodos de ação que não sejam simplesmente reativos senão também que planejem ações no futuro distante. Superfície do terreno. O terreno está definido por um conjunto de pontos que formam uma superfície no espaço. Cada ponto está determinado pelas suas coordenadas no espaço x, y e z em relação a um sistema referencial como apresentado na Figura 2. Sua representação discretizada está dada pelo conjunto de pontos Pi(xi, yi, zi). As coordenadas x e y definem a posição do ponto da superfície em um plano horizontal, e a coordenada z define a sua
altura. Os intervalos de discretização dos valores das coordenadas x e y são constantes e iguais a a e b respectivamente. Assumindo-se que z é uma função de x e y, i.e., para cada projeção (x, y) há apenas um valor de z associado ao terreno, temos o caso particular de um terreno conhecido como 2,5D, que será usado neste trabalho. O caso geral 3D só seria necessário, e.g., em situações de exploração de cavernas, onde uma mesma projeção (x, y) pode possuir mais de uma cota z (o fundo e o topo da caverna, por exemplo). que este avança através do ambiente. O método consiste, então, em escolher a seqüência de módulos de ação que permita ao robô chegar a um ponto determinado do terreno. A esta seqüência de módulos chama-se de Plano de Ação. A avaliação do plano de ação toma em conta as características relevantes da topografia do ambiente como o tipo de terreno, o mapa de gradientes (visando garantir a estabilidade do robô, evitando capotagens), e a incerteza da localização de cada um dos pontos do perfil do terreno. Modulo de Localização Coordenada Xc Coordenada Yc Coordenada Zc Yaw ψ Roll Ө Pitch Ф Tabela 1. Módulos de Localização Figura 2. Representação da superfície do terreno. 2. A Abordagem do Planejamento da Ação Para resolver a questão do planejamento de trajetória do robô móvel, o método utilizado divide os dados de localização do robô (Tabela 1) e os dados referentes às ações que o robô pode fazer, que em conjunto formam um Inventário de Módulos de Ação (Tabela 2). No exemplo específico da Tabela 2, consideram-se as movimentações do robô e de seu manipulador (braço) robótico utilizado para coleta de amostras. Os módulos de localização servem como dados essenciais para um novo cálculo da trajetória a ser seguida pelo robô cada vez N. de Ação Módulo 1 Movimento para frente 500mm 2 Movimento para trás 500mm 3 Vira Esquerda 45 o 4 Vira Direita 45 o 5 Move Braço x +20mm 6 Move Braço x -20mm 7 Move Braço y +20mm 8 Move Braço y -20mm 9 Move Braço z +20mm 10 Move Braço z -20mm Tabela 2. Modulo de Ação Um plano de ação bem sucedido é aquele no qual o robô completa uma tarefa específica sem violar nenhuma das restrições da tarefa. Para um plano de
ação bem sucedido, é necessário procurar uma seqüência certa de módulos de ação. O tamanho do Espaço de Procura fica determinado por: m D = N (1) onde: D = número de possíveis planos de ação; N = número de possíveis módulos de ação; e m = número de módulos de ação utilizados no plano. Entre os complicadores está o fato de o número de possíveis planos de ação poder ser muito alto. Terrenos complicados podem aumentar o número de planos de ação impossíveis. A redução do número de planos de ação possíveis é feita através de uma filtragem simples, e.g., se a tarefa não precisar de manipulação de objetos, então se tiram do inventário de módulos de ação todos os módulos referentes à manipulação. A busca de um plano de ação satisfatório será feito neste trabalho através de algoritmos genéticos. Estes algoritmos fazem analogia às leis que regem a evolução genética de sistemas biológicos. No entanto, ao invés de indivíduos, serão considerados planos de ação a serem analisados. Cada plano de ação possui analogia à seqüência de cromossomos do DNA de um indivíduo, onde cada cromossomo estaria associado a uma ação (e.g., andar 500mm para frente, girar 45 graus à direita, etc.). Uma população inicial é criada da montagem aleatória de módulos do inventário reduzido. Esta população é um conjunto de planos de ação inicialmente escolhidos aleatoriamente. Cada plano de ação é associado a um indivíduo. O algoritmo genético utiliza um crossover simples como apresentado na Figura 3. O crossover combina alguns atributos de dois planos de ação para criar um terceiro e quarto planos de ação. Dois módulos (C1 e C2) são escolhidos dentre dois planos de ação. Então os conjuntos de ações representados na figura por B e D em cada lista são trocados. Figura 3. Crossover dos planos de ações. Considera-se também mutações nos planos de ações, que são mudanças aleatórias nos planos de ação com o objetivo de melhorar a sua aptidão à tarefa. Na mutação utilizada, um módulo específico de um plano de ação é trocado com um módulo escolhido aleatoriamente do inventário reduzido. Para a avaliação de cada candidato a plano de ação (indivíduo), cada plano é simulado considerando o perfil já mapeado do terreno, vide Figura 4. Será avaliado principalmente se a tarefa foi completada sem violar as restrições condicionadas pelo ambiente, e.g., sem perda de estabilidade (capotagem) e sem saturação dos motores, ou até minimizando o consumo de energia. Os planos de ação que chegam mais próximos de completar a tarefa ganham maior pontuação na avaliação de aptidão.
Figura 4. Dois possíveis planos de ação, avaliados sobre o perfil do terreno previamente mapeado. 3. Construção do Mapa de Gradientes do Terreno Nesta seção se construiu um mapa em 2,5D por meio da localização de pontos z para cada par (x,y). Tem que ser lembrado que cada um destes pontos está associado a uma incerteza probabilística. Cada cota z i associada à discretização (x i, y i ) é portanto associada a uma distribuição de probabilidade (normalmente considerada gaussiana). Com a localização em z dos pontos chave para uma determinada coordenada x-y temos os dados necessários para achar o gradiente aproximado para cada ponto da superfície do terreno, como apresentado na Figura 5. Utilizando as coordenadas dos vizinhos de um determinado ponto, pode-se calcular o seu gradiente de forma aproximada. Figura 5. Gradiente em um ponto determinado do mapa 4. Construção do Algoritmo Genético para o Planejamento de Trajetória e Exploração Sabe-se que cada ponto chave da discretização do terreno está associado a uma incerteza probabilística. Esta incerteza probabilística vai ser considerada na avaliação de cada plano de ação (indivíduo) na procura da trajetória que o veículo deverá seguir. Pontos com alta incerteza terão menos chance que os de menor incerteza. Também são considerados no cromossomo os diferentes tipos de terreno em que está divido o ambiente como apresentado na Figura 6. Serão determinados pesos diferentes para cada tipo de terreno de forma que os planos de ação que atravessam terrenos que poderiam apresentar dificuldades no deslocamento do veículo (terrenos com solo instável ou com baixo atrito, escorregadios ) deverão ter menos chances de sobrevivência no algoritmo genético.
δ = 1 se o objetivo é alcançado e 0 de outra forma; αi = fator de peso, que pode ser positivo ou negativo. Figura 6. Mapa com diferentes tipos de terreno Outra consideração dentro da construção do cromossomo é a magnitude do gradiente da superfície do terreno. Este mapa de gradientes foi construído na seção anteirior. Para gradientes com valores acima de um patamar determinado, a probabilidade de o robô capotar é maior. Os lugares do terreno com gradientes altos devem ser evitados, pois estabelece a margem de estabilidade em níveis críticos. Com esses dados, a função de aptidão, que define a qualidade de um plano de ação, fica definida por uma função, e.g.: f = α 1D + α 2I + α 3S + α 4T + α 5E + α6δ onde D = distância percorrida pelo robô em direção ao objetivo durante todo o trajeto (a ser minimizada); I = incerteza probabilística média da localização dos pontos percorridos; S = função associada à margem de estabilidade do veículo na trajetória considerada (para evitar capotagem) e, por tanto, associado ao mapa de gradientes; T = tempo requerido para completar a tarefa (a ser minimizado); E = coeficiente do tipo de terreno (para evitar deslizamentos); Uma vez maximizada a função de aptidão, o plano de ação mais adaptado ao terreno considerado é escolhido. Este plano de ação é então utilizado em conjunto com um controle de estabilidade e tração (Barral, 2007) para garantir a travessia do terreno. O plano de ação age como um planejamento em alto nível (e.g., movimentos de 500 em 500mm), enquanto o controle de estabilidade e tração garantem o cumprimento de cada módulo do plano (cromossomo) em um nível mais baixo (e.g., com resolução de poucos milímetros). A metodologia proposta de mapeamento, auto-localização e planejamento de trajetórias será validada experimentalmente neste trabalho através do Robô Ambiental Híbrido. 5. Resultados Para implementar o algoritmo proposto utilizou-se o Toolbox de Matlab de Algoritmos Genéticos. Para a tarefa do robô ir de um ponto especifico a outro se descartou os módulos de ação referentes ao manipulador. Assim o inventario reduzido considerou só os módulos 1, 2, 3 e 4 que tratam do deslocamento do robô. Trabalhou-se com uma população de 50 indivíduos. O resultado achou-se na geração 17. Uma apresentação do trajeto selecionado no mapa 2,5D é apresentada na Figura 7.
Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, Brasil, 2007., Figura 7. Representação em 2,5D do trajeto achado pelo Algoritmo Genético. 6. Conclusões Foi apresentado uma metodologia de planejamento de trajetória para ser aplicado em robôs que fazem exploração em ambientes não estruturados e irregulares como os apresentados na Amazônia. Este método considera as restrições físicas oferecidas pelo ambiente como são a gradiente, o tipo de solo e a incerteza da superfície. A metodologia foi implementada por algoritmo genéticos e simulada em Matlab. Este método divide as ações do robô em ações discretas ou módulos de ação. Depois procura por uma seqüência de módulos de ação, ou plano de ação, utilizando um processo hierárquico de seleção que inclui um algoritmo genético. O plano de ação é avaliado usando o modelo da superfície do terreno. O método é estruturado para permitir um processo de procura efetivo. O resultado pratico deste método será implementado no Robô Ambiental Híbrido construído pelo Laboratório de Robótica do CENPES/Petrobras. 7. Bibliografia [1] Barral A., Controle de Tração de Sistemas Robóticos Móveis em Terrenos Acidentados. Dissertação de Mestrado, [2] Farritor, S. and Dubowsky, S. A Genetic Algorithm Based Navigation and Planning Methodology for Planetary Robotic Exploration. Proceedings of the American Nuclear Society Sixth Topical Meeting on Robotics and Remote Systems, 1997. [3] Farritor, S. and Dubowsky, S. A Self-Planning Methodology for Planetary Robotic Explorers. Proceedings of the Eighth International Conference on Advanced Robotics, 1997. [4] Farritor S., Hacot H. e Dubowsky S., Physics-Based Planning For Planetary Exploration. Proceedings IEEE International Conference on Robotics and Automation, ICRA, pages 278 283, 1998. [5] Farritor, S. and Dubowsky, S. A Genetic Planning Method and its Application to Planetary Exploration. ASME Journal of Dynamic Systems, Measurement, and Control, 2002. [6] Haït A., Siméon T. e Taïx M., Algorithms for Rough Terrain Trajectory Planning. Advanced Robotics, vol. 14, no. 6, 1999. [7] Iagnemma K., Génot F. e Dubowsky S., Rapid Physics- Based Rough-Terrain Rover Planning with Sensor and Control Uncertainty.
Proceedings IEEE International Conference on Robotics and Automation, ICRA, volume 3, pages 2286 2291, 1999. [8] Iagnemma, K., Dubowsky, S., Mobile Robots in Rough Terrain, Springer Berlin Heidelberg, New York, 2004. [9] Michalewicz, Z., Genetic Algorithms + Data Structures = Evolution Programs, Sringer Berlin Heidelberg, 1996.