'Dedo
Do Atlas do Boston Dynamics ao SayCan do Google, a maioria dos robôs manuais não tem a destreza necessária para "sentir" o que está segurando. (Se o fizessem, talvez um menino de 7 anos não tivesse seu dedo estalado por um robô de xadrez no ano passado.) Fazer um robô "ver", mover-se em direção a um objeto e agarrá-lo já é bastante complicado; adicionar a capacidade de sentir esse objeto e ajustar sua aderência de acordo é um desafio totalmente diferente. Mas depois de cinco anos de experimentação, um grupo de pesquisadores da Universidade de Columbia parece ter feito exatamente isso.
Em um artigo compartilhado via arXiv (um servidor dedicado à pré-impressão de entradas de diários acadêmicos), cientistas da computação e engenheiros mecânicos dizem que construíram uma mão robótica que usa feedback tátil e proprioceptivo. A propriocepção é a capacidade de sentir o movimento e a localização fisicamente e, embora seja normalmente discutida em referência aos músculos e articulações das criaturas vivas, a mão do robô prova que não é exclusiva dos animais. Juntamente com a capacidade de alavancar o feedback tátil, a propriocepção permite que a mão do robô sinta o objeto que está segurando e ajuste sua pegada de acordo, sem a ajuda de uma superfície de suporte passiva, como uma mesa.
A equipe escreve que usou aprendizado por reforço (RL) emparelhado com algoritmos de planejamento baseado em amostragem (SBP) para treinar o robô. Usando RL, o robô recebia sinais de "recompensa" quando fazia algo que os pesquisadores queriam e da mesma forma "repreendia" quando fazia algo que não deveria. A equipe poderia ter usado tecnicamente o RL sozinho, mas como essa técnica deixa espaço para erros - o menor desvio de seus "deveria" e "não deveria" previstos o prejudicaria - eles usaram o SBP como um suplemento. Cada vez que o robô era recompensado por fazer algo que deveria fazer, o SBP permitia que ele adicionasse uma ramificação a uma rede digital em constante expansão, que funciona como um conjunto de escolhas que o robô pode fazer quando apresenta uma nova oportunidade.
Este treinamento abre caminho para uma mão robótica que faz muito mais do que apenas pegar objetos. Depois de agarrar algo, o robô da equipe de Columbia pode usar suas habilidades proprioceptivas para obter a essência do que está segurando. Isso permite que o robô ajuste quanta pressão está usando para manter a pegada. O robô também pode se envolver em "andar com os dedos", no qual move dedos individuais para segurar melhor o que segura. Enquanto se ajusta, o robô mantém pelo menos três dedos no objeto para evitar que ele caia, eliminando a necessidade de mesas ou outras superfícies. Como o robô não depende de um sensor visual, ele é tão capaz de ajustar e manter a aderência no escuro quanto em uma área bem iluminada.
A mão do robô é apenas isso - uma mão - então temos um longo caminho a percorrer antes de vermos robôs humanóides que usam técnicas semelhantes para "sentir" o que estão segurando. Quando chegarmos mais perto desse ponto, porém, poderemos ver robôs auxiliares mais capazes que podem agarrar, segurar e ajustar a posição de objetos melhor do que os predecessores de hoje.