A inteligência artificial do Google agora é capaz de fazer parkour no mundo virtual e enfrentar obstáculos de forma criativa.
Aprendizado por reforço (RL) é a prática de ensinar e orientar o comportamento usando um sistema de recompensa.
O comportamento desejável produz recompensas; comportamento indesejável não.
A equipe do Google, então, desenvolveu um cenário ver se recompensas simples funcionariam em um ambiente complexo.
Eles criaram um “curso de parkour virtual” com uma série de obstáculos e criaram uma recompensa para avançar o progresso.
Quanto mais rápido a inteligência artificial se movia através do terreno, maiores as recompensas.
Você pode ver, no vídeo abaixo, como os computadores do Google se saíram no teste:
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!