- Pesquisadores do MIT e da Symbotic desenvolveram um método híbrido que usa aprendizado por reforço profundo para priorizar robôs e manter o tráfego estável em armazéns.
- O sistema decide, em tempo real, quais robôs devem ter prioridade com base na congestão que está se formando, redirecionando-os para evitar gargalos, com um algoritmo de planejamento rápido para orientar os movimentos.
- Em simulações inspiradas em layouts reais, a abordagem atingiu cerca de 25% de aumento na vazão em comparação com métodos tradicionais e com busca aleatória.
- O modelo aprende com interações em simulações, adaptando-se a diferentes layouts de armazém e números de robôs, sem depender de previsões exatas do futuro.
- Futuramente, os pesquisadores pretendem incluir a atribuição de tarefas e ampliar a escala para armazéns maiores; o estudo foi publicado no Journal of Artificial Intelligence Research e é financiado pela Symbotic.
Dentro de um gigantesco armazém autônomo, centenas de robôs se movem entre corredores para atender pedidos. Pequenos congestionamentos podem provocar lentidão em cadeia, afetando o fluxo de itens.
Pesquisadores do MIT e a empresa Symbotic propõem um método que decide, a cada momento, qual robô tem prioridade. O objetivo é evitar gargalos e aumentar a vazão de pacotes.
O sistema aprende com congestões emergentes e prioriza robôs que estão prestes a ficar presos. Assim, pode redirecionar rotas com antecedência para manter o fluxo estável.
A abordagem híbrida combina aprendizado por reforço profundo com um algoritmo de planejamento rápido. Primeiro, o modelo decide a prioridade; depois, as instruções são enviadas aos robôs.
Metodologia híbrida
Em simulações inspiradas em layouts reais de depósitos, o método atingiu ganho de cerca de 25% na vazão em relação a métodos tradicionais.
O modelo neural observa o ambiente, aprende com feedback de simulações e adapta-se a armazéns com layouts diferentes, variando o número de robôs.
Ao decidir quem avança, o sistema antecipa interações entre robôs e evita conflitos futuros, reduzindo atrasos causados por colisões.
A segunda etapa utiliza um algoritmo de planejamento comprovado para orientar movimentos entre pontos, permitindo resposta rápida a mudanças.
Resultados e perspectivas
Em cenários simulados, a abordagem híbrida superou algoritmos tradicionais e busca por pacotes por robô, aumentando a eficiência de entrega.
Segundo os autores, a densidade alta de robôs eleva a complexidade, mas o método demonstra maior confiabilidade diante de gargalos que surgem.
Embora ainda longe da implementação real, os testes destacam a viabilidade de IA orientada para otimizar operações em armazéns de larga escala.
Equipe e financiamento
O estudo é liderado por Han Zheng, da LIDS do MIT, com participação de Yining Ma, Brandon Araki e Jingkai Chen da Symbotic, e Cathy Wu como orientadora sênior.
O artigo foi publicado no Journal of Artificial Intelligence Research. O financiamento veio da Symbotic.
Entre na conversa da comunidade