Sistema de IA aprende a manter fluxo de tráfego de robôs em armazém

Pesquisadores do MIT e da Symbotic desenvolveram um método híbrido que usa aprendizado por reforço profundo para priorizar robôs e manter o tráfego estável em armazéns.
O sistema decide, em tempo real, quais robôs devem ter prioridade com base na congestão que está se formando, redirecionando-os para evitar gargalos, com um algoritmo de planejamento rápido para orientar os movimentos.
Em simulações inspiradas em layouts reais, a abordagem atingiu cerca de 25% de aumento na vazão em comparação com métodos tradicionais e com busca aleatória.
O modelo aprende com interações em simulações, adaptando-se a diferentes layouts de armazém e números de robôs, sem depender de previsões exatas do futuro.
Futuramente, os pesquisadores pretendem incluir a atribuição de tarefas e ampliar a escala para armazéns maiores; o estudo foi publicado no Journal of Artificial Intelligence Research e é financiado pela Symbotic.

Dentro de um gigantesco armazém autônomo, centenas de robôs se movem entre corredores para atender pedidos. Pequenos congestionamentos podem provocar lentidão em cadeia, afetando o fluxo de itens.

Pesquisadores do MIT e a empresa Symbotic propõem um método que decide, a cada momento, qual robô tem prioridade. O objetivo é evitar gargalos e aumentar a vazão de pacotes.

O sistema aprende com congestões emergentes e prioriza robôs que estão prestes a ficar presos. Assim, pode redirecionar rotas com antecedência para manter o fluxo estável.

A abordagem híbrida combina aprendizado por reforço profundo com um algoritmo de planejamento rápido. Primeiro, o modelo decide a prioridade; depois, as instruções são enviadas aos robôs.

Metodologia híbrida

Em simulações inspiradas em layouts reais de depósitos, o método atingiu ganho de cerca de 25% na vazão em relação a métodos tradicionais.

O modelo neural observa o ambiente, aprende com feedback de simulações e adapta-se a armazéns com layouts diferentes, variando o número de robôs.

Ao decidir quem avança, o sistema antecipa interações entre robôs e evita conflitos futuros, reduzindo atrasos causados por colisões.

A segunda etapa utiliza um algoritmo de planejamento comprovado para orientar movimentos entre pontos, permitindo resposta rápida a mudanças.

Resultados e perspectivas

Em cenários simulados, a abordagem híbrida superou algoritmos tradicionais e busca por pacotes por robô, aumentando a eficiência de entrega.

Segundo os autores, a densidade alta de robôs eleva a complexidade, mas o método demonstra maior confiabilidade diante de gargalos que surgem.

Embora ainda longe da implementação real, os testes destacam a viabilidade de IA orientada para otimizar operações em armazéns de larga escala.

Equipe e financiamento

O estudo é liderado por Han Zheng, da LIDS do MIT, com participação de Yining Ma, Brandon Araki e Jingkai Chen da Symbotic, e Cathy Wu como orientadora sênior.

O artigo foi publicado no Journal of Artificial Intelligence Research. O financiamento veio da Symbotic.