- Pesquisadores do MIT desenvolveram um método que usa um modelo fundação tabular como substituto na otimização bayesiana para problemas com centenas de variáveis.
- Em benchmarks de engenharia, a abordagem encontrou soluções ótimas entre dez e cem vezes mais rápidas que métodos amplamente usados.
- O modelo fundação tabular, pré-treinado em dados tabulares, identifica automaticamente as variáveis mais relevantes e foca a busca naquelas de maior impacto.
- O sistema não precisa ser retrainado a cada rodada, aumentando a eficiência, e tende a trazer ganhos maiores em problemas mais complexos, como desenvolvimento de materiais e descoberta de fármacos.
- A pesquisa será apresentada na International Conference on Learning Representations; os autores ressaltam o potencial de escalar métodos clássicos para alta dimensionalidade.
A pesquisa do MIT apresenta uma nova forma de resolver problemas de engenharia com alta dimensionalidade. O objetivo é acelerar projetos complexos, como redes elétricas ou desenho de veículos mais seguras, usando uma otimização Bayesian. O método usa uma variação de IA para identificar as variáveis mais relevantes.
A equipe combina uma base de modelos de dados tabulares com a otimização Bayesian. O modelo prevê impactos de diferentes escolhas de projeto sem precisar recomeçar do zero a cada rodada de teste. O objetivo é reduzir o tempo de busca por soluções eficientes.
Os testes mostraram que, em benchmarks realistas, as melhores soluções foram encontradas entre 10 e 100 vezes mais rápido que métodos convencionais. O estudo foi desenvolvido com dados de engenharia e aplicado a problemas como otimização de sistemas de energia.
Como funciona a abordagem
A técnica utiliza um modelo de base tabular para atuar como o surrogate (aproximação) no algoritmo de Bayesian optimization. O foco está em identificar quais dimensões influenciam mais o resultado, concentrando a busca nessas variáveis.
O sistema é descrito como um “ChatGPT para planilhas”: o modelo tabular já vem pré-treinado em grande volume de dados tabulares e pode ser usado sem retrain. A seleção de características prioriza parâmetros de alto impacto.
Ao direcionar a exploração para variáveis relevantes, a eficiência aumenta, sobretudo em problemas com centenas ou milhares de dimensões. Em testes, a abordagem superou rivais em tarefas de design de energia e testes de colisão veicular.
Resultados e próximos passos
Os pesquisadores compararam o método com cinco algoritmos de ponta em 60 problemas de referência. Em grande parte dos casos, a nova técnica alcançou soluções ótimas mais rapidamente, especialmente em problemas com maior dimensionalidade.
Os autores informam que nem todos os cenários se beneficiaram; em planejamento de rotas robóticas, o desempenho foi inferior, possivelmente devido a dados de treinamento. Futuras etapas incluem ampliar o conjunto de problemas e explorar aplicações com milhões de dimensões.
Entre na conversa da comunidade