- Modelos de inteligência artificial da Google e OpenAI não conseguiram vencer a Olimpíada Internacional de Matemática, realizada em Queensland, Austrália.
- Cinco jovens competidores obtiveram notas perfeitas, enquanto os modelos alcançaram pontuações de nível ouro, mas não a máxima.
- O chatbot Gemini, da Google, resolveu cinco dos seis problemas e obteve 35 pontos de um total de 42.
- O presidente da Olimpíada Internacional de Matemática, Gregor Dolinar, elogiou as soluções dos modelos, que foram consideradas claras e precisas.
- A competição levantou questões sobre a capacidade das IAs em resolver problemas complexos em comparação com a habilidade humana.
Os modelos de inteligência artificial (IA) de empresas como Google e OpenAI enfrentaram uma derrota na Olimpíada Internacional de Matemática (IMO), realizada em Queensland, Austrália. Apesar de alcançarem pontuações de nível ouro, nenhum modelo conseguiu a pontuação máxima, enquanto cinco jovens competidores obtiveram resultados perfeitos.
O Google anunciou que seu chatbot Gemini resolveu cinco dos seis problemas propostos, alcançando 35 pontos de um total de 42, garantindo uma medalha de ouro. O presidente da IMO, Gregor Dolinar, elogiou as soluções apresentadas, destacando que foram consideradas claras e precisas pelos avaliadores. A OpenAI também informou que seu modelo experimental atingiu a mesma pontuação, 35 pontos, em uma avaliação sob as mesmas condições que os humanos.
Desempenho dos Competidores
Na competição, quase 10% dos participantes humanos conquistaram medalhas de ouro, e a performance dos cinco jovens que obtiveram pontuação perfeita foi um destaque. Os organizadores da IMO não conseguiram verificar a quantidade de poder computacional utilizado pelos modelos de IA ou se houve intervenção humana nas respostas.
Os resultados da IMO deste ano levantam questões sobre a capacidade das IAs em resolver problemas complexos de matemática em comparação com a habilidade humana. Embora os modelos tenham mostrado avanços significativos, a supremacia humana permanece em algumas áreas, como evidenciado pelos resultados da competição.
Entre na conversa da comunidade