{"id":756708,"date":"2026-06-16T21:00:00","date_gmt":"2026-06-17T00:00:00","guid":{"rendered":"https:\/\/staging.portaltela.com\/noticias\/2026\/06\/16\/na-teoria-dos-jogos-generalistas-as-vezes-vencem-sobre-especialistas\/"},"modified":"2026-06-16T21:00:00","modified_gmt":"2026-06-17T00:00:00","slug":"na-teoria-dos-jogos-generalistas-as-vezes-vencem-sobre-especialistas","status":"publish","type":"post","link":"https:\/\/staging.portaltela.com\/cotidiano\/tecnologia\/2026\/06\/16\/na-teoria-dos-jogos-generalistas-as-vezes-vencem-sobre-especialistas\/","title":{"rendered":"Na teoria dos jogos, generalistas \u00e0s vezes vencem sobre especialistas"},"content":{"rendered":"<p>Em um estudo apresentado em abril no Rio de Janeiro, pesquisadores do MIT mostraram que algoritmos de aprendizado de m\u00e1quina podem superar abordagens tradicionais em jogos de informa\u00e7\u00f5es incompletas, com pares de oponentes em competi\u00e7\u00e3o zero-sum. A pesquisa foca em treinar redes neurais para lidar com cen\u00e1rios onde pouco se sabe sobre o advers\u00e1rio.<\/p>\n<p>A equipe envolveu Sobhan Mohammadpour e Gabriele Farina, ambos do MIT, al\u00e9m de colaboradores de UT Austin, UC Berkeley, CMU e NYU. O trabalho questiona a superioridade de algoritmos de teoria de jogos em favor de m\u00e9todos de pol\u00edtica gradiente em ambientes com m\u00faltiplos agentes.<\/p>\n<p>O estudo tamb\u00e9m prop\u00f5e um benchmark para avaliar diferentes algoritmos, em vez de apresentar uma nova t\u00e9cnica que supere as demais. A meta \u00e9 oferecer um ambiente de teste padronizado para medir desempenho de redes neurais em tarefas com informa\u00e7\u00f5es ocultas.<\/p>\n<h3>O que foi estudado<\/h3>\n<p>Cinco jogos com informa\u00e7\u00f5es imperfeitas foram usados para os experimentos: duas vers\u00f5es de Phantom Tic-Tac-Toe, duas variantes de Hex e Liar\u2019s Dice. Os pesquisadores enfrentaram grandes desafios para medir o explorability em cen\u00e1rios com at\u00e9 bilh\u00f5es de estados poss\u00edveis.<\/p>\n<p>A an\u00e1lise com redes treinadas via pol\u00edticas gradiente mostrou explotabilidade menor (desempenho melhor) que redes treinadas com algoritmos baseados em teoria de jogos. Em confrontos diretos, as redes com pol\u00edticas gradientes tamb\u00e9m se destacaram.<\/p>\n<h3>Implica\u00e7\u00f5es e uso<\/h3>\n<p>Os autores destacam que a abordagem de benchmark pode ser aplicada a diversas intera\u00e7\u00f5es estrat\u00e9gicas com m\u00faltiplos agentes, n\u00e3o apenas jogos reais. A ferramenta est\u00e1 dispon\u00edvel de forma aberta para uso em computadores comuns, com uma integra\u00e7\u00e3o simples ao OpenSpiel.<\/p>\n<p>Especialistas externos veem otimismo nos resultados, que sugerem modernizar ferramentas cl\u00e1ssicas de resolu\u00e7\u00e3o de problemas estrat\u00e9gicos. A pesquisa refor\u00e7a a import\u00e2ncia de avalia\u00e7\u00e3o rigorosa de algoritmos em ambientes com informa\u00e7\u00f5es parciais.<\/p>\n<p>Fontes: estudo do MIT, apresentado em confer\u00eancia internacional, com colabora\u00e7\u00e3o de universidades e institutos de pesquisa.<\/p>\n","protected":false},"excerpt":{"rendered":"<ul>\n<li>Pesquisadores mostram que, em jogos com informa\u00e7\u00e3o imperfeita, redes neurais treinadas com m\u00e9todos de policy gradient superam algoritmos tradicionais baseados em teoria dos jogos em v\u00e1rias configura\u00e7\u00f5es de dois jogadores zero-sum.<\/li>\n<li>O estudo prop\u00f5e um benchmark para avaliar diferentes algoritmos no treinamento de agentes em jogos com informa\u00e7\u00e3o oculta, em vez de apresentar uma nova estrat\u00e9gia vencedora.<\/li>\n<li>Em cinco jogos testados, incluindo variantes de Tic-Tac-Toe e Hex com informa\u00e7\u00e3o imperfeita, as redes treinadas por policy gradient tiveram menor exploitability e venceram nas disputas diretas.<\/li>\n<li>Exploitability mede o desempenho contra um advers\u00e1rio que conhece o comportamento do jogador em qualquer m\u00e3o poss\u00edvel; zero indica jogo perfeito.<\/li>\n<li>O software de benchmarking \u00e9 disponibilizado gratuitamente e pode ser executado em um laptop comum, bastando adicionar uma linha de c\u00f3digo ao conjunto OpenSpiel.<\/li>\n<\/ul>\n","protected":false},"author":15,"featured_media":756716,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1442,16],"tags":[4816,5664,1538,2088,189],"class_list":["post-756708","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia","category-tecnologia","tag-a-ciencia","tag-a-inteligencia-artificial","tag-informacao","tag-pesquisas","tag-tecnologia"],"_links":{"self":[{"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/posts\/756708","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/users\/15"}],"replies":[{"embeddable":true,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/comments?post=756708"}],"version-history":[{"count":0,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/posts\/756708\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/media\/756716"}],"wp:attachment":[{"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/media?parent=756708"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/categories?post=756708"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/staging.portaltela.com\/api\/wp\/v2\/tags?post=756708"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}