A versão final do Plano Brasileiro de Inteligência Artificial foi divulgada recentemente, quase um ano após seu esboço. O documento destaca a importância de criar modelos de linguagem em português e de cuidar dos dados nacionais para evitar dependências externas e preconceitos culturais. O plano busca desenvolver modelos de linguagem de grande escala em português, utilizando dados do Brasil, para que a inteligência artificial reflita a diversidade cultural do país. A curadoria de dados é fundamental e deve ser feita de forma ética, respeitando direitos autorais e filtrando conteúdos ofensivos. Especialistas, como linguistas, devem participar desse processo para garantir que os modelos sejam representativos da pluralidade linguística brasileira. O plano também alerta sobre os riscos de usar dados de outras línguas, que podem trazer preconceitos de diferentes culturas. Assim, a criação de uma inteligência artificial nacional depende de um compromisso com a curadoria de dados que reflita a realidade do Brasil.
A versão final do Plano Brasileiro de Inteligência Artificial (PBIA) foi divulgada na semana passada, quase um ano após seu esboço apresentado na 5ª Conferência Nacional de Ciência, Tecnologia e Inovação. O documento destaca a importância de desenvolver modelos de linguagem em português e a curadoria responsável de dados nacionais, visando reduzir dependências externas e preconceitos culturais.
Entre os objetivos do plano, está o desenvolvimento de modelos de linguagem de grande escala (LLM) para a inteligência artificial em português, utilizando dados nacionais. Essa abordagem busca garantir que a IA represente a diversidade cultural e linguística do Brasil. A curadoria de dados é um aspecto central, pois a qualidade dos modelos depende da seleção cuidadosa dos dados utilizados para seu treinamento.
A curadoria de dados deve ser responsável e ética, evitando a simples coleta indiscriminada de informações. O plano menciona a necessidade de criar e aprimorar bases de dados nacionais, respeitando direitos autorais e filtrando conteúdos ofensivos. Essa curadoria deve ser realizada por especialistas, como linguistas, que entendem a complexidade das línguas e suas variações.
Além disso, o PBIA reconhece os riscos associados ao uso de dados de outras línguas, que podem introduzir preconceitos de diferentes culturas nos modelos desenvolvidos para o Brasil. Pesquisas recentes mostram que modelos multilíngues podem propagar preconceitos relacionados a raça, gênero e outras características sociais. Portanto, a construção de uma IA nacional soberana requer um compromisso com a curadoria de dados que reflita a realidade brasileira.
O PBIA propõe que a criação de uma IA fundacional soberana esteja atrelada à curadoria de dados brasileiros, enfatizando a importância de incluir especialistas no processo. A participação de linguistas é crucial para garantir que os modelos de IA sejam representativos e inclusivos, refletindo a pluralidade linguística do Brasil.
Entre na conversa da comunidade