Um “chatGPT” público, suíço e aberto

Modelo de linguagem grande rima com ChatGPT para a maioria de nós. No entanto, existem mais de um milhão de modelos diferentes, de acordo com o site Hugging Face. Recentemente, foi anunciado que, no final do verão, um novo modelo totalmente suíço, público e gratuito, desenvolvido pelos Politécnicos Federais de Zurique, a ETH e Lausanne, a EPFL, será adicionado a esta longa lista. O que parece ser uma gota no oceano é, na verdade, um marco para todo o setor de inteligência artificial, pelo menos europeu, porque representa um baluarte de transparência e valores éticos.

Os sistemas atuais que todos nós usamos, geralmente desenvolvidos nos Estados Unidos ou na China, são frequentemente acusados de pouca abertura para o público e os especialistas. De fato, mesmo aqueles que têm as habilidades técnicas para entender o código por trás dos modelos de linguagem, muitas vezes não podem acessar os códigos que os compõem. Portanto, o fechamento impede que essas ferramentas sejam totalmente confiáveis, porque, por exemplo, não é possível verificar se suas respostas foram direcionadas artificialmente em uma direção específica, por exemplo, sobre questões políticas, nem é possível saber onde os dados do usuário fornecidos durante o uso foram param.

“Modelos totalmente de código aberto permitem o desenvolvimento de aplicativos altamente confiáveis e são fundamentais para o avanço da pesquisa sobre riscos e oportunidades de inteligência artificial. Processos transparentes também facilitam a conformidade com os regulamentos”, diz Imanol Schlag, pesquisador do ETH AI Center que lidera o projeto, juntamente com os professores do EPFL AI Center Antoine Bosselut e Martin Jaggi. “Ao contrário dos modelos de negócios desenvolvidos à porta fechada, esperamos que nossa abordagem totalmente aberta possa estimular a inovação na Suíça, em toda a Europa e por meio de colaborações internacionais. Além disso, é um elemento fundamental para atrair e valorizar os melhores talentos”, acrescenta Martin Jaggi.

O grande modelo de linguagem suíço será capaz de se comunicar fluentemente em mais de 1.000 idiomas diferentes, em comparação com cerca de 7.000 idiomas no mundo. O sistema foi treinado em uma extensa biblioteca composta por 60% de documentos em inglês e 40% em outros 1.500, além de códigos de programação e fórmulas matemáticas. Os dados técnicos já permitem que os pesquisadores estimem que o sistema estará entre os mais poderosos modelos totalmente abertos disponíveis.

O projeto, que está atualmente na fase final dos testes e ainda não tem um nome oficial, respira o ar da Suíça Italiana, porque os longos processos de treinamento de inteligência artificial foram realizados nos últimos meses em Lugano no Centro Suíço de Computação Científica. Aqui, na infraestrutura de computador chamada Alps, os computadores leram grandes quantidades de dados, basicamente principalmente textos e códigos de computador, para aprender a responder a perguntas, traduzir de um idioma para outro e conversar com o usuário. O modelo de linguagem também foi com atenção ao clima, já que o Centro Suíço de Computação Científica é alimentado por emissões neutras de dióxido de carbono.

“O treinamento deste modelo só é possível graças ao nosso investimento estratégico em Alps, um supercomputador projetado especificamente para inteligência artificial”, diz Thomas Schulthess, diretor do CSCS e professor da Universidade de Zurique, que continua – nossa colaboração de longa data com a NVIDIA e a HPE (duas empresas americanas de componentes de computador, ndr) é um exemplo concreto de como o trabalho conjunto entre instituições públicas de pesquisa e líderes do setor pode fortalecer a infraestrutura soberana, promovendo a inovação aberta, não apenas para a Suíça, mas para a ciência e a sociedade em nível global”.

Resta então o teste de campo para permitir que os usuários vejam se esse modelo é realmente capaz de se comparar com as soluções de grandes empresas. Certamente, no entanto, sua confiabilidade e transparência serão ingredientes fundamentais para permitir que outros cientistas construam soluções inovadoras para projetos de todos os tipos, como Antoine Bossolut conclui: “Como pesquisadores de instituições públicas, nosso objetivo é promover modelos de código aberto e permitir que as organizações desenvolvam suas próprias aplicações neles”.

( fontes: RSI )