Cohere apresenta uma nova linha de modelos multilíngues abertos.

por Robson Caitano

Lançamento de Modelos Multilíngues pela Cohere

A empresa de inteligência artificial Cohere lançou uma nova família de modelos multilíngues durante o ongoing India AI Summit. Os modelos, denominados Tiny Aya, são de código aberto, o que significa que seu código subjacente está disponível publicamente para qualquer pessoa usar e modificar. Eles suportam mais de 70 idiomas e podem ser executados em dispositivos do dia a dia, como laptops, sem a necessidade de uma conexão à internet.

Detalhes dos Modelos e Suporte a Idiomas

O modelo, que foi apresentado pela divisão de pesquisa da empresa, chamada Cohere Labs, suporta idiomas da região sul-asiática, incluindo bengali, hindi, punjabi, urdu, gujarati, tâmil, telugo e marata.

O modelo base possui 3,35 bilhões de parâmetros, o que é uma medida de seu tamanho e complexidade. A Cohere também lançou o Tiny Aya-Global, uma versão ajustada para seguir melhor comandos dos usuários, a fim de atender a aplicativos que necessitam de suporte a uma variedade mais ampla de idiomas. Além disso, variantes regionais complementam a família: TinyAya-Earth para idiomas africanos, TinyAya-Fire para idiomas sul-asiáticos e TinyAya-Water para a região da Ásia-Pacífico, Ásia Ocidental e Europa.

Abordagem e Suporte de Linguagem dos Modelos

Em comunicado, a empresa afirmou que essa abordagem permite que cada modelo desenvolva um melhor entendimento linguístico e nuances culturais, criando sistemas que sejam mais naturais e confiáveis para as comunidades a que se destinam. Ao mesmo tempo, todos os modelos Tiny Aya mantêm uma cobertura multilíngue abrangente, tornando-os pontos de partida flexíveis para adaptações e pesquisas adicionais.

Capacidades Técnicas e Aplicações Offline

A Cohere destacou que esses modelos foram treinados em um único cluster de 64 GPUs H100, um tipo de chip de alta performance desenvolvido pela Nvidia, utilizando fontes de computação relativamente modestas. Eles são ideais para pesquisadores e desenvolvedores que estão construindo aplicativos para públicos que falam idiomas nativos. Os modelos têm a capacidade de rodar diretamente em dispositivos, permitindo que os desenvolvedores os utilizem para oferecer traduções offline. A empresa também observou que construiu seu software subjacente para otimizar o uso em dispositivos, exigindo menos poder computacional do que a maioria dos modelos comparáveis.

Aplicações em Países Diversos Linguisticamente

Em países com grande diversidade linguística, como a Índia, essa capacidade de operar sem conexão contínua à internet pode abrir um leque diversificado de aplicações e casos de uso, sem a necessidade de acesso constante à rede.

Disponibilidade e Compartilhamento

Os modelos estão disponíveis na plataforma HuggingFace, que é popular para compartilhamento e teste de modelos de inteligência artificial, além da Cohere Platform. Os desenvolvedores podem baixá-los no HuggingFace, Kaggle e Ollama para implementação local. A empresa também está liberando conjuntos de dados para treinamento e avaliação no HuggingFace e planeja divulgar um relatório técnico detalhando sua metodologia de treinamento.

Situação Financeira e Planos Futuros

O CEO da startup, Aidan Gomez, afirmou no ano passado que a empresa planeja se tornar pública em breve. De acordo com informações da CNBC, a Cohere encerrou o ano de 2025 com um desempenho positivo, registrando uma receita recorrente anual de 240 milhões de dólares, com um crescimento de 50% no trimestre ao longo do ano.

Artigos Relacionados

Deixe um Comentário