Esta startup de armazenamento de dados distribuídos quer desafiar as grandes empresas de nuvem.

por Robson Caitano

Crescimento da Demanda por Computação e Armazenamento

A explosão das empresas de Inteligência Artificial (IA) tem elevado a demanda por capacidade computacional a níveis extremos. Empresas como CoreWeave, Together AI e Lambda Labs estão aproveitando essa demanda, atraindo significativas quantias de atenção e capital pela sua responsabilidade em oferecer capacidade de computação distribuída.

Dependência dos Grandes Fornecedores de Nuvem

No entanto, a maioria das empresas ainda armazena dados com os três principais provedores de nuvem: AWS, Google Cloud e Microsoft Azure. Esses sistemas de armazenamento foram desenvolvidos para manter dados próximos a seus próprios recursos de computação, e não para distribuí-los por múltiplas nuvens ou regiões.

Declaração de Ovais Tariq

“Os workloads modernos de IA e a infraestrutura de IA estão optando por computação distribuída em vez de grandes nuvens”, afirmou Ovais Tariq, cofundador e CEO da Tigris Data, em entrevista ao TechCrunch. “Queremos fornecer a mesma opção para armazenamento, porque sem armazenamento, a computação não tem valor.”

A Proposta da Tigris Data

A Tigris, criada pela equipe que desenvolveu a plataforma de armazenamento da Uber, está construindo uma rede de centros de armazenamento de dados localizados. A empresa alega que essas instalações podem atender às necessidades de computação distribuída dos workloads modernos de IA. A plataforma de armazenamento nativa em IA da startup “acompanha a sua computação, [permite que] os dados [se] reproduzam automaticamente onde estão as GPUs, suporta bilhões de pequenos arquivos e oferece acesso de baixa latência para treinamento, inferência e workloads agentes,” explicou Tariq.

Capitalização e Competição

Recentemente, a Tigris levantou um aporte de US$ 25 milhões em uma rodada de Série A que foi liderada pela Spark Capital e teve a participação de investidores já existentes, incluindo a Andreessen Horowitz, conforme apuração exclusiva do TechCrunch. A startup concorre com os grandes players do setor, a quem Tariq se refere como “Big Cloud”.

Críticas aos Provedores de Nuvem

De acordo com Tariq, esses provedores estabelecidos não apenas oferecem serviços de armazenamento de dados mais caros, mas também menos eficientes. Historicamente, a AWS, Google Cloud e Microsoft Azure impuseram taxas de egressos (conhecidas como “imposto da nuvem” na indústria) se um cliente desejar migrar para outro provedor de nuvem ou transferir seus dados para usar, por exemplo, uma GPU mais barata ou realizar treinamento de modelos em diferentes partes do mundo simultaneamente. Essa prática pode ser comparada a ter que pagar uma taxa adicional em uma academia ao decidir não frequentá-la mais.

Custos para a Fal.ai

Conforme relatado por Batuhan Taskaya, chefe de engenharia da Fal.ai, um dos clientes da Tigris, esses custos representavam uma parte significativa dos gastos em nuvem da empresa.

Desafios da Latência

Além das taxas de egressos, Tariq mencionou que persiste o problema da latência com os provedores de nuvem de grande porte. “As taxas de egressos eram apenas um sintoma de um problema mais profundo: armazenamento centralizado que não consegue acompanhar o ecossistema de IA descentralizado e de alta velocidade,” disse.

Clientes e Necessidades de Baixa Latência

A maioria dos mais de 4 mil clientes da Tigris, como a Fal.ai, compreende startups de IA generativa que desenvolvem modelos de imagem, vídeo e voz, os quais geralmente possuem conjuntos de dados grandes e sensíveis a latência. “Imagine conversar com um agente de IA que está processando áudio localmente,” explicou Tariq. “Você deseja a menor latência. Quer que sua computação esteja local, perto, e que seu armazenamento também esteja local.”

Limitações das Grandes Nuvens

Tariq também acrescentou que as grandes nuvens não são otimizadas para workloads de IA. A transmissão de conjuntos de dados massivos para treinamento ou a execução de inferências em tempo real através de múltiplas regiões pode resultar em gargalos de latência, prejudicando o desempenho dos modelos. No entanto, o acesso a armazenamento localizado significa que os dados são recuperados de forma mais rápida, permitindo que os desenvolvedores executem workloads de IA de maneira confiável e econômica utilizando nuvens descentralizadas.

A Opinião de Taskaya

“Tigris nos permite escalar nossos workloads em qualquer nuvem, fornecendo acesso ao mesmo sistema de arquivos de dados de todos esses locais sem cobrança de egressos,” afirmou Taskaya, da Fal.

Necessidade de Armazenamento Localizado

Existem outras razões pelas quais as empresas desejam ter dados mais próximos de suas opções de nuvem distribuídas. Por exemplo, em campos altamente regulamentados, como finanças e saúde, um grande obstáculo à adoção de ferramentas de IA é a necessidade de garantir a segurança dos dados.

A Importância dos Dados

Outro ponto destacado por Tariq é que as empresas estão cada vez mais interessadas em possuir seus próprios dados. Ele mencionou como a Salesforce, no início deste ano, impediu seus concorrentes em IA de utilizarem dados do Slack. “As empresas estão se tornando mais e mais cientes de como os dados são importantes, como eles alimentam os LLMs e a IA,” afirmou Tariq. “Elas querem estar mais no controle. Não desejam que outra parte tenha controle sobre isso.”

Futuras Expansões da Tigris

Com os novos recursos financeiros, a Tigris pretende continuar construindo seus centros de armazenamento de dados para atender à demanda crescente. Tariq relatou que a startup cresceu oito vezes a cada ano desde sua fundação em novembro de 2021. Atualmente, a Tigris possui três centros de dados localizados em Virginia, Chicago e San Jose, e planeja expandir ainda mais nos Estados Unidos e também na Europa e Ásia, especificamente em Londres, Frankfurt e Cingapura.

Artigos Relacionados

Deixe um Comentário