EXCLUSIVO: Luma apresenta agentes de IA criativa impulsionados por seus novos modelos de ‘Inteligência Unificada’

Lançamento dos Luma Agents pela Startup Luma

A startup de geração de vídeo por inteligência artificial Luma, na última quinta-feira, lançou os Luma Agents, que foram projetados para lidar com todo o trabalho criativo, abrangendo texto, imagem, vídeo e áudio. Os Luma Agents são impulsionados pela família de modelos Unified Intelligence da startup, que possui uma arquitetura treinada em um único sistema de raciocínio multimodal.

Objetivo dos Luma Agents

Os Luma Agents estão sendo apresentados como uma nova abordagem para as agências de publicidade, equipes de marketing, estúdios de design e empresas em geral. A Luma afirma que seus agentes têm a capacidade de planejar e gerar texto, imagens, vídeos e áudios, realizando coordenação com outros modelos de inteligência artificial, incluindo o Ray 3.14 da Luma, o Veo 3 e o Nano Banana Pro do Google, o Seedream da ByteDance e os modelos de voz da ElevenLabs.

Modelo Base: Uni-1

Os agentes da Luma são construídos com base no modelo Uni-1, que é o primeiro da família de modelos de inteligência artificial Unified Intelligence. Segundo Amit Jain, CEO e cofundador da Luma, esse modelo foi treinado em áudio, vídeo, imagem, linguagem e raciocínio espacial.

Jain afirmou à TechCrunch que o modelo Uni-1 pode “pensar em linguagem e imaginar e renderizar em pixels ou imagens… chamamos isso de ‘inteligência em pixels’.” Outras capacidades de saída, como áudio e vídeo, estão previstas para serem disponibilizadas em versões futuras do modelo, acrescentou.

“Nossos clientes não estão apenas comprando uma ferramenta; eles estão reformulando a maneira como os negócios são conduzidos,” ressaltou Jain.

Implementação com Clientes Existentes

A Luma já começou a implementar sua nova plataforma com os clientes existentes, incluindo as agências de publicidade globais Publicis Groupe e Serviceplan, além de marcas como Adidas, Mazda e a empresa saudita de inteligência artificial Humain.

Jain explicou que os Luma Agents representam uma mudança significativa porque conseguem manter um contexto persistente entre ativos, colaboradores e iterações criativas. Além disso, eles podem avaliar e refinar os resultados, aprimorando suas próprias saídas por meio de uma autocrítica iterativa, conforme mencionado por Jain.

Capacidades de Avaliação e Iteração

Essa capacidade de verificar e corrigir o trabalho é o que torna os agentes de codificação tão úteis, segundo Jain. “Você precisa dessa habilidade de avaliar seu trabalho, corrigir o que for necessário, e repetir esse ciclo até que a solução esteja boa e precisa.”

Jain comentou que o fluxo de trabalho atual para o uso de ferramentas de inteligência artificial em ambientes criativos não apresenta a mesma aceleração de benefícios que as pessoas do setor criativo esperam da IA. Em vez de um processo eficiente, a situação tem sido mais próxima de: “Aqui estão 100 modelos. Aprenda a como interagir com eles,” explicou.

O que diferencia os Luma Agents, segundo Jain, é que não é necessário interagir repetidamente para cada iteração de uma imagem ou ideia. O sistema, ao invés disso, gera grandes conjuntos de variações, permitindo que os usuários direcionem o processo por meio de conversas.

Princípio do Unified Intelligence

“Com a Unified Intelligence, porque esses modelos entendem, além de serem capazes de gerar, conseguimos construir um sistema que realiza esse tipo de trabalho do início ao fim,” disse Jain.

Para ilustrar, ele citou o exemplo de um arquiteto humano projetando um edifício. À medida que traçam as linhas, estão criando uma representação mental interna da estrutura, da luz, da dinâmica espacial e da experiência vivencial. Jain acredita que esse é o mesmo princípio sobre o qual a Unified Intelligence está baseada.

Aceleração de Fluxos de Trabalho Criativos

Jain afirmou que o sistema tem potencial para acelerar significativamente os fluxos de trabalho criativos. Durante uma demonstração, ele mostrou como um resumo de 200 palavras e uma imagem de um produto (um tubo de batom) levaram o sistema a gerar diversas ideias para locais, modelos e esquemas de cores para uma campanha publicitária.

Em outro exemplo, os Luma Agents transformaram uma campanha publicitária de um ano, no valor de 15 milhões de dólares, em múltiplos anúncios localizados para diferentes países em apenas 40 horas, gastando menos de 20 mil dólares, e cumprindo os controles de qualidade e verificação de precisão internos da marca, conforme relatou Jain.

Acesso Público e Disponibilidade

Os Luma Agents estão agora disponíveis publicamente por meio de API, mas Jain comentou que a startup planeja liberar o acesso gradualmente, a fim de garantir que os usuários mantenham um acesso confiável e evitem interrupções em seus fluxos de trabalho.

Related posts

Match Group COO deixa a empresa, enquanto apps de namoro enfrentam dificuldades para se conectar com a Geração Z.

Qual desses dois arcades é o “maior do mundo”—e isso realmente importa?

Trabalhadores relatam ter visto gravações da Ray-Ban Meta mostrando pessoas usando o banheiro.