TwinMind: A Inovação em Inteligência Artificial para o Cotidiano
Introdução ao Conceito
Três ex-cientistas do Google X têm o objetivo de fornecer uma "segunda mente" de forma virtual, não no sentido de ficção científica ou com implantes cerebrais, mas através de um aplicativo otimizado por inteligência artificial. Este aplicativo, denominado TwinMind, é capaz de compreender o contexto ao ouvir tudo o que o usuário diz em segundo plano. A startup conseguiu arrecadar US$ 5,7 milhões em uma rodada inicial de investimentos e lançou versões para Android e iPhone, além de um novo modelo de fala em inteligência artificial.
A Estrutura da Startup
Co-fundada em março de 2024 por Daniel George (CEO) e seus colegas do Google X, Sunny Tang e Mahi Karim (ambos CTOs), o TwinMind funciona em segundo plano, capturando fala ambiente (com permissão do usuário) para criar um gráfico de conhecimento pessoal.
Funcionalidades do Aplicativo
O aplicativo transforma pensamentos falados, reuniões, palestras e diálogos em uma memória estruturada. Assim, ele é capaz de gerar anotações, listas de tarefas e respostas otimizadas, suportando ainda trabalho offline. A tecnologia processa áudio em tempo real para transcrição no próprio dispositivo, conseguindo captar esse áudio continuamente por 16 a 17 horas sem consumir a bateria. Além disso, o aplicativo permite o backup dos dados do usuário, permitindo a recuperação de conversas em caso de perda do dispositivo; o opt-out dessa funcionalidade também é possível. O TwinMind oferece suporte a tradução em tempo real em mais de 100 idiomas.
Diferenciação no Mercado
O TwinMind se diferencia de outros aplicativos de anotação de reuniões, como Otter, Granola e Fireflies, por capturar áudio de forma passiva ao longo do dia. Para possibilitar isso, a equipe desenvolveu um serviço em puro Swift, que opera nativamente no iPhone. Em contrapartida, muitos concorrentes utilizam React Native e dependem de processamento em nuvem, algo que a Apple restringe para execução em segundo plano por longos períodos, conforme afirmou George em uma entrevista exclusiva.
A Gênese da Ideia
George deixou o Google X em 2020 e teve a ideia do TwinMind em 2023, enquanto trabalhava no JPMorgan como Vice-Presidente e Líder de IA Aplicada, participando de reuniões consecutivas diariamente. Para otimizar seu tempo, ele desenvolveu um script que capturava áudio, transcrevia no iPad e alimentava o ChatGPT, que começou a entender seus projetos e até gerar código utilizável. Impressionado com os resultados, compartilhou a ideia com amigos e postou sobre isso em um fórum de discussão. No entanto, as pessoas demonstraram interesse, mas não desejavam ter algo rodando em seus laptops de trabalho. Isso o levou a criar um aplicativo que poderia funcionar em um telefone pessoal, ouvindo silenciosamente durante as reuniões para coletar informações úteis.
Integração com o Navegador
Além do aplicativo móvel, o TwinMind disponibiliza uma extensão para Chrome, que coleta informações contextuais adicionais através da atividade no navegador. Utilizando inteligência artificial visual, a extensão pode escanear visualmente as abas abertas e interpretar conteúdos de diversas plataformas, incluindo e-mail, Slack e Notion.
Uso da Extensão
A startup utilizou essa extensão para selecionar estagiários a partir de mais de 850 candidaturas recebidas no verão passado. George relatou que abriram todos os perfis do LinkedIn e currículos dos 854 candidatos em abas do navegador e solicitaram à extensão do Chrome que classificasse os melhores candidatos, o que foi realizado com sucesso, resultando na contratação dos quatro estagiários finais.
A Base de Usuários
Atualmente, a startup conta com mais de 30.000 usuários, dos quais aproximadamente 15.000 são ativos mensalmente. George afirmou que cerca de 20% a 30% dos usuários do TwinMind também utilizam a extensão do Chrome. Embora os Estados Unidos representem a maior base de usuários, a startup também está vendo um interesse crescente na Índia, Brasil, Filipinas, Etiópia, Quênia e Europa.
Demografia dos Usuários
O TwinMind visa um público geral, embora cerca de 50% a 60% de seus usuários sejam profissionais. Aproximadamente 25% são estudantes, e os restantes 20% a 25% utilizam a plataforma para fins pessoais. George mencionou que seu pai faz parte dos usuários que utilizam o TwinMind para escrever sua autobiografia.
Política de Privacidade
Um dos principais desafios da inteligência artificial é a possibilidade de comprometer a privacidade do usuário. Contudo, George afirmou que o TwinMind não treina seus modelos com dados de usuários e é projetado para funcionar sem enviar gravações para a nuvem. Diferentemente de muitos outros aplicativos de anotação com IA, o TwinMind não permite que os usuários acessem gravações de áudio posteriormente, já que os áudios são excluídos em tempo real, enquanto apenas o texto transcrito é armazenado localmente no aplicativo.
A Experiência no Google X
Os co-fundadores do TwinMind trabalharam por alguns anos em diversos projetos no Google X. George revelou que trabalhou em seis projetos isoladamente, incluindo o iyO, a equipe por trás dos fones de ouvido otimizados com inteligência artificial, que recentemente geraram notícias ao processar ações judiciais contra a OpenAI e Jony Ive. Essa experiência permitiu que a equipe do TwinMind avançasse rapidamente do conceito ao produto.
Preparação para Empreender
George destacou que o Google X foi um ambiente ideal para se preparar para iniciar uma própria empresa. “São cerca de 30 a 40 projetos semelhantes a startups ocorrendo ao mesmo tempo. Ninguém mais tem a chance de trabalhar em seis startups em estágio inicial ao longo de dois ou três anos antes de lançar a sua própria — pelo menos em um período tão curto”, disse ele.
Formação Acadêmica de George
Antes de ingressar no Google, George aplicou aprendizado profundo à astrofísica de ondas gravitacionais como parte do grupo LIGO, que recebeu o Prêmio Nobel, no Centro Nacional de Supercomputação da Universidade de Illinois. Ele completou seu doutorado em inteligência artificial para astrofísica em apenas um ano — aos 24 anos — um feito que o levou a se juntar ao laboratório de pesquisa de Stephen Wolfram em 2017 como pesquisador em aprendizado profundo e inteligência artificial.
Investimento Inicial
Essa conexão inicial com Wolfram teve um desdobramento anos depois, quando ele se tornou o primeiro investidor do TwinMind, marcando sua primeira contribuição financeira em uma startup. A recente rodada de investimento semeada foi liderada pela Streamlined Ventures, com participação da Sequoia Capital e outros investidores, incluindo Wolfram. Esta rodada valoriza o TwinMind em US$ 60 milhões pós-investimento.
Modelo Ear-3 do TwinMind
Além de seus aplicativos e extensões de navegador, a TwinMind lançou o modelo Ear-3, um sucessor do Ear-2 que suporta mais de 140 idiomas globalmente. A startup informou que o novo modelo apresenta uma taxa de erro de palavras de 5,26% e pode reconhecer diferentes falantes durante uma conversa, apresentando uma taxa de erro de diarização de falantes de 3,8%.
Treinamento do Modelo
O novo modelo de inteligência artificial é uma combinação aprimorada de vários modelos de código aberto, treinados em um conjunto curado de dados da internet, incluindo podcasts, vídeos e filmes. George destacou que, quanto mais idiomas o modelo suporta, melhor ele se torna na compreensão de sotaques e dialetos regionais, pois é treinado em uma gama mais ampla de falantes.
Disponibilidade e Preço
O modelo terá um custo de US$ 0,23/hora e estará disponível por meio de uma API para desenvolvedores e empresas nas próximas semanas.
Especificações de Conectividade
Diferentemente do Ear-2, o Ear-3 não suporta uma experiência completamente offline, pois é maior e opera na nuvem. No entanto, o aplicativo muda automaticamente para o Ear-2 se a conexão com a internet for perdida e retorna ao Ear-3 quando a conexão é restabelecida, conforme explicado por George.
Novas Ofertas de Assinatura
Com o lançamento do Ear-3, o TwinMind agora oferece uma assinatura Pro por US$ 15/mês, que inclui um maior espaço de contexto de até 2 milhões de tokens e suporte por e-mail em um período de 24 horas. No entanto, ainda existe uma versão gratuita que oferece todas as funcionalidades atuais, incluindo horas ilimitadas de transcrição e reconhecimento de fala em dispositivo.
Expansão da Equipe
Atualmente, a startup conta com uma equipe de 11 membros e planeja contratar designers para aprimorar a experiência do usuário e montar uma equipe de desenvolvimento de negócios para comercializar sua API. Além disso, há planos de investir em estratégias para adquirir novos usuários.
