Generative AI: Etched Revoluciona com Chip Sohu para Transformers

Generative AI: Etched Revoluciona com Chip Sohu para Transformers

Generative AI está transformando diversas indústrias, e as empresas que produzem chips para executar esses modelos estão colhendo os frutos. A Nvidia, em particular, domina o mercado de chips de IA, com uma participação estimada entre 70% e 95%. Provedores de nuvem como Meta e Microsoft estão investindo bilhões de dólares em GPUs da Nvidia, temendo ficar para trás na corrida da IA generativa.

O Desafio dos Fabricantes de Chips

Os fornecedores de IA generativa não estão satisfeitos com o status quo por razões compreensíveis. Uma grande parte do seu sucesso depende dos caprichos dos fabricantes de chips dominantes. Assim, eles, juntamente com investidores de capital de risco oportunistas, estão em busca de startups promissoras para desafiar os incumbentes dos chips de IA.

Etched está entre as muitas empresas alternativas de chips que disputam um lugar à mesa — mas também é uma das mais intrigantes. Com apenas dois anos de existência, a Etched foi fundada por dois ex-alunos de Harvard, Gavin Uberti (ex-OctoML e ex-Xnor.ai) e Chris Zhu, que, juntamente com Robert Wachen e o ex-CTO da Cypress Semiconductor, Mark Ross, buscaram criar um chip que pudesse fazer uma coisa: rodar modelos de IA.

Isso não é incomum. Muitas startups e gigantes da tecnologia têm — ou estão — desenvolvendo chips que rodam exclusivamente modelos de IA, também conhecidos como chips de inferência. A Meta tem o MTIA, a Amazon tem o Graviton e o Inferentia, e assim por diante. Mas os chips da Etched são únicos porque rodam apenas um tipo de modelo: transformers.

Transformers: O Modelo Dominante

O transformer, proposto por uma equipe de pesquisadores do Google em 2017, tornou-se de longe a arquitetura de modelo de IA generativa dominante. Transformers sustentam o modelo de geração de vídeo Sora da OpenAI. Eles estão no coração de modelos de geração de texto como o Claude da Anthropic e o Gemini do Google. E eles alimentam geradores de arte, como a versão mais recente do Stable Diffusion.

“Em 2022, fizemos uma aposta de que os transformers dominariam o mundo,” disse Uberti, CEO da Etched, em uma entrevista ao TechCrunch. “Chegamos a um ponto na evolução da IA em que chips especializados que podem ter um desempenho melhor do que GPUs de propósito geral são inevitáveis — e os tomadores de decisão técnicos do mundo sabem disso.”

O chip da Etched, chamado Sohu, é um ASIC (circuito integrado específico para aplicação) — um chip adaptado para uma aplicação particular, neste caso, rodar transformers. Fabricado usando o processo de 4nm da TSMC, o Sohu pode oferecer um desempenho de inferência dramaticamente melhor do que GPUs e outros chips de IA de propósito geral, consumindo menos energia, afirma Uberti.

Vantagens do Chip Sohu

O Sohu é uma ordem de magnitude mais rápido e mais barato do que até mesmo a próxima geração de GPUs Blackwell GB200 da Nvidia ao rodar transformers de texto, imagem e vídeo, disse Uberti. “Um servidor Sohu substitui 160 GPUs H100… Sohu será uma opção mais acessível, eficiente e ecologicamente correta para líderes empresariais que precisam de chips especializados.”

Como o Sohu consegue tudo isso? De algumas maneiras, mas a mais óbvia — e intuitiva — é uma pipeline de hardware e software de inferência simplificada. Como o Sohu não roda modelos não-transformers, a equipe da Etched pôde eliminar componentes de hardware não relevantes para transformers enquanto reduzia a sobrecarga de software tradicionalmente usada para implantar e rodar não-transformers.

Etched está chegando ao mercado em um ponto de inflexão na corrida pela infraestrutura de IA generativa. Além das preocupações com custos, as GPUs e outros componentes de hardware necessários para rodar modelos em escala hoje são perigosamente famintos por energia.

Impacto Ambiental e Econômico

O Goldman Sachs prevê que a IA está prestes a impulsionar um aumento de 160% na demanda de eletricidade dos data centers até 2030, contribuindo para um aumento significativo nas emissões de gases de efeito estufa. Pesquisadores da UC Riverside, por sua vez, estimam que o uso global de IA pode fazer com que os data centers consumam entre 1,1 trilhão e 1,7 trilhão de galões de água doce até 2027, impactando os recursos locais. (Muitos data centers usam água para resfriar servidores.)

Uberti otimisticamente — ou bombasticamente, dependendo de como você interpreta — apresenta o Sohu como a solução para o problema de consumo da indústria. “Em resumo, nossos futuros clientes não poderão se dar ao luxo de não mudar para o Sohu,” disse Uberti. “As empresas estão dispostas a apostar na Etched porque velocidade e custo são existenciais para os produtos de IA que estão tentando construir.”

Mas a Etched — assumindo que a empresa atinja seu objetivo de levar o Sohu ao mercado de massa nos próximos meses — pode ter sucesso quando tantos outros estão seguindo de perto? Embora a Etched não tenha um concorrente direto no momento, a startup de chips de IA Perceive recentemente apresentou um processador com aceleração de hardware para transformers. A Groq também investiu pesadamente em otimizações específicas para transformers em seu ASIC.

O Futuro da Etched

Concorrência à parte, e se os transformers um dia caírem em desuso? Uberti diz que, nesse caso, a Etched fará o óbvio: projetar um novo chip. Justo. Mas essa é uma solução bastante drástica, considerando quanto tempo levou para trazer o Sohu à fruição.

Nenhuma dessas preocupações dissuadiu os investidores de despejar uma enorme quantidade de dinheiro na Etched. Hoje, a Etched anunciou que fechou uma rodada de financiamento Série A de $120 milhões co-liderada pela Primary Venture Partners e Positive Sum Ventures. Elevando o total arrecadado pela Etched para $125,36 milhões, a rodada contou com a participação de investidores anjos de peso, incluindo Peter Thiel (Uberti, Zhu e Wachen são ex-alunos da Thiel Fellowship), o CEO do GitHub Thomas Dohmke, o cofundador da Cruise (e da Bot Company) Kyle Vogt e o cofundador da Quora Charlie Cheever.

Esses investidores presumivelmente acreditam que a Etched tem uma chance razoável de escalar com sucesso seu negócio de venda de servidores. E talvez tenha — Uberti afirma que clientes não identificados reservaram dezenas de milhões de dólares em hardware até agora. O lançamento iminente do Sohu Developer Cloud, que permitirá aos clientes visualizar o Sohu por meio de um playground interativo online, deve impulsionar vendas adicionais, sugeriu Uberti.

Ainda parece cedo para dizer, no entanto, se isso será suficiente para impulsionar a Etched e sua equipe de 35 pessoas para o futuro que os cofundadores da empresa estão imaginando. O segmento de chips de IA pode ser implacável nos melhores momentos — veja os quase fracassos de alto perfil de startups de chips de IA como Mythic e Graphcore, e, de forma relacionada, a queda no financiamento para empreendimentos de chips de IA em 2023.

Uberti faz uma forte argumentação de vendas, no entanto: “Geração de vídeo, modalidades de áudio para áudio, robótica e outros casos de uso futuros de IA só serão possíveis com um chip mais rápido como o Sohu. Todo o futuro da tecnologia de IA será moldado por saber se a infraestrutura pode escalar.”



Créditos: publicai.com.br

Leave a Reply

Your email address will not be published. Required fields are marked *