A startup chinesa DeepSeek surpreendeu o mundo da tecnologia ao lançar seu modelo de inteligência artificial, o DeepSeek-R1, que rivaliza com os principais modelos americanos, utilizando recursos significativamente menores. A empresa afirma ter investido apenas US$ 5,6 milhões no treinamento do modelo, valor substancialmente inferior aos gastos de gigantes como OpenAI e Google. E isso pode fazer com que investidores recuem em suas intenções de financiar projetos caros de IA.
Não à toa, o lançamento do DeepSeek-R1 gerou um impacto significativo no mercado financeiro. As ações da Nvidia, principal fornecedora de hardware para IA, registraram uma queda de mais de 11% no pré-mercado da Nasdaq, refletindo a preocupação dos investidores com a possibilidade de métodos mais eficientes reduzirem gastos com hardwares.
De acordo com Filipe Calegario, professor adjunto do Centro de Informática da UFPE, a DeepSeek adotou abordagens inovadoras, como o aprendizado por reforço, permitindo que o modelo desenvolva um “encadeamento de pensamento” de forma emergente durante o treinamento. Além disso, utilizou a técnica de destilação, onde um modelo mais simples é treinado a partir das saídas de um modelo mais complexo, contribuindo para a redução dos custos de desenvolvimento.
“É interessante esse movimento agora, esse derretimento dos valores da bolsa, das ações da Nvidia, porque a Nvidia é a principal fornecedora de hardware. E o que está acontecendo agora indica que esse valor todo que está sendo investido aí pode ser questionado. E aí o investidor pensa nisso, pensa que o custo vai cair, pensa em reduzir investimentos. “, analisa Calegario.
O que chamou atenção do mercado é o fato de uma empresa chinesa relativamente pequena conseguir, com recursos limitados e equipamentos defasados, treinar modelos que alcançam níveis de desempenho semelhantes aos das maiores potências tecnológicas.
No entanto, analistas expressam ceticismo em relação aos números apresentados pela DeepSeek. Há questionamentos sobre os custos reais de implementação e a capacidade da empresa de replicar esses resultados em larga escala.
“Os valores de treinamento do modelo, algo em torno de US$ 5 a 6 milhões, são questionáveis. Parece que desconsideraram os custos com pesquisa e desenvolvimento, focando apenas no uso do hardware. Mas, tudo vindo da China, a gente tem que ter muito cuidado para entender, porque esses valores podem estar subestimados. A gente não tem muitos detalhes dessa empresa. Não é uma empresa conhecida, grande. É uma empresa que está despontando nesse cenário de open source”, diz o professor.
A DeepSeek, sediada em Hangzhou, foi fundada por Liang Wenfeng, cofundador do fundo de hedge High-Flyer. Nascido em 1985 em Zhanjiang, Guangdong, formou-se em Engenharia de Informação Eletrônica pela Universidade de Zhejiang. Em 2015, ele cofundou o High-Flyer, um fundo de hedge quantitativo que utiliza inteligência artificial para estratégias de investimento. Posteriormente, em 2023, Liang fundou a DeepSeek como uma extensão de suas iniciativas em IA, com foco no desenvolvimento de modelos de linguagem de grande escala.
O lançamento da IA chinesa ocorre em um contexto de tensões geopolíticas. Durante o governo Biden, os Estados Unidos reforçaram sanções que restringem a exportação de chips avançados para a China, dificultando o acesso do país asiático a tecnologias de ponta. “A frase que mais escuto nessas notícias é que a necessidade é a mãe da invenção. A China, com acesso restrito a hardware avançado, está provando que dá para otimizar o que se tem”, reflete Calegário.
Com hardware limitado e uma abordagem pragmática, a DeepSeek representa uma nova maneira de pensar o desenvolvimento de inteligência artificial, destacando-se em um mercado dominado por players gigantescos. “Essa situação é um ótimo exemplo de como as limitações podem ser transformadas em oportunidades. A China está mostrando como se reinventar, e isso vai forçar o setor a repensar suas estratégias de investimento e inovação”, conclui o professor.
Leia também:
Agenda cripto de Trump pode transformar o cenário financeiro global