A startup chinesa DeepSeek, sediada em Hangzhou e liderada por Liang Wenfeng, surpreendeu o mercado ao lançar o modelo de inteligência artificial DeepSeek-R1, capaz de competir diretamente com gigantes como o ChatGPT (da OpenAI) e o Gemini (da Google).
Desenvolvido com um orçamento de apenas 6 milhões de dólares, um valor significativamente inferior aos 100 mil milhões de dólares investidos pela OpenAI, o modelo destaca-se pelas suas capacidades avançadas em programação, raciocínio lógico e escrita em chinês, para além de comunicar fluentemente em português e inglês.
Face às restrições impostas pelos Estados Unidos, que limitaram o acesso a chips de ponta da Nvidia, a DeepSeek recorreu às placas H800, mais acessíveis, lançadas em 2023.
A empresa também inovou ao utilizar técnicas de aprendizagem por reforço, otimizando o desempenho do modelo sem a necessidade de grandes infraestruturas tecnológicas, uma abordagem que contrastou com os métodos tradicionais da indústria.
Adicionalmente, o modelo DeepSeek-R1 é open source, permitindo à comunidade global aceder, modificar e distribuir o código-fonte.
Esta estratégia disruptiva coloca em causa a hegemonia ocidental no domínio da inteligência artificial.
O sucesso do DeepSeek teve um impacto significativo no mercado, ao evidenciar que é possível desenvolver modelos de ponta com uma fração dos recursos utilizados pelas grandes empresas tecnológicas. Com apenas 2.000 placas da Nvidia, a startup conseguiu resultados competitivos, enquanto as empresas norte-americanas utilizam mais de 10.000 placas nos seus supercomputadores.
Este feito contribuiu para uma queda de quase 600 mil milhões de dólares no valor das ações da Nvidia, desafiando as estimativas dos investidores sobre a procura de hardware especializado.