China lançou DeepSeek IA, 670G parametros (o maior ate agora), opensource (code, não só training data), e performance comparavel ao melhor da OpenAI americana, que é fechado.

https://www.alilybit.com/p/what-chinas-deepseek-ai-really-means

Obvio, a China subsidiou o treinamento tentando dominar o mercado, e abrir a IA quebra o modelo de negocio dos americanos. Isso é o mais importante, permtir usar IA sem pagar pedágio pras empresas americanas. Mesmo que seja inferior.

Fico curioso:

* o modelo novo e maior incorpora melhorias recentes na arquitetura e teoria, pra permtir treinar com menos GPU como dizem, ou apenas jogaram mais $$$ e GPU nos mesmos modelos anteriores? i.e., é esperteza ou força bruta? Se o codigo de treinamento for mesmo livre, saberemos logo.

* Porque um modelo maior e mais moderno não é MELHOR nos benchmarks do que os americanos?

Por um lado, ao inves de modelo censurado pelo deep state, teremos modelos censurados pelo PCC! Por outro lado, como o Andrew do Gab diz, se for mesmo opensource, pode-se retirar todos os filtros externos de censura. Sim, dá pra retreinar, mas não 'esquecerá' completamente o corpus de treinamento que o PCC escolheu, talvez ele esteja otimista demais.

https://news.gab.com/2025/01/deepseek-a-sputnik-moment-for-ai/

https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F54633122-2ecb-4b2d-aa04-93470dc45a9d_720x524.webp

Reply to this note

Please Login to reply.

Discussion

No replies yet.