关于开源模型何时能够超越现有的主流模型,这个问题的答案并不确定,可能永远也不会发生。

我手动测试了20到30个不同的模型,这些模型都声称在针对OpenAI和Anthropic的基准测试中取得了令人印象深刻的成绩。我发现:

超小型模型正在变得非常优秀。

中等大小的模型开始在特定任务和提示调整上击败GPT-4。

如果你只想使用一个模型,GPT-4仍然有巨大的领先优势。

Claude-instant被低估了。

开源软件模型存在相当大的部署问题。

Reply to this note

Please Login to reply.

Discussion

No replies yet.