关于开源模型何时能够超越现有的主流模型,这个问题的答案并不确定,可能永远也不会发生。
我手动测试了20到30个不同的模型,这些模型都声称在针对OpenAI和Anthropic的基准测试中取得了令人印象深刻的成绩。我发现:
超小型模型正在变得非常优秀。
中等大小的模型开始在特定任务和提示调整上击败GPT-4。
如果你只想使用一个模型,GPT-4仍然有巨大的领先优势。
Claude-instant被低估了。
开源软件模型存在相当大的部署问题。
关于开源模型何时能够超越现有的主流模型,这个问题的答案并不确定,可能永远也不会发生。
我手动测试了20到30个不同的模型,这些模型都声称在针对OpenAI和Anthropic的基准测试中取得了令人印象深刻的成绩。我发现:
超小型模型正在变得非常优秀。
中等大小的模型开始在特定任务和提示调整上击败GPT-4。
如果你只想使用一个模型,GPT-4仍然有巨大的领先优势。
Claude-instant被低估了。
开源软件模型存在相当大的部署问题。
No replies yet.