哇,AI领域进展这么快!

刚刚Llama 3.1 405b发布一天,法国初创公司Mistral AI就推出了LARGE 2。

这款新的开源旗舰AI模型不仅在很多指标上接近Llama 3.1 405b,而且在编程基准测试上还超过了它,而它的参数量却只有123b。

来看一下和Llama 3.1 405b的基准对比:

- MMLU: Mistral Large 2是84.0%,Llama 3.1 405b是88.6%

- HumanEval: Mistral Large 2是92%,Llama 3.1 405b Instruct是89%

- GSM8K: Mistral Large 2是93%,Llama 3.1 405b Instruct是96.8%

这意味着短短两天内,我们就有了两个达到GPT-4水平的开源模型

Reply to this note

Please Login to reply.

Discussion

No replies yet.