哇,AI领域进展这么快!
刚刚Llama 3.1 405b发布一天,法国初创公司Mistral AI就推出了LARGE 2。
这款新的开源旗舰AI模型不仅在很多指标上接近Llama 3.1 405b,而且在编程基准测试上还超过了它,而它的参数量却只有123b。
来看一下和Llama 3.1 405b的基准对比:
- MMLU: Mistral Large 2是84.0%,Llama 3.1 405b是88.6%
- HumanEval: Mistral Large 2是92%,Llama 3.1 405b Instruct是89%
- GSM8K: Mistral Large 2是93%,Llama 3.1 405b Instruct是96.8%
这意味着短短两天内,我们就有了两个达到GPT-4水平的开源模型 