ベンチマークを見ると4.5より優秀みたいですよ。コーディング性能はよくわかりません。
Discussion
4.1 miniがClaude 3.7越えてるみたい
ほんとだ。o3-mini-highが1位なんですね。意外。てっきりGemini 2.5 Proだと思ってました。
ベンチマークを見ると4.5より優秀みたいですよ。コーディング性能はよくわかりません。
4.1 miniがClaude 3.7越えてるみたい
ほんとだ。o3-mini-highが1位なんですね。意外。てっきりGemini 2.5 Proだと思ってました。