Subnostr

「逆転裁判」でOpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverickの推論能力を検証する - GIGAZINE

GIGAZINEの記事では、OpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 MaverickのAIモデルを「逆転裁判」でテストした結果が紹介されています。

AIモデルの推論能力、視覚的理解、戦略的意志決定を評価し、ゲームオーバーになるまでの過程を比較しています。

コストパフォーマンスも考慮され、Gemini 2.5 Proが総合的に高く評価されています。

Please Login to reply.

No replies yet.