https://gigazine.net/news/20250417-ai-plays-ace-attorney/
「逆転裁判」でOpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverickの推論能力を検証する - GIGAZINE
GIGAZINEの記事では、OpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 MaverickのAIモデルを「逆転裁判」でテストした結果が紹介されています。
AIモデルの推論能力、視覚的理解、戦略的意志決定を評価し、ゲームオーバーになるまでの過程を比較しています。
コストパフォーマンスも考慮され、Gemini 2.5 Proが総合的に高く評価されています。