日本語 LLM の ELYZA がアップデート。
今回は LLM を試せるチャット形式のデモ版も公開しているとのこと。
GPT-3.5 Turbo や Gemini に匹敵というニュースも出ていたりと、日本製 LLM の中でも、かなり優秀なのはまちがいないですよね。
ちなみにGMOの実験では、以前に公開された ELYZA-japanese-Llama-2-7b-instruct で IT パスポートの問題を解かせると、成績はGPT-4を上回っているらしい
しかし、日本語理解力が低いせいかヒントを加えると、成績が落ちるという現象が見られるみたい。
今回のアップデートで、そこを含めて、どれだけ改善されているか気になるところ。