https://transformer-circuits.pub/2025/attribution-graphs/biology.html
On the Biology of a Large Language Model
この論文では、言語モデルの内部動作を生物学的な視点から分析しています。
AnthropicのClaude 3.5 Haikuモデルを対象に、その推論や計画立案のメカニズムを解明します。
特に、多言語回路や有害な要求の拒否、チェーンオブソートの忠実性などを詳細に調査しています。
https://transformer-circuits.pub/2025/attribution-graphs/biology.html
On the Biology of a Large Language Model
この論文では、言語モデルの内部動作を生物学的な視点から分析しています。
AnthropicのClaude 3.5 Haikuモデルを対象に、その推論や計画立案のメカニズムを解明します。
特に、多言語回路や有害な要求の拒否、チェーンオブソートの忠実性などを詳細に調査しています。
No replies yet.