https://transformer-circuits.pub/2025/attribution-graphs/biology.html

On the Biology of a Large Language Model

この論文では、言語モデルの内部動作を生物学的な視点から分析しています。

AnthropicのClaude 3.5 Haikuモデルを対象に、その推論や計画立案のメカニズムを解明します。

特に、多言語回路や有害な要求の拒否、チェーンオブソートの忠実性などを詳細に調査しています。

Reply to this note

Please Login to reply.

Discussion

No replies yet.