LLM の選好チューニングに使われる訓練データや LLM の評価に使われるベンチマークデータは開発者の価値観を不透明な形で埋め込んでおり、それが分極化した社会において LLM の信頼性を損なう、という話をたまにする。とはいえこれはあくまで消費者の立場。開発者の立場からはまた別の風景が見える。LLM が開発者の価値観に簡単に従ってくれるのであれば苦労はしない。それはイーロンが Grok の制御に四苦八苦しているのを見れば明らか。

Reply to this note

Please Login to reply.

Discussion

No replies yet.