“2つの文章が同じ意味であったとしても、AIモデルは標準アメリカ英語(SAE)話者よりも、AAE話者に「汚い」「怠惰な」「愚かな」といった形容詞を当てはめる傾向が強かった。AIモデルは、AAE話者をより地位の低い仕事(あるいは無職)と関連付け、仮想の刑事被告人について判決を下すよう求められると、AAE話者に対しては死刑を推奨する傾向が強かった。”
LLMに「隠れ人種差別」、アライメントによる是正に限界
“2つの文章が同じ意味であったとしても、AIモデルは標準アメリカ英語(SAE)話者よりも、AAE話者に「汚い」「怠惰な」「愚かな」といった形容詞を当てはめる傾向が強かった。AIモデルは、AAE話者をより地位の低い仕事(あるいは無職)と関連付け、仮想の刑事被告人について判決を下すよう求められると、AAE話者に対しては死刑を推奨する傾向が強かった。”
LLMに「隠れ人種差別」、アライメントによる是正に限界
No replies yet.