(承前) どうやって公言することなく二重基準を組み込むかをジェンダーバイアスを例に考えてみる。
(1) タスク設定レベルでの対象の選定: ジェンダーバイアスを対象とするタスクを設定すると、当然それ以外のバイアスカテゴリは対象から外れる。仮にジェンダーよりも重要性の高いバイアスカテゴリがあるのではないかと疑ったとしても、そのタスクに取り組むと決めた時点で、タスク設定の妥当性を問うすべがなくなる。
(2) 事例レベルでの対象の選定: ジェンダーバイアスといっても、単純に男女で差異が出る事例をあつめると、男性が不利であるような事例が出てくるはずである。これを防ぐには、評価実験に使うベンチマークデータセットに細工すればよい。女性が不利であるような事例だけを集めたベンチマークを作って、みんながそのデータセットで性能競争をするようになれば勝ち。仮にその競争から離れた論文を出そうとしても査読を通らない。
(3) アノテーションによる価値判断の埋め込み: 2の対策が不完全だと、都合の悪い事例が残ってしまうかもしれない。その場合は、男性が不利であるような事例はバイアスがかかっていないというラベルを事例に付与すれば良い。そうしたラベル付きデータは、モデルの訓練に使うこともあれば、評価に使うこともあるが、いずれにせよ正解データとして提供される。やはりこのタスクに取り組むと決めた時点で、正解として受け入れなければならない仕組みになっている。
(続く?)