Replying to Avatar murawaki

ふと Chinese Restaurant Process (CRP) という命名に文句をつけている人がいるかもなと思って調べたら、一人だけ見つかった。

https://www.tkim.graphics/CRT/Kim_WaPo.pdf

2021年の Washington Post のコラム。内容としては、Chinese Remainder Theorem、Chinese Postman Problem に続く第3の例として CRP が挙げられている。要するに、白人がアジア人を扱うとき、個人を尊重せずに dehumanize してきた、みたいな主張。

著者は Theodore Kim。知らない人だが、名前と見た目から判断するに韓国系で米国育ちっぽい。

計算機科学が本職ということで、CRP の理解は正確。まあ、「正規分布はレイシストだ」みたいなこと言ってる層が CRP に触れる機会は一生ないだろうから、観測できる事例が出てくるとしたら、こういう書き手になるのは自然。

あと、この人、Yale で Critical Computing Initiative という、名前だけでお腹いっぱいなプログラムを率いている。

https://criticalcomputing.yale.edu/

Chinese Restaurant Process (CRP) は自然言語処理では失われた技術。ニューラル時代、特に LLM 時代以降に来た人は誰も知らない。

CRP は Dirichlet Process (およびその一般化である Pitman–Yor Process) の逐次的な予測規則に対応する確率過程。

自然言語処理では例えば教師なし単語分割で使われていた。この文脈ではレストランのテーブルが単語ラベル (語彙項目)、客がトークン出現に対応する。

Reply to this note

Please Login to reply.

Discussion

No replies yet.