Chinese Restaurant Process (CRP) は自然言語処理では失われた技術。ニューラル時代、特に LLM 時代以降に来た人は誰も知らない。
CRP は Dirichlet Process (およびその一般化である Pitman–Yor Process) の逐次的な予測規則に対応する確率過程。
自然言語処理では例えば教師なし単語分割で使われていた。この文脈ではレストランのテーブルが単語ラベル (語彙項目)、客がトークン出現に対応する。
ふと Chinese Restaurant Process (CRP) という命名に文句をつけている人がいるかもなと思って調べたら、一人だけ見つかった。
https://www.tkim.graphics/CRT/Kim_WaPo.pdf
2021年の Washington Post のコラム。内容としては、Chinese Remainder Theorem、Chinese Postman Problem に続く第3の例として CRP が挙げられている。要するに、白人がアジア人を扱うとき、個人を尊重せずに dehumanize してきた、みたいな主張。
著者は Theodore Kim。知らない人だが、名前と見た目から判断するに韓国系で米国育ちっぽい。
計算機科学が本職ということで、CRP の理解は正確。まあ、「正規分布はレイシストだ」みたいなこと言ってる層が CRP に触れる機会は一生ないだろうから、観測できる事例が出てくるとしたら、こういう書き手になるのは自然。
あと、この人、Yale で Critical Computing Initiative という、名前だけでお腹いっぱいなプログラムを率いている。
Chinese Restaurant Process (CRP) は自然言語処理では失われた技術。ニューラル時代、特に LLM 時代以降に来た人は誰も知らない。
CRP は Dirichlet Process (およびその一般化である Pitman–Yor Process) の逐次的な予測規則に対応する確率過程。
自然言語処理では例えば教師なし単語分割で使われていた。この文脈ではレストランのテーブルが単語ラベル (語彙項目)、客がトークン出現に対応する。
No replies yet.