Global Feed Post Login
Replying to Avatar ClarkQAQ

不过目前我觉得 NIP-50 才是中继实现最难的一步, 特别是中文.

英文可以用空格分词 word, 很简单就搞定了, 但是中文不用 jieba 类的分词引擎把每个字都当作一个 token 一句话的 token 量就爆炸了, 但是用了分词引擎写入速度又会被大大削弱...

Avatar
CT 0mo ago

写入速度不是太大的问题,搜索结果并不需要那么实时。搜索的问题是成本太高了,很难用爱发电

Reply to this note

Please Login to reply.

Discussion

No replies yet.