Nostr Web Client

Scale law 也包括数据集，中文语料太少。当前存在的语料已经用完了，后续的都是线性增产的语料，不会有指数变化。

大模型的能力是在预训练时候已经获得的，后续监督微调/RLHF/incontext learn和 prompt 都是引导，不增加模型能力甚至减少模型能力。

总之，关键在模型预训练，语料不足（书、杂志、wiki、报纸、新闻、小说、各种出版物、网站出版物、文档、软件、游戏都太少太少了，垃圾广告不少，但是垃圾广告千篇一律没信息量没给不来泛化能力）

其他小语言语料更少，语言语料训练不平衡，是gpt 自己提出他要解决的问题