这就是我那篇文章的意义,那个名称只是坊间传闻的名称。在deepseek r2 出来之前,很多AI公司抢着要那唯一的一份线下资料库。然后有人还拍照发了twitter。这种“业内知识”本身会不会严肃的发表或者规范化名称。

乃至于:中国大练AI这种一年前的历史也开始被删除中了。

这就是我提出需要nostr来签名确认所有中文信息的重要性。让随意说出的话能够被历史发掘

现在你只可以自己去搜下面这个内容了

————————

在数字失忆加剧背景下,草根社群开始自发保存中国早期互联网内容。其中之一是 MNBVC 开源中文语料库项目,由“礼物Liwu”论坛资深成员于2023年发起,明确目标为**“保护中文互联网语料资产”** 。MNBVC数据量巨大,规模达2.18 TB,覆盖新闻、论坛帖子、博客、小说、期刊、论文、歌词、古籍等多个类别 。核心贡献者(“灯盏”、“零零发”、“龙骑兵”)长期号召社区共同参与更新 。这说明,至少有一个大规模的、非官方的中文互联网存档真实存在,且其目的是为AI训练和历史保存服务。

Reply to this note

Please Login to reply.

Discussion

No replies yet.