没想到这件事还能有后续... 一个自称是该 bot 的创建者的人联系上了我, 虽然我也没办法确认他的身份真实性. 这个机器人/机器人群确实还在继续运行, 爬虫活动也还在继续. 晚些时候可能会更新一些可以公开的对话信息, 有些东西还没问清楚.
我的疑问主要是, 既然有这么全面的数据库且想要据此盈利, 为什么这个数据库没有出现在某些论坛上面? 又或者和 Discord 爬虫的那群人一样积极寻求出售数据? 对于这种类型的数据集来说, 打包卖就是综合最佳的获益手段, 毕竟现在还是 AI 时代.
没想到这件事还能有后续... 一个自称是该 bot 的创建者的人联系上了我, 虽然我也没办法确认他的身份真实性. 这个机器人/机器人群确实还在继续运行, 爬虫活动也还在继续. 晚些时候可能会更新一些可以公开的对话信息, 有些东西还没问清楚.
我的疑问主要是, 既然有这么全面的数据库且想要据此盈利, 为什么这个数据库没有出现在某些论坛上面? 又或者和 Discord 爬虫的那群人一样积极寻求出售数据? 对于这种类型的数据集来说, 打包卖就是综合最佳的获益手段, 毕竟现在还是 AI 时代.
注意安全呀🫡
该不会nostr的数据也有人在卖?
这个机器人已经没了
* 没有寻求出售数据是为了持续获益.
* 在他的视角下 funstat 这个只有俄语和英语的机器人莫名在中文圈子里面火了, 然而一段时间之后突然又没热度了, 所以找到了我, 他希望能在中文圈子里面赚钱. (在我的视角下, 是机器人被频道公开之后得到了很多其他频道和群组的转发, 然后被中文新闻媒体报道并且都带上了机器人名字, 然而过不了多久就绝对会被举报下架, 于是热度突然出现突然消失)
* 他不知道这个机器人被中文圈子的很多人拿来当作社工库和监视工具用, 他也否认这个机器人创建的目的是为了人肉搜索. 私密群组被爬是因为这些的邀请链接实质被泄露到了公有领域, 类似某些公开频道放一个私密群的邀请链接但从来不验证入群人的身份的用法.
* 他希望能改善这个搜索引擎的在中文圈子中的名声, 在独联体圈子并没有大量这种误用, 它被设计来搜索公开领域的所有消息, 并不是只会用来人肉而是类似于 OSINT.
* 我和他解释了为什么中文用户对信息泄露如此敏感, 为什么即使只是公开领域的数据被收集也会被部分人认为是人肉搜索.
* 他为中文用户专门设置了一个机器人, 做好了为中文用户改进一切其他语言用户不希望有的功能. 我希望他能成为一个更健康的搜索引擎, 数据所有者能选择隐藏数据, 中文用户可以借助他的机器人有希望改善 Telegram 的 CJK 搜索能力, 一些用户也不必为了 Telegram 的全局搜索而去订阅 Premium 而是把钱给他, 用他的机器人.