之前jb55说过可能要清理一下广告,占用太多空间,不知道是不是跟这个有关。但是如果只是清理掉历史的数据,那新的应该还会持续产生。除非在算法上做了拦截

Reply to this note

Please Login to reply.

Discussion

估计是一些混合策略,重复性识别+IP识别+利用report信息之类的。

有规律性(如定时机器人刷)或者同号同内容、同IP发送比较好识别,处理成本低一些。如果是很多IP、不断的生成各种不同的内容,处理成本就比较高,没规律只能完全靠对内容的识别处理

不用那么复杂,基于内容识别就全搞定。类似垃圾邮件的处理。

我想表达的是有规律比无规律的处理“成本”低一些

对,就跟压缩算法一样。

理论上来说它甚至可以抓取用户发布的内容用来伪装自己。

观察两天