之前jb55说过可能要清理一下广告,占用太多空间,不知道是不是跟这个有关。但是如果只是清理掉历史的数据,那新的应该还会持续产生。除非在算法上做了拦截
估计是一些混合策略,重复性识别+IP识别+利用report信息之类的。
Please Login to reply.
有规律性(如定时机器人刷)或者同号同内容、同IP发送比较好识别,处理成本低一些。如果是很多IP、不断的生成各种不同的内容,处理成本就比较高,没规律只能完全靠对内容的识别处理
不用那么复杂,基于内容识别就全搞定。类似垃圾邮件的处理。
我想表达的是有规律比无规律的处理“成本”低一些
对,就跟压缩算法一样。
理论上来说它甚至可以抓取用户发布的内容用来伪装自己。