如何防止google adsense欺骗的分析
2008-06-27 16:02:27.0
如何防止google adsense欺骗的分析
随着在线广告的流行,pay by per click (每次付钱)的模式 逐渐被大家接受。可是随之而来的问题就是fraud

  clicking的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。

  下面介绍Google Adsense系统如何从系统角度出发防止欺骗,希望对其它的在线广告系统防止虚假能有很好的指导作用:

  1] 率 = 次数/共浏览的次数。

  率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的率超过10%将意味这什么。

  #of Click/# of Viewed

  2] 覆盖率/独立IP ,这个分布里如果有;单个IP 的(/浏览)=覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。

  例子,例如来自 129.119.200.1 的用户浏览了 16个网页,了4个广告,而整个广告的率「从[1]里计算的到」是5%,那么计算得到:

  %5 X 16 =~ 1,方差为Sqrt(1) = 1,覆盖率=4/1 = 4 ,根据数学上高斯分布,这种概率小于万分之一。

  Ratio VS IP distribution

  3] 率『覆盖率』/IP/时间

  根据时间序列对率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗的可能。

  Ratio VS time

  4] 网页load的时间和 广告时间差的分析,以及每两次click之间时间差序列的分析

  [网页load的时间和 广告时间差] 应该是一个泊松分布 possion

  distribution,而每两次click之间的时间差也应该是一个Possion

  distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。

  [time of loading - time of click] distribution VS Possion

  [time difference of two clicks] distribution VS Possion/Gaussion

  5] 针对Proxy的分析

  改变IP进行可以说在以往是最难以解决最难以发现作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。

  Reverse Proxy check

  6] 针对 http_agent的分析

  Http_agent/时间 的时间序列的分析,峰值超过3方差需要审查

  7] 针对 http_referral 的分析

  referral/时间 的时间序列的分析 ,峰值超过3方差需要审查

  8] 整体效果上还有一个非常有用的量:

  所有用户的有效的每千次展示费用的均值/独立IP

  这个将能更加直接找到spam clicking 的运行计算机并且予以封杀。

  Overall Ratio VS IP

  即便我在这里给出了以上的防止作弊的办法,但是不要忘记了:

  邪恶的人永远比正义的人来的多,来的猛烈。


文章评论
[以下网友留言只代表其个人观点,不代表中华网的观点或立场]
发表评论
昵 称:
主 页:
内 容:
表 情: