November 10, 2004

如何防止google adsense fraud clicks(欺騙點擊作弊) 的分析以文找文

隨著在線廣告的流行,pay by per click (每次點擊付錢)的模式 逐漸被大家接受。可是隨之而來的問題就是fraud clicking的預防迫在眉捷,因為這將直接關系到這種廣告模式能否長久生存和能否成為一種真正的網站擁有者的收入來源。


下面介紹Google Adsense系統如何從系統角度出發防止點擊欺騙,希望對其它的在線廣告系統防止虛假點擊能有很好的指導作用。


隨著在線廣告的流行,pay by per click (每次點擊付錢)的模式 逐漸被大家接受。可是隨之而來的問題就是fraud clicking的預防迫在眉捷,因為這將直接關系到這種廣告模式能否長久生存和能否成為一種真正的網站擁有者的收入來源。


下面介紹Google Adsense系統如何從系統角度出發防止點擊欺騙,希望對其它的在線廣告系統防止虛假點擊能有很好的指導作用:


1] 點擊率 = 點擊次數/共瀏覽的次數。

點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什麽。


#of Click/# of Viewed


2] 點擊覆蓋率/獨立IP ,這個分布裏如果有;單個IP 的(點擊/瀏覽)=點擊覆蓋率超出了3倍的系統誤差範圍內將有作弊的嫌疑。


例子,例如來自 129.119.200.1 的用戶瀏覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]裏計算的到」是5%,那麽計算得到:

%5 X 16 =~ 1,方差為Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小于萬分之一。


Ratio VS IP distribution


3] 點擊率『點擊覆蓋率』/IP/時間

根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那麽這將以為著有潛在的欺騙點擊的可能。


Ratio VS time


4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析

[網頁load的時間和 廣告點擊時間差] 應該是一個泊鬆分布 possion distribution,而每兩次click之間的時間差也應該是一個Possion distribution,如果這個時間用秒記,大于25秒的話基本上呈現高斯分布的形狀。


[time of loading - time of click] distribution VS Possion

[time difference of two clicks] distribution VS Possion/Gaussion


5] 針對Proxy點擊的分析

改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這裏衹要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。


Reverse Proxy check


6] 針對 http_agent的分析

Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查


7] 針對 http_referral 的分析

referral/時間 的時間序列的分析 ,峰值超過3方差需要審查


8] 整體效果上還有一個非常有用的量:

所有用戶的有效的每千次展示費用的均值/獨立IP

這個將能更加直接找到spam clicking 的運行計算機並且予以封殺。


Overall Ratio VS IP


即便我在這裏給出了以上的防止作弊的辦法,但是不要忘記了:


邪惡的人永遠比正義的人來的多,來的猛烈。


Posted by at 天空部落 │17:18 │回應(0)引用(3)搜索優化
相關閱讀

引用URL

http://blog.yam.com/williamlong/trackback/5552244
引用列表:
前幾天看到台灣出現第一起 Adsense 被停權的案例。本來筆者對這個 Case 只是置之一笑而已,因為該站長也承認了自己多次詐騙點擊,才遭致停權。 但是筆者前幾天又看到一篇 Blog 文:「如何...
有名大站proxy帶來的Adsense詐擊隱憂?【Blog.XDite.net】 at Jan 4, 2007
前幾天看到台灣出現第一起 Adsense 被停權的案例。本來筆者對這個 Case 只是置之一笑而已,因為該站長也承認了自己多次詐騙點擊,才遭致停權。 但是筆者前幾天又看到一篇 Blog 文:「如何...
有名大站proxy帶來的Adsense詐擊隱憂?【Blog.XDite.net】 at Jan 4, 2007
回應文章