Google封杀站长为什么拿不出理由

10月 11, 2007 on 11:03 pm | In 杂谈 | 4 Comments

假设现在这样:
1.你,你的朋友,从北京市的各地赶来长安街的邮局,向某地寄一封信,寄件人都写上你的地址。现在收件人能知道这封信其实不是你寄的吗?不知道。因为信封上会有两个印章,一个是发件邮局的印章,一个是最后送达的邮局的印章。这几封信,收件人有证据认为它们其实是从北京市的各个地方寄出的吗?不能。
2.反过来你从海淀区,朝阳区,顺义区分别寄三封信到同一个地址,寄件人地址也分别填写这三个地点的地址,收件人相同。信封,信件都打印出来,那现在收件人能证明这三封信其实都是一个人从一个地方寄出来的吗?不能。
同理,Google也不能认定某两次广告点击其实最终是在一台电脑上完成的。除非它拿出证据证明。
那么Google为什么宣称欺诈点击它都能查出来呢?
那我们假设有这样一些IP短时间内较集中地访问了广告:

  1. 222.222.222.101
  2. 222.222.222.102
  3. 222.222.222.103
  4. 222.222.222.104
  5. 222.222.222.105
  6. 222.222.222.106
  7. 222.222.222.107
  8. ...

他们全是一个网段IP,且紧挨着。google很可能认为,这是一个欺诈程序自动地运行,访问了广告。google可能通过一个学习机制,将这个作为一个案例。事实上也的确,在大部分情况下就是这样的。一个欺诈程序自动地运行,不断地连接ADSL,再关闭,因为是一个电话局申请的IP,所以IP换来换去就这么几个。但是,这只是可能,也可能是另一种情况:比如,一个企业或一个网吧拥有了这一个网段IP,然后其中一个人上了这个网站,并让其他人也上,很可能只是为了分享一段什么东西。
还有一些情况下,也可能通过机器学习都认为是欺诈。比如一段时间内访问量反常地大,且浏览器都带一个相同的User-agent字段,报告的版本号都一样,可能是因为这是欺诈程序运行了。因特网上各人的浏览器的版本不同,一个时间段内难有大量的的同版本号的,这样看来如果有大量版本号相同的浏览器访问,认定上为点击期诈也不算太错。因为这个欺诈程序每次会报不同的IP,但版本号可能忘了改。但是,有什么是不可能的呢?恰恰那一时间段
也许一批人能用同一个浏览器呢?比如,这一阵某个著名的软件加上了该网站的链接,然后大量这个带有这个软件头的用户来访问了呢?
其他一些批量的数据,也能通过机器学习,找出“80%情况下是是欺诈”的数据。但是,机器学习只是机器学习,大部分情况下是对的,并不能做为证据。不能因为80%的小姐都浓妆艳抹,就认定一个浓妆艳抹的女人是鸡呀。
事实就是这样,Google当然能“感觉”到你非常非常可能进行了点击期诈,但是他绝对没有证据。当然,如果确实是欺诈,比如是Cookie都没换就换IP多次点击广告,那Google是有铁证证明你点击欺诈的!

我的先见

04月 20, 2007 on 1:47 am | In 未分类 | 1 Comment

1.我可能跟我周围这些人相比,是最早站出来说谷歌未必就永远不做恶的.事实证明,它确实做了(不管是不是因为它没管教好它的两个工程师).在之后霍炬,还有其他一批前辈终于看到谷歌的无奈和乖巧.
2.在2006年3月到5月这段时间里,我迷上了征途。我在大二的时候玩过传奇,玩征途是第二次玩网游。某些专家放炮说:史玉柱的征途是不可能赢利的。这时候我玩过了,所以我知道不是。我相信他是能赚钱的。现在看来,果然,但是专家们好像不鸟这事儿,又攻击说征途胜在他利用人类的某些弱点比如好胜好斗上。简直是睁着眼说瞎话.做网游最早的最好的,是陈天桥的传奇。传奇不是是杀怪模式吗?征途之前如此众多的网游,杀怪模式练级的太多了。
3.因此我突然对自己的直觉有了一些自信。所谓的专家,不见得比我强.

Powered by WordPress with Pool theme design by Borja Fernandez.
Entries and comments feeds. Valid XHTML and CSS. ^Top^