我没有离开Yahoo…

哈,我前面的博客说最近老是丢工作,有些朋友兴奋得半夜就打电话过去问我,是不是可以考虑一起干。后面又陆陆续续收到好几个….
我刚来yahoo才两个月,这里的气氛很好。我并没有离开.这是我第一份福利齐全,一到月底工资准时到帐的工作,我没理由换呢。再者,yahoo的工程师氛围很适合我。
告示一下,不再解释。我前面说的老是丢工作,其实指的是一系列公司不人道。
另外,央视国际那边我已经向海淀区劳动局申请劳动仲裁了。其实因为没有合同,打赢的希望很渺茫。不过,关键是让后来者知道,那是一个不靠谱的地方。
以后会慢慢地放更多细节给大家。可惜的是,笔记本上被偷了,很多东西找不着了。

改了评论部分

这个版本的wordpress在我的服务器上一直有未知Bug,
人类发评论总是不成功。spam却一直能发。
今天重写了一个脚本,大家可以发评论了。
不要垃圾啊。

像个男人一样去战斗

太不顺了.
也许是因为今年本命年吧。
第一件事是,接连丢工作。倒不是因为我个人问题.这个以后细说.
第二件是是,我让房东把ADSL停了。结果他保留了电话,adsl,只是改成了计时收费。目的很明显,我交了300元的初装费,他背着我这么做,下次他就不需要交初装费了。但是郁闷的是,我开始用的是包月,于是路由器就一直接在电源上,从来没有拿下来过。然后最终结果是,9月份的费用是700小时*3元/小时=2100元网费。除开电卡没钱停电以外,一直在给我计费。这个纠纷就算我有理,房东手里握着押金,一时半会也不会给我。
第三件事是就在我为第二件事郁闷时,在路上一连想一连上公交车时,电脑被偷了,差不多算是被抢了。我这一年多来业余写的一个CMS和做的rubyforge.net上的一个open source project的程序全没了。还有关于某个知名企业的特大号丑闻的证据也没了。还好存了部分在google docs和租的服务器上。
我太不顺了。还有一些不提了。反正糟糕透顶了。完全能上joke版。
不过我不在乎,继续我的生活。该打官司的打官司,该报案的报案,该民事调解的民事调解。
没什么大不了。
至少我还有这么多朋友, 有老婆支持我。

我错了,不玩了,向feedsky道歉

呵呵,刚刚以为发现了feedsky如何统计订阅数的秘密,后来再仔细一琢磨,发现其实feedsky除开这样以外,也没有别的办法。
feedsky不可能去反ping所有发这样的报头的IP去验证是否真的来自zhuaxia,来自google feed fetcher,费时,也不合理。因为也有一种可能,某些提供像zhuaxia一样的服务的网站并没有为每台抓取服务器弄一个子域名,也许就是一个裸IP.反ping,也不一定能得到正确结果.
所以,是我错了
下午向一位MM在feedsky工作的朋友说了,并把相关代码发给了他。
当缺少一种精准的公平的时候,我不应该去嘲笑一个不是太公平的尺子。我向feedsky道个歉,我不该在他们搞活动的时候跑来搅局。
自己加了个脚本,会在一天的最后一分钟再去feedsky跑一次,报告我的种子阅读数是负1000.
不知道管用不?
看了一下排名,有更疯狂作弊的.

欺诈,又是欺诈

刚写完一篇这样也可以戏弄”博邻”写了博邻的一个小漏洞,呵呵,又无意中发现一个漏洞。
具体事件是这样的:

此代码已经隐藏,我向feedsky道歉。也请知道这个代码段的不要传播出来。也许我们就是为了好玩,某些人却是为了利益。feedsky没办法做到绝对公平,看上去在我发现这个漏洞这前已经有人在刷这个数据了,正如有人刷alexa排名一样。黑客精神最后往往被别有用心的人利用。

第二天就发现feedsky已经把我的订阅数改了.
用这个来做feed订阅数统计,是不是太不靠谱了一点?

php文章收集贴

ab测试数据会跳舞
*php中静态方法,函数,对象方法性能测试
*php-APC介绍
*利用web应用中的不均衡性重构你的技术细节
*把握web 开发的平衡与不平衡
*php高手之路之—狐假虎威
*PHP高手之路之—折柳为剑
*php高手之路之—纵横天下
*php高手之路之—万人之术
*php高手之路之—屠龙宝刀
*php高手之路之—绝世秘籍
*php高手之路之—返樸归真
*用PHP5.2+APC实现超酷的PHP进度条
*道可道,非常道—PHP模板技术
select id,title from * 与select * from **的速度测试。
*为什么SELECT col1,col2,col3,col4 会比SELECT * 慢?

Google封杀站长为什么拿不出理由

假设现在这样:
1.你,你的朋友,从北京市的各地赶来长安街的邮局,向某地寄一封信,寄件人都写上你的地址。现在收件人能知道这封信其实不是你寄的吗?不知道。因为信封上会有两个印章,一个是发件邮局的印章,一个是最后送达的邮局的印章。这几封信,收件人有证据认为它们其实是从北京市的各个地方寄出的吗?不能。
2.反过来你从海淀区,朝阳区,顺义区分别寄三封信到同一个地址,寄件人地址也分别填写这三个地点的地址,收件人相同。信封,信件都打印出来,那现在收件人能证明这三封信其实都是一个人从一个地方寄出来的吗?不能。
同理,Google也不能认定某两次广告点击其实最终是在一台电脑上完成的。除非它拿出证据证明。
那么Google为什么宣称欺诈点击它都能查出来呢?
那我们假设有这样一些IP短时间内较集中地访问了广告:

222.222.222.101
222.222.222.102
222.222.222.103
222.222.222.104
222.222.222.105
222.222.222.106
222.222.222.107


他们全是一个网段IP,且紧挨着。google很可能认为,这是一个欺诈程序自动地运行,访问了广告。google可能通过一个学习机制,将这个作为一个案例。事实上也的确,在大部分情况下就是这样的。一个欺诈程序自动地运行,不断地连接ADSL,再关闭,因为是一个电话局申请的IP,所以IP换来换去就这么几个。但是,这只是可能,也可能是另一种情况:比如,一个企业或一个网吧拥有了这一个网段IP,然后其中一个人上了这个网站,并让其他人也上,很可能只是为了分享一段什么东西。
还有一些情况下,也可能通过机器学习都认为是欺诈。比如一段时间内访问量反常地大,且浏览器都带一个相同的User-agent字段,报告的版本号都一样,可能是因为这是欺诈程序运行了。因特网上各人的浏览器的版本不同,一个时间段内难有大量的的同版本号的,这样看来如果有大量版本号相同的浏览器访问,认定上为点击期诈也不算太错。因为这个欺诈程序每次会报不同的IP,但版本号可能忘了改。但是,有什么是不可能的呢?恰恰那一时间段
也许一批人能用同一个浏览器呢?比如,这一阵某个著名的软件加上了该网站的链接,然后大量这个带有这个软件头的用户来访问了呢?
其他一些批量的数据,也能通过机器学习,找出“80%情况下是是欺诈”的数据。但是,机器学习只是机器学习,大部分情况下是对的,并不能做为证据。不能因为80%的小姐都浓妆艳抹,就认定一个浓妆艳抹的女人是鸡呀。
事实就是这样,Google当然能“感觉”到你非常非常可能进行了点击期诈,但是他绝对没有证据。当然,如果确实是欺诈,比如是Cookie都没换就换IP多次点击广告,那Google是有铁证证明你点击欺诈的!

这样也可以戏弄"博邻"

Hoo,发现一个小漏洞:
在博邻(http://www.365bloglink.com/)首页上搜”互联网,请记住我”,然后结果页中是没有结果的。但是有备选项,我选中”搜标题”,再点搜索,就有结果了。然后发现这里的投票是可以重复投票的(点推荐后刷新一次又可以推荐,估计是没有在数据库中记IP)。哈哈,于是我查看源代码,发现“推荐”二字的链接是javascript的,于是复制这一段:

javascript:votePost(‘sa9Yfdjno’, ‘divsa9YfdjnoVote’);

就在这个页面中粘贴到浏览器地址栏中,按回车就发现票数变了。再按回车,再变。一直刷到50票。不过博邻的排名没啥意思,没有成就感。
hoo,漏洞无处不在了。365bloglink还是比较知名的站了,也有js漏洞。
上次live.com邮箱被抢注,也是同样的漏洞。
看来我以后也得记住 ,客户端的js是不可相信的!

今天很开心

爽在:
1.折腾我很久的是,没有一个好用的windows下连linux的终端。secureCRT是收费软件,putty不记密码不记配置(我要连的机器太多了),poderosa好是好用,就是输中文有Bug(中文回显,每次输一个汉字出来两个),fterm不支持UTF8…. 后来把poderosa回退到4.0版,还是不行,再回退到3.0版,爽了.看来bug从4.0就开始了.
2.一直想找个MySQL GUI,因为自己的本本上有php+lighttpd可以跑phpmyadmin,但是现在公司不让在电脑上装web server,又不太好在服务器上装phpmyadmin(担心有漏洞啥的)…mysqlFront是收费的不说,还停止开发了。
最后找到一个:SQLyog.推荐大家一试。这个也是收费的,但是有免费的社区版。
3.因为有了好的终端,再装上cygwin,我可以在win下用vim了,爽得不行。
到yahoo一个半月来换到Win平台进行开发的不适终于去掉了。
4.第一个独立完成的project 经过好几次测试,确认功能完善了,可以打包了.
5.选到合适的位置了,一个月内就搬家。不用花两个小时在路上了。
….
感觉长假是很有意义的!