Archive for 10月, 2007

 
Oct
31
Posted (xurenlu) in 未分类 on 10月-31-2007

哈,我前面的博客说最近老是丢工作,有些朋友兴奋得半夜就打电话过去问我,是不是可以考虑一起干。后面又陆陆续续收到好几个….
我刚来yahoo才两个月,这里的气氛很好。我并没有离开.这是我第一份福利齐全,一到月底工资准时到帐的工作,我没理由换呢。再者,yahoo的工程师氛围很适合我。
告示一下,不再解释。我前面说的老是丢工作,其实指的是一系列公司不人道。
另外,央视国际那边我已经向海淀区劳动局申请劳动仲裁了。其实因为没有合同,打赢的希望很渺茫。不过,关键是让后来者知道,那是一个不靠谱的地方。
以后会慢慢地放更多细节给大家。可惜的是,笔记本上被偷了,很多东西找不着了。


Tag:
相关文章


     
    Oct
    29
    Posted (xurenlu) in 未分类 on 10月-29-2007

    这个版本的wordpress在我的服务器上一直有未知Bug,
    人类发评论总是不成功。spam却一直能发。
    今天重写了一个脚本,大家可以发评论了。
    不要垃圾啊。


    Tag:
    相关文章


       
      Oct
      23
      Posted (xurenlu) in 未分类 on 10月-23-2007

      太不顺了.
      也许是因为今年本命年吧。
      第一件事是,接连丢工作。倒不是因为我个人问题.这个以后细说.
      第二件是是,我让房东把ADSL停了。结果他保留了电话,adsl,只是改成了计时收费。目的很明显,我交了300元的初装费,他背着我这么做,下次他就不需要交初装费了。但是郁闷的是,我开始用的是包月,于是路由器就一直接在电源上,从来没有拿下来过。然后最终结果是,9月份的费用是700小时*3元/小时=2100元网费。除开电卡没钱停电以外,一直在给我计费。这个纠纷就算我有理,房东手里握着押金,一时半会也不会给我。
      第三件事是就在我为第二件事郁闷时,在路上一连想一连上公交车时,电脑被偷了,差不多算是被抢了。我这一年多来业余写的一个CMS和做的rubyforge.net上的一个open source project的程序全没了。还有关于某个知名企业的特大号丑闻的证据也没了。还好存了部分在google docs和租的服务器上。
      我太不顺了。还有一些不提了。反正糟糕透顶了。完全能上joke版。
      不过我不在乎,继续我的生活。该打官司的打官司,该报案的报案,该民事调解的民事调解。
      没什么大不了。
      至少我还有这么多朋友, 有老婆支持我。


      Tag:
      相关文章


         
        Oct
        22
        Posted (xurenlu) in 未分类 on 10月-22-2007


         
        Oct
        22
        Posted (xurenlu) in 未分类 on 10月-22-2007

        呵呵,刚刚以为发现了feedsky如何统计订阅数的秘密,后来再仔细一琢磨,发现其实feedsky除开这样以外,也没有别的办法。
        feedsky不可能去反ping所有发这样的报头的IP去验证是否真的来自zhuaxia,来自google feed fetcher,费时,也不合理。因为也有一种可能,某些提供像zhuaxia一样的服务的网站并没有为每台抓取服务器弄一个子域名,也许就是一个裸IP.反ping,也不一定能得到正确结果.
        所以,是我错了
        下午向一位MM在feedsky工作的朋友说了,并把相关代码发给了他。
        当缺少一种精准的公平的时候,我不应该去嘲笑一个不是太公平的尺子。我向feedsky道个歉,我不该在他们搞活动的时候跑来搅局。
        自己加了个脚本,会在一天的最后一分钟再去feedsky跑一次,报告我的种子阅读数是负1000.
        不知道管用不?
        看了一下排名,有更疯狂作弊的.


        Tag:
        相关文章


           
          Oct
          20
          Posted (xurenlu) in 未分类 on 10月-20-2007

          刚写完一篇这样也可以戏弄”博邻”写了博邻的一个小漏洞,呵呵,又无意中发现一个漏洞。
          具体事件是这样的:

          1. <span style="color:red">
          2. 此代码已经隐藏,我向feedsky道歉。也请知道这个代码段的不要传播出来。也许我们就是为了好玩,某些人却是为了利益。feedsky没办法做到绝对公平,看上去在我发现这个漏洞这前已经有人在刷这个数据了,正如有人刷alexa排名一样。黑客精神最后往往被别有用心的人利用。</span>

          第二天就发现feedsky已经把我的订阅数改了.
          用这个来做feed订阅数统计,是不是太不靠谱了一点?


          Tag:
          相关文章




             
            Oct
            11
            Posted (xurenlu) in 杂谈 on 10月-11-2007

            假设现在这样:
            1.你,你的朋友,从北京市的各地赶来长安街的邮局,向某地寄一封信,寄件人都写上你的地址。现在收件人能知道这封信其实不是你寄的吗?不知道。因为信封上会有两个印章,一个是发件邮局的印章,一个是最后送达的邮局的印章。这几封信,收件人有证据认为它们其实是从北京市的各个地方寄出的吗?不能。
            2.反过来你从海淀区,朝阳区,顺义区分别寄三封信到同一个地址,寄件人地址也分别填写这三个地点的地址,收件人相同。信封,信件都打印出来,那现在收件人能证明这三封信其实都是一个人从一个地方寄出来的吗?不能。
            同理,Google也不能认定某两次广告点击其实最终是在一台电脑上完成的。除非它拿出证据证明。
            那么Google为什么宣称欺诈点击它都能查出来呢?
            那我们假设有这样一些IP短时间内较集中地访问了广告:

            1. 222.222.222.101
            2. 222.222.222.102
            3. 222.222.222.103
            4. 222.222.222.104
            5. 222.222.222.105
            6. 222.222.222.106
            7. 222.222.222.107
            8. ...

            他们全是一个网段IP,且紧挨着。google很可能认为,这是一个欺诈程序自动地运行,访问了广告。google可能通过一个学习机制,将这个作为一个案例。事实上也的确,在大部分情况下就是这样的。一个欺诈程序自动地运行,不断地连接ADSL,再关闭,因为是一个电话局申请的IP,所以IP换来换去就这么几个。但是,这只是可能,也可能是另一种情况:比如,一个企业或一个网吧拥有了这一个网段IP,然后其中一个人上了这个网站,并让其他人也上,很可能只是为了分享一段什么东西。
            还有一些情况下,也可能通过机器学习都认为是欺诈。比如一段时间内访问量反常地大,且浏览器都带一个相同的User-agent字段,报告的版本号都一样,可能是因为这是欺诈程序运行了。因特网上各人的浏览器的版本不同,一个时间段内难有大量的的同版本号的,这样看来如果有大量版本号相同的浏览器访问,认定上为点击期诈也不算太错。因为这个欺诈程序每次会报不同的IP,但版本号可能忘了改。但是,有什么是不可能的呢?恰恰那一时间段
            也许一批人能用同一个浏览器呢?比如,这一阵某个著名的软件加上了该网站的链接,然后大量这个带有这个软件头的用户来访问了呢?
            其他一些批量的数据,也能通过机器学习,找出“80%情况下是是欺诈”的数据。但是,机器学习只是机器学习,大部分情况下是对的,并不能做为证据。不能因为80%的小姐都浓妆艳抹,就认定一个浓妆艳抹的女人是鸡呀。
            事实就是这样,Google当然能“感觉”到你非常非常可能进行了点击期诈,但是他绝对没有证据。当然,如果确实是欺诈,比如是Cookie都没换就换IP多次点击广告,那Google是有铁证证明你点击欺诈的!


            Tag:
            相关文章


               
              Oct
              11
              Posted (xurenlu) in js on 10月-11-2007

              Hoo,发现一个小漏洞:
              在博邻(http://www.365bloglink.com/)首页上搜”互联网,请记住我”,然后结果页中是没有结果的。但是有备选项,我选中”搜标题”,再点搜索,就有结果了。然后发现这里的投票是可以重复投票的(点推荐后刷新一次又可以推荐,估计是没有在数据库中记IP)。哈哈,于是我查看源代码,发现“推荐”二字的链接是javascript的,于是复制这一段:

              1. javascript:votePost('sa9Yfdjno', 'divsa9YfdjnoVote');

              就在这个页面中粘贴到浏览器地址栏中,按回车就发现票数变了。再按回车,再变。一直刷到50票。不过博邻的排名没啥意思,没有成就感。
              hoo,漏洞无处不在了。365bloglink还是比较知名的站了,也有js漏洞。
              上次live.com邮箱被抢注,也是同样的漏洞。
              看来我以后也得记住 ,客户端的js是不可相信的!


              Tag:
              相关文章


                 
                Oct
                08
                Posted (xurenlu) in 杂谈 on 10月-8-2007

                爽在:
                1.折腾我很久的是,没有一个好用的windows下连linux的终端。secureCRT是收费软件,putty不记密码不记配置(我要连的机器太多了),poderosa好是好用,就是输中文有Bug(中文回显,每次输一个汉字出来两个),fterm不支持UTF8…. 后来把poderosa回退到4.0版,还是不行,再回退到3.0版,爽了.看来bug从4.0就开始了.
                2.一直想找个MySQL GUI,因为自己的本本上有php+lighttpd可以跑phpmyadmin,但是现在公司不让在电脑上装web server,又不太好在服务器上装phpmyadmin(担心有漏洞啥的)…mysqlFront是收费的不说,还停止开发了。
                最后找到一个:SQLyog.推荐大家一试。这个也是收费的,但是有免费的社区版。
                3.因为有了好的终端,再装上cygwin,我可以在win下用vim了,爽得不行。
                到yahoo一个半月来换到Win平台进行开发的不适终于去掉了。
                4.第一个独立完成的project 经过好几次测试,确认功能完善了,可以打包了.
                5.选到合适的位置了,一个月内就搬家。不用花两个小时在路上了。
                ….
                感觉长假是很有意义的!


                Tag:
                相关文章


                   
                  Oct
                  07
                  Posted (xurenlu) in 未分类 on 10月-7-2007

                  Yahoo统计上线很久了,但是我申请的帐号申请过后一直丢在那没管。中秋节的时候,收到公司内部邮件,知道中秋节上新版,才关注了一下。
                  现在的总统计项有:

                  1. 综合报告
                  2. 最近访客
                  3. 时段分析
                  4. 每日分析
                  5. 搜索引擎分析
                  6. 关键词分析
                  7. 访问来源分析
                  8. 访问地区分析
                  9. 被访主机分析
                  10. 被访页面分析
                  11. 访问入口分析
                  12. 访问出口分析
                  13. 客户端分析
                  14. 报警记录
                  15. 查看留言
                  16. 获取统计代码

                  与其他统计相比,功能上基本差不多,大同小异。但感觉有这么几点不同:
                  1.界面上:与51.la还有其他一些像什么武林榜一统天下啊什么的相比,清爽干净多了,没那么多广告,最下面有一条“阿里妈妈‘的广告。不像别的广告满天飞。也难怪yahoo不需要靠那点可怜的PV来做广告(事实上,为那些什么包涨alexa流量,私服联盟之类的做广告,yahoo打官司都忙不过来呢)。
                  2.可操作性上,一般.基本上信息一目了然,就点几下mouse大致看一下就完了。(初看google的统计很好玩,狂点了半天,后来也失去兴趣了。最终我还是喜欢yahoo统计这种简单点的。确实没兴趣全部挨个点完)
                  3.yahoo统计跟其他工具相比,我最喜欢的是,对于搜索引擎的关键词解析的非常准确,没于遇见乱码。其他的如51.la,google统计就差远了,不是有问号就是有乱码。
                  4.yahoo统计中的搜索引擎没有把msn.com和live.com的搜索算进去,还有有道,中搜等。只列了baidu,yahoo,sogou,google,soso.虽然这些可能份额是不大,但是做为yahoo出的东西,不能这样吧。总共没几个搜索引擎,整理一下也不怎么费事。对于我来说,live.com带来的份量不低,看不到从live.com来的流量的关键词,是有点不爽的。


                  Tag:
                  相关文章


                     
                    Oct
                    07
                    Posted (xurenlu) in 未分类 on 10月-7-2007

                    是我无意中发现的一篇妙文。
                    唉,看来BT的人大有人在。居然有人把初中英文课本中的几个人物之间的关系也研究透了。不过我当时也确实曾想过这个叫Lilei的帅帅的小伙是不是暗恋Lucy呢。
                    这个原文的链接不知道怎么显示不出来。当然,这个程序是我自己折腾出来的。我这个人就是无聊,前文说过我正在倒腾一个能解析HTML的库,后来无意中发现一个叫RfeedFinder的东东,能从站点的html页中查到Feed地址,然后就放spider出去fetch了一堆Feed回来,然后用Rss spider不停地往拉文章。


                    Tag:
                    相关文章