继前面创建的项目一个个悄无声息以后,我又创建了一个开源项目hyer: http://code.google.com/p/hyer/ 这是一个python写就的spider,目前很小,只有几K,但是已经可以支持robots.txt协议和cookies,并且加入了事件机制,因为可以方便地为这个项目开发插件。有了插件的支持,这个spider就可以用来做各种各样的事情,用在各种目的上。 举些例子: A.在网页设计师做好静态网页时,往往将链接设为”#”.在php程序员套程序时,经常有一些链接会忘了修改过来,留下很多置为”#”的坏链接。hyer在解析网页是遇到链接时,会产生一个new_original_url的事件,如果您的插件,设定在这个事件中检查新链接是否为”#”,如果是“#”就输出一个提示和当前页面的地址。这样这个插件就可以帮我们检查整个站点的程序套完了没有,有没有链接没有修改。 B.同上,在某个链接无法访问是,也有一个事件:url_fetch_error被激发。如果我们的插件设定此时输入URL地址,就可以做成一个死链检查工具。 … 有兴趣的同学可以一起做。我建了一个讨论组: http://groups.google.com/group/hyer-spider
本人做菜特点:油多。。。。 此菜原料:
过程:
特点:
35.自2002年以来,南京、成都、石家庄等地相继发生奶农把鲜奶倒入下水道的事件。另据2004年7月15日中央电视台《经济半小时》报道,进入夏季之后,浙江某市160多户奶农也频频把鲜奶倒入水沟,有时在一天内倒掉14吨。倒奶那几天,畜牧兽医站的工作人员分头外出,帮助奶农联系收购鲜奶的企业,但收效甚微。时隔一年,这样的事件又见诸媒体。2005年8月 11日新华网报道,陕西某村十几家奶农无奈把鲜奶倒进污水沟。为帮助奶农售奶,当地政府联系了一家公司,收奶价格是每公斤1.2元。可就是这样的低价,该企业后来也不收了。人们不禁要问:如今牛奶多得喝不完了吗?其实,全球年人均奶类消费量为93公斤,中国仅为7.2公斤。奶农倒奶固然与牛奶易变质且不能大量贮存有关,但前几年一些地方农民一窝蜂地饲养奶牛,鲜奶的供应大量增加。同时,很多企业纷纷介入乳品加工业,有些产品尚未达标上市,消费者不敢购买。当乳品销路不好时,企业便限量收购鲜奶。 根据以上材料回答问题 (1)历史上资本主义国家经济危机时农场主把牛奶倒入大海的现象,与材料中的“倒奶事件”有何本质区别?(3分) (2)“倒奶事件”中隐含着什么样的经济规律?(3分) (3)为避免发生类似的“倒奶事件”,你认为地方政府应如何作为?(4分) 参考答案: (1)从表象看,两者都是牛奶供给过剩。但是,前者反映的是生产社会化与生产资料资本主义私有制之间的矛盾,是资本主义生产关系与生产力矛盾的体现;后者主要是市场体系不够完善,鲜奶销售渠道不畅导致的结果,不是经济危机的征兆。(3分) (2)这个案例说明,价值规律是商品经济的基本规律,它通过市场机制自发地起作用,不依人的意志为转移,具有客观性。人们过多、过快地把生产资料和劳动力投入到奶牛养殖和乳品加工行业,一旦供过于求,企业就会压缩鲜奶收购量,奶农只好倒奶。(2分)这个案例还说明,市场调节具有盲目性和滞后性,导致了试?的浪费,政府有必要对市场进行适度干预,逐步提高驾驭市场的能力。(1分) (3)由于奶农和企业往往缺乏充分的信息和对市场风险足够的认识,因此,地方政府有必要予以引导和服务。如着力帮助奶农和企业进行市场预测和分析,开展事前的供需调研;制定科学、合理的产业规划,形成较为完善的农业产业化链条;采取优惠措施,帮助企业和奶农开拓乳品市场,尤其是农村市场,扩大内需;监督奶农和企业严格执行产品质量标准,促使其改进生产技术。(4分) 现在请看视频: http://v.youku.com/v_show/id_XNDM0ODg2MDA=.html 那这倒牛奶又是因为什么呢?
前一阵,不知道怎么回事,一直没有什么软件可以更新。后来终于知道, 原来是fedora的仓库服务器被hack了一把,因引暂停了更新服务。 后来某天我突然发现又可以更新了,呵呵。很开心,赶紧更新了一大堆软件,并且还新装了几个玩意儿。 首先装了一下叫gnome-do的软件,这个软件是mono写的,嘿嘿,就是linux下的dotNet啦。这个软件功能很简单,就是启动程序或是文档。很小巧,功能也很精巧,界面很漂亮,而且,很关键的,很实用!难能可贵的是,他的数据库文档是mdb格式,哈哈,是windows下的access的格式吗?我没有Oiffce Access,不知道倒底是不是。 另外还装了一个很酷的输入法,叫ibus.这个不是iphone上的软件啊。本来我的本本上scim一直运行的很好,没啥不妥,可就试了一下ibus,立马喜欢上了,特点:
用python写就…虽然是用python,仍然很高效,使用了dbus来做消息接口。 配置可以马上生效。那个scim中启用输入法什么的要重新启动scim本身才行。 响应特别快。比scim快多了。感觉很爽。
嘿嘿,特别推荐一下。
1.存钱。分多个银行存。别存外资银行了就。搞点黄金。这东西有用。 2.别买股票。 3.趁现在经济危机还没开始,做好准备工作。 4.别轻易换工作。与朋友们搞好关系。多准备几个备选的职位备选。 5.如果有机会多认识几个猎头,不知道能不能管用~ 6.别贷款买房。别买花钱又多但不是非用不可的东西,比如汽车。 7.如果有可能,跟乡下亲戚搞好关系。 8.毛主席说了,要打持久战~要搞全民运动,要搞运动战。实在不行,回农村去,农村是有广阔的天地的。 9:有人说,某些人啊,在路人看到一堆屎,也要数,”1,2,3…”尽量凑够十堆。我就不往十堆上凑了。我留一个空位。
七十七年以前的今天.大家不要忘记。
我们都知道,要做WD,首先得伺侯好几个浏览器:IE6,IE7,Firefox.一般的页面,都只要求在IE6,IE7,Firefox下正常工作就行了。 但是实际上,浏览器远远不止这几个,Firefox分为Firefox 1.5,Firefox 2,Firefox 3几个主要版本,IE7,IE6中也各有好几个系列,另外除开这两个主流厂商的产品之外,还有Opera,Konqueror,Netscape,chrome等一系列。 这些浏览器,各有各的一套,往往在这里运行正常,在那里运行就不正常了。于是WD们拆东边补西边,终于能在几个浏览器下都正常了。结果,产品经理又有了新的需求,需要在哪儿哪儿那儿改一下,于是乎,好不容易糊弄好的的纸架子一下子倒塌了,WD们又忙得焦头烂额。之所以这么说,因为,这是我的经验。 大凡是WD,总是收集了一堆Css Hacking 技巧,为的是在各个浏览器下正常。网上一搜,一大堆。 然而,首先WD们没有弄清楚一个基本问题,我们为什么需要css Hacking?如果有1000种浏览器,我们是不是要记住1000种浏览器的Hack 技巧? 事实上, Css Hacking从某种程度上说,是一个拿不上台面的东西。Css Hacking有很多技巧,纯粹就是利用了浏览器的Bug.比如常见的用_class{….} 去区别IE和firefox,按理说_class是一个不合法的标记方法。Css Hacking的出现,是WD们不得已而为之,WD们的日常工作并不是疯狂地Css Hack. 其实这么多浏览器,并不是可以随便乱来,想自己定义个啥就定义个啥标记的。人们习惯了在标准的世界里生活,在网页世界里,也有一系列标准。浏览器们也都努力地做到web标准兼容。但是有些浏览器出道得早,可以说后来出现的web标准就是在它们的影响下诞生的。还有一个,当年非常牛B,所以做了很多创新,没有把web标准放在心上,蛮不在乎。更何况,标准自身也是在不断更新的。因此,一般各个浏览器产品系统都曾有过一段没有不太在乎web标准的日子,后来大家都意识到不行了,我们大家都妥协一下,要制订一套标准,大家都遵守。可是以前各家都有自己制订的一些小条条小框框,他们不符合标准,咋办呢? 于是,这些人想了个法子:标准模式和怪异模式。另外还有一种,叫“近乎标准模式”,almost standard.要说真是够怪异,我都听晕了。别着急,听我慢慢道来。 不是说了吗,这些老大们坐在一起,制定了各式各样的标准,以后大家都按这套标准来解释网页。如果你做的网页可以按这套标准来解释,那就用一个标记doctype注明这是可以按web标准来解释的。这就是标准模式。 那以前各家都生产过,规定过的小九九们不符合标准,咋办啊?也不能就马上把它们全扔掉不要了吧?软件上大抵有这样一套原则,叫向下兼容。在怪异模式下,各个浏览器都模拟那些老版本的浏览器的操作,以防止老的页面无法工作。在网页没有指定doctype时,浏览器一般就都按怪异模式工作,以防老页面无法工作。
对于这两种模式之间的差异,最显著的例子涉及Windows上IE专有的框模型。在IE 6出现时,在标准模式中使用正确的框模型,在怪异模式中使用老式的专有框模型。为了维持对IE 5和更低版本的向后兼容性,Opera 7和更高版本也在怪异模式中使用有缺点的IE框模型。 Mozilla和Safari还有第三种模式,称为“几乎标准的模式(almost standards mode)”,除了在处理表格的方式方面有一些细微的差异之外,这种模式与标准模式相同。
正是由于这个原因,您可以丢掉很多css hacking技巧了。有些书介绍说,IE6和firefox的盒模型(或者有的地方叫框模型)不一致,因此需要这样做hack:
div{ width:100px; *width:95px; }
我说,这种书真是误人子弟。因为,只要正确指定了doctype,这些浏览器解释上的差异就都不存在了,我们按照标准来就行了。 这个模式的指位于HTML文件开头的DOCTYPE域指定的。一般常见的有这几种:
HTML 4.01 Transitional: HTML 4.01 Frameset XHTML 1.0 Strict XHTML 1.0 Transitional
XHTML 1.0 Frameset XHTML 1.1
1.淘宝的成长靠的是百度吗? 不是。靠的是那些流量在一天100ip,200ip,顶多1万IP的千千万万中小网站。 2.百度的流量可以忽略吗? 不可以。百度的流量还是很大的。百度摇摆一下,多少网站着涼。 3.淘宝真得可以封得了百度的访问吗? 封不了的。如果百度想通过抓取淘宝的网页进行学习和完善自己的产品、数据,他是不需要遵守robots.txt的协议的。 4.没有百度的流量,淘宝就完了吗? 不会。某人好像说过,根据CNNIC的报告,三分之一的购物者来自搜索引擎。CNNIC的报告嘛…嗯 是在愚人节出的吧?就算是真的有三分之一来源于搜索引擎,这话从CNNIC的报告里出来我倒反而不信了。 5.没有百度,淘宝的用户就搜不了商品了吗? 淘宝的商品搜索技术来自中国雅虎的搜索团队。事实上从改换技术到雅虎平台后,商品搜索的用户体验是大幅提高了。你可以不认可中国雅虎的产品和推广,但是你不能否认它的技术。 6.围绕C2C,二者都有些啥武器? 淘宝有:支付手段:支付宝(占据国内在线支付的最大市场),IM工具(除开QQ,MSN,好像淘宝旺旺的用户数是第三了).阿里巴巴B2B.雅虎搜索(市场是小了点)和邮箱(这也是一宝,用户基数大,可以发直邮广告),资讯(PV比较少),另外对于广告诉求,淘宝还有个阿里妈妈,起步才一年 百度:有支付手段:百付宝(起步),IM工具(百度Hi,f起步中),B2C处于招商阶段,搜索(国内市场最大,一大金矿),贴吧,百度空间,也有部分资讯类业务(百度财经之类),百度空间 嘿嘿 基本上淘宝这边有的百度都在做了,但是很多人料想的邮箱,百度却放弃没有做。… 嗯 看来这场戏有看头。前面完胜易趣,再看后面淘宝如何和百度这位搜索一哥过招儿。
淘宝屏掉了百度的spider.一时间议论纷纷,好事者甚至说看到淘宝固步自封因而自取灭亡。实际上,屏蔽搜索引擎的,不止淘宝一家。一些封闭社区,SNS,也都屏蔽掉了搜索引擎。只是因为屏搜索引擎的网站比较少,看起来比较另类,搞得好像屏搜索引擎就不合法了一样。 但是实际上,这事真没啥不妥。人家淘宝自己就是不希望百度的程序来抓它的页面,人家遵守robots.txt文件约定制定了规则,有啥不行的?就像某地的酒店,原来一开始大家都认为,如果你不喝酒,你也可以只坐在那喝免费的茶水。后来忽然来了一家酒店,你不喝酒,他就不欢迎你进去了,于是喝惯了免费的茶水的人们就觉得这一家实在很嚣张…人家都提供免费茶水,你为啥不能提供呢?但是人家是酒店,为什么一定要提供免费茶水呢? 当然,这事还是一件大事,至少说明了好几个问题:
1.以前淘宝和百度是合作伙伴,以前淘宝花不少钱买百度的竟价排名,通过百度进行了网站的推广,获得了一定的流量和收益。百度乐得挣钱,两家和和气气。现在,两家已经在台面上公开竟争了。 2.阿里巴巴上市了,百度不乐意了。本来中国互联网我是大佬一个,忽然冒出来一个不起眼的小子,抢了我的风头。我百度掐着多少小网站的喉咙,一向风光无限,怎能受这口气?于是我也要上B2C,我也要上C2C.我要继续做老大。没想到,一向没有哪个网站敢说不要从我百度过去的流量,淘宝怎么可以对我说不?淘宝封百度,百度很生气,后果很严重。 3.淘宝能大大方方地屏百度的程序,当然是深思熟虑了的。淘宝已经坐稳了国内C2C交易的头把交椅,现在需要的是规范市场, 引导市场,不能再做搅局者。因此只要淘宝坚持不犯错,一切就都OK。百度在搜索市场是大佬,做电子商务还是学生。淘宝要做的,就是挡。挡住百度的一切进攻就是胜利。这说明,一来淘宝已经掌控了局面,不再依赖百度或是任何一家搜索引擎。没有搜索引擎,淘宝仍然玩得转。二来,说明,百度确确实实是一个潜在的劲敌,否则犯着不淘宝做任何动作。
当然,我的观点是,淘宝应该封百度。淘宝绝不可以坐待对手长大。就算今天,明天,后天百度都还在为淘宝带来流量,可是一旦百度C2C长大,百度搜索迟早会把用户导向他自己的C2C,与其这样,不如早点丢掉那点流量。没有了百度导入的流量,顶多再花点钱做线下推广和品牌建设。商场上只有胜负,没有宽容和仁慈。坐等对手长大,才是真正的蠢货。 淘宝封百度,我以为这样是对的,这样才有魄力。有人说这对淘宝而言是一场豪赌。而实际上,百度宣布进军C2C的时候,就已经挑起了一场大赌。实际上在线购物的市场,还远远没有被开发,市场还大有空间。今后几年,我们一定能看到其他的打擂者。 没有百度,也会千度万度们来抢淘宝的蛋糕。
传闻说淘宝封了百度. 请看: http://www.taobao.com/robots.txt 原来传闻是真的。