用数据说话,看Google怎样被陷害(转)

近日,央视爆出谷歌搜索出现大量黄色词条的信息。一个引起舆论强烈反响的例子是,在谷歌搜索“儿子”竟然也能搜索到黄色词条。那么,事情是怎么发生的呢?

下面我们来看谷歌是如何被陷害的:众所周知,谷歌关键词提醒是计算机自动摘取最近最流行的关键词来生成的。于是某些人利用这一点,大量在谷歌上搜索黄色词汇,陷害了谷歌。
在谷歌搜索趋势图,Google Insights for Search,以及一些第三方的统计数据中,可以看到:

在央视曝光谷歌之前7天:
1.有人故意在谷歌大量搜索黄色词汇,使单日黄色词汇搜索量同比猛增 5950% ,单月
搜索总量与上月相比增幅达数千倍
2.这些搜索量100%来自北京
3.这些搜索量几乎呈线性急剧上升,理论上这些瞬时搜索量应该服从正态分布并是突发性
的,换句话说,这是有人故意为之。
以下再附上几张类似图表,请注意峰值全部在6月17日,即CCTV节目(6月18日)播出的前一天。

(全年统计)
(本月统计)

为做对比,说明搜索引擎的统计应该是什么样子,我来附上一张对关键词“天气预报”的搜索统计图表,从图中我们可以看到,全年搜索量应该大致呈均匀分布,考虑到搜索引擎的普及使用,会有一个逐渐升高的趋势,但绝不可能出现在某个月份呈直线上升的情况。
那么,还有一种可能,是不是北京的人们在6月份,由于夏天到来,荷尔蒙分泌过多,导致对“儿子母亲不正当关系”这样的黄色词汇搜索过多呢?我们且来看这张对关键词“日本女优”的搜索统计图表,
可以看到,对关键词“日本女优”的搜索量全年大致呈均匀分布,甚至在近期有下降的趋势。那么,这种近期全民荷尔蒙分泌过多的情况也应该被排除了。并不是说对 所有黄色信息都有大量的搜索需求。搜索数量呈急剧上升的关键词,只局限在媒体大书特书的几个词汇之中,特别要注意的是其急剧上升阶段和峰值都在媒体报道之 前,显然,这不是自然的结果,那么,答案是什么呢?是谁让谷歌如此低俗?

以上内容感谢 http://goo.gl/f0i6z 保存
原文内容 http://blog.sina.com.cn/s/blog_60676a3f0100e0xk.html 已被删除
http://www.javaeye.com/news/8465-data-words-look-at-how-google-was-set-up-carried-sina 已被删除
更多内容:http://wordpress.lixiaolai.com/archives/6835.html

开源

Q:什么是开源?

       A:开源,意为开放源代码,由Bruce Perens(曾是Debian的创始人之一)定义如下: 

          1)自由再散布(Free Distribution):获得源代码的人可自由再将此源代码散布。

           2)源代码(Source Code):程式的可执行档在散布时,必需随附完整源代码或是可让人方便的事后取得源代码。

          3)衍生著作(Derived Works):让人可依此源代码修改后,在依照同一授权条款的情形下再散布。

          4)原创作者程式源代码的完整性(Integrity of The Author’s Source Code):意即修改后的版本,需以不同的版本号码以与原始的程式码做分别,保障原始的程式码完整性。

          5)不得对任何人或团体有差别待遇(No Discrimination Against Persons or Groups):开放源代码软件不得因性别、团体、国家、族群等设定限制,但若是因为法律规定的情形则为例外(如:美国政府限制高加密软件的出口)。

           6)对程式在任何领域内的利用不得有差别待遇(No Discrimination Against Fields of Endeavor):意即不得限制商业使用。

           7)散布授权条款(Distribution of License):若软件再散布,必需以同一条款散布之。

           8)授权条款不得专属于特定产品(License Must Not Be Specific to a Product):若多个程式组合成一套软件,则当某一开放源代码的程式单独散布时,也必需要符合开放源代码的条件。

           9)授权条款不得限制其他软件(License Must Not Restrict Other Software):当某一开放源代码软件与其他非开放源代码软件一起散布时(例如放在同一光碟片),不得限制其他软件的授权条件也要遵照开放源代码的授权。

          10)授权条款必须技术中立(License Must Be Technology-Neutral):意即授权条款不得限制为电子格式才有效,若是纸本的授权条款也应视为有效。

中国为什么不能成为完全的市场经济国家?

中国为什么不能成为完全的市场经济国家?

作者:袁伟东
今天,商务部发言人在新闻发布会上对欧盟不承认中国完全市场经济地位表示失望,发言人沈丹阳说:“经过30年的改革开放,中国已经完成了由计划经济向市场经济的转轨,但是欧盟至今不承认中国的完全市场经济地位,中方对此非常失望。”其实,中国发出这样的失望之声已经数不清有多少次了,如果我们不从自身的问题去找原因、去解决问题,那么这样失望的声音恐怕要永远喊下去。我们政府有意发出这样的声音似乎是在暗示百姓:欧盟不仗义。你欧洲经济危机,我们中国拿出大把美元相救,可在承认完全市场经济地位上却百般刁难中国,道义何在?其实,我们的政府从来没有告诉百姓欧盟为什么不承认中国。

早在2007年,中国和欧盟在芬兰的赫尔辛基举行双边会谈,在会谈结束后,欧盟主席巴罗佐对记者表示:“在确定反倾销价格和成本时,这些因素都是相关的。一旦中国达到了这些标准,我们一天也不会多等。” 巴罗佐所谈的标准就是中国要求欧盟承认中国完全的市场经济国家而欧盟提出的要求中国达到的标准。

长期以来,中国一直要求欧盟承认其完全市场经济地位,但这一要求在峰会上仍被忽视。那欧盟提出的到底是什么标准呢?共有四条:其一是政府的影响力;其二是会计准则,其三破产法,其四金融服务领域的改革。巴罗佐所提的“四条标准”,与美国承认中国完全的市场经济国家所提的“标准”虽不完全相同,但基本精神是类似的,这就是要求中国经济的进一步规范化和自由化。在这四条标准中,会计准则和破产法属于真正的“技术指标”,是刚性的,我们现在正在努力实现。但另两个问题却是软性的,尤其是“政府的影响力”问题,要达到欧盟心目中的“标准”恐怕很难。因为这不是一个能不能做到的问题,而是一个愿不愿意做的问题。

“政府的影响力”标准就是要求政府减少对经济的影响力,就是让经济在公平原则的基础上自由的发展。其实这是符合经济规律,并有利于经济在健康的轨道上发展的措施。既然是好的,那我们中国为什么不愿意去做呢?

经济学家吴敬琏老先生早前在《财经》杂志撰文指出:中国自改革以来,在政府仍然在资源配置中居于主导地位条件下形成的变通性制度安排,对企业家才能的配置产生了双重影响;它即使企业家能够发挥自己的才能,从事生产性的创新活动,推动了市场形成和经济成长,同时又是寻租腐败等非生产性活动泛滥的根源所在。我在一次西部开发研讨会上同吴老先生有过交往,深刻地感悟到他对中国经济的担忧。在中国做企业,若不跟当地政府搞好关系,那什么也做不成,这已是众所周知的事,就连那些外资企业都渐渐入乡随俗,知道了跟政府“公关”的重要性。在中国,企业家把企业做的再大,你也不是真正的“老大”,真正的“老大”只能是政府。这是吴老先生说的“企业家才能的错配”,同时又造成了太多的寻租腐败的机会。而这一切,皆因为中国在“引进市场的同时,仍然在很大程度上保留了政府的主导作用”,“政府依然掌握着大量资源的分配权”,企业家不得不为获得这类资源进行非市场的激烈竞争。

吴老先生的分析一针见血的指出,解决问题的唯一办法就是政府要退出市场,由市场而不是由政府来主导资源的配置。政府一天不退出,中国就一天跟“完全的市场经济”无缘,企业家也一天成不了真正的企业家。

其实,中国不乏懂得市场经济的学者和有识之士,但他们的意见和建议为什么得不到真正的重视和采纳呢?政府为什么就不愿意退出这个已经抹了自己一身屎的“资源配置权”呢?我们的政府为什么要把一切都置于自己的严格控制之下呢?要把这些说明白,恐怕就要从政治体制上去找答案了。

—— 原载: 共识网

说说blogger.com的ftp发布

1.为什么写blogger.com的ftp发布这样一片日志?
今天写一篇比较类似教程的文章,其实早就有人做过这方面的工作了。只是我当初Goolge blogger ftp的时候并没有看到能立马让我眼前一亮的答案。弄得我一直认为ftp发布是件很神秘的事情。后来,我为用上了blogger的ftp发布而兴奋不已。在blogspot再次被封了以后,我觉得blogger.com的ftp发布功能简直就是为China GFW量身定做的。另外,zola的抓虾教程促使我也开始写这篇blogger.com的ftp发布。
2.什么是blogger.com和blogspot?
简单的说,blogger.com是Google购买的一个产品。在国外,blogger拥有超多的用户,非常流行。除了稳定、快速外这还和它强大的功能有关。那么blogspot是什么呢?这么说吧,blogger.com是用户登陆和管理blog的地方。而blogspot是blogger.com提供给用户访问自己blog的域名。比如:username.blogpsot.com。
3.关于blogspot的被封。
这里就要牵涉到GFW了,我记得好像是Great FireWall的缩写?也就是中国为了加强对互联网的控制而进行过滤的一个工具。这个东西很恼火,搞得很多国外的网站都上不去了。我们现在所说的blogger.com被封其实只能说是blogspot被封。除了你不能通过user.blogspot.com访问自己的blog外一切都是正常的。就是说,你在blogger.com写的日志都被保存了起来,如果哪天blogspot恢复,你一样可以访问到。如果哪天blogger.com也被封了,不怕死的就通过代理登录blogger来进行ftp发布吧。或者干脆就把这害人的blogger.com踢开算了!最近Google在中国遇到的麻烦也真是够多的,只能祈祷Google尽快把公关搞好了):
4.如何解决GFW造成的不能访问blogspot问题?
如果你还想访问原来blogspot的域名那只能通过
编辑windows\system32\drivers\etc\hosts 文件,然后加入72.14.219.190 xxx.blogspot.com ,其中xxx是你的用户名,即可访问到你自己的BlogSpot了。
但是,不用你电脑的人除了通过同样的方法或者代理以外也是看不到的。GG派最近在搞一个blogger的host文件列表,也就是很多人来一起把自己的用户名添加进去,大家都下载这个文件就可以访问那些活跃的blogspot用户了。精神是在可嘉!
另外一种比较好的方法就是FTP发布了。要求其实也很简单:1.你拥有一个国际域名(.cn域名现在只要1块一个,续费也和其他域名差不多,至少是便宜了一年。)2.拥有一个支持ftp上传的空间,大小不小于10M。如果你想找这种免费的空间还是很多的,像pkblogs,sitesled,当然你也可以在网上去找其他的。应该还算好找的。有了这两个条件你就可以进行blogger的ftp发布了。这样,不管以后blogspot是否被封。你只要保证你的域名和空间能用就能访问到自己的blogger了。
5.关于blogger.com的ftp发布
其实很简单,如果你用过ftp上传文件就能懂这个东西。在blogger的后台有一个选项,你只要填入你的ftp空间用户名和密码还有你希望上传你的blogger到哪个文件夹,并且将域名绑定到这个空间。你就可以在每次发布日志的时候将对应的文件写到你得这个空间的对应目录了,同时在blogger.com那里也会为你保存你的日志。但是值得注意的事,这个时候其实决定你的访问速度的是你的那个空间。因为你的国际域名绑定到了那里,你的文件也上传到了那里。blogger.com的后台扮演了一个管理和维护的角色,我想这就是blogger.com的高明之处吧。因为Movable Type和Wordpress等独立blog程序的自由度对blogger.com产生了很大的影响。blogger.com的ftp发布满足了很多人想要使用自己域名和服务器来自己掌握blog的要求,同时blogger.com的访问量会保持不变。这是一个两全其美的办法,有人喜欢Movable Type,有人喜欢wordpress,当然也有人对blogger.com的ftp功能爱不释手。
总结了blogger几个优点和缺点:
1.blogger.com会一直帮你保存数据,更换空间和域名时只要在blogger.com里重新发布即可,非常的方便。
2.空间要求很低,只要支持绑定域名和ftp,还支持html就可以搞定。
3. blogger后台对细节的一些划分还是比较完善的,尽管最新日志、最新评论、摘要等功能并不能选择。但你能通过搜索blogger hack来解决这些,在互联网上的很多blogger用户为你提供技术支持。
4.不好的地方就是你在后台做修改就要发布整个blog,有点繁琐。如果你只是修改模板的一些经常要更新的部分比如:链接之类的,完全可以事先通过使用javascript来控制,这样你就只要修改Js代码而不用重新发布了。
5.据说用ftp发布后,你原来的blogspot域名就可能被被人注册。其实你完全可以再建一个blogger,申请了这个名字):
6.FTP发布要填的选项
在blogger.com后台的发布选项里,你应该能很快的填入对应的资料。
需要注意的几点:
1.如果你把ftp路径留空,当你用这个ftp用户名和密码登录这个空间后,那blogger的文件就会存放在这个位置。如果你在里面建立一个文件夹叫做blog,你想在这个里面放置你的blogger。那你就把ftp路径填为/blog,如果你想再往里建立一个blog文件夹来存你的blogger,那就填为/blog/blog。
2.ftp已经可以上传了,那怎样访问呢?在blogger.com的后台你要设置一个博客URL选项,这个URL是怎样的呢?
a.先确定你的域名xxx.abc.com访问你空间的哪个文件夹。
b.确定存放blogger的那个文件夹和你绑定的域名访问的那个文件夹之间的关系?比如说,你将blogger文件夹放在根目录,而将域名解析也在根目录。那你的ftp路径就是留空的,你的博客url就是要设置成你解析到根目录的域名xxx.abc.com(只要解析到根目录的都能访问你的blog首页,)但是你的文章的永久链接地址就是由你在后台制定的博客url来决定了。如果你的域名解析到了根目录而想将blogger放在根目录的blog文件夹,那你就在ftp里填/blog,博客url就变成了abc.com/blog。当然,你完全可以通过把域名直接绑定到blog文件夹来让博客url变成abc.com 。简单一句话,确定你的ftp上传的文件夹和你绑定的域名访问文件夹的位置,然后你只要知道他们之间的嵌套关系就好了。
3.注意那个存档里也要设置ftp路径,最好是将它前面的ftp设成一样,方便管理。
好了,这个罗嗦完了。
6.说一下Custom Domin服务
Custom Domin真的很强,这个和FTP发布只有一个区别,就是你只要在你的域名上制定一条A记录只想google的ghs.google.com就可。你就可以通过这个域名访问你的blogger,你的永久链接里的***.blogspot.com也会由你的设置的域名而取代。而Google会为你保存所有的数据,你也可以用到blogger的所有功能。对于很多想用自己域名的朋友来说是在是太棒了!应该算是这个世界上最低廉而且兼顾乐趣的blogging方式了。可惜,这个功能只几天就被GFW掉了。应该是怕国内的主机商没前赚了吧):
好了,这篇文章写完了。如果你正在为选择blogging服务而苦恼,我告诉你blogger的FTP发布确实是个门槛低、效果不错的选择。如果你喜欢玩花样,那些blogger hack也许会让你找到乐趣的。):

使用IPv6 DNS解析IPv6域名(不必修改hosts文件)

很多网站,例如Google,都是IPv4和IPv6双线接入的,www.google.com解析对应许多个IP,其中IPv4和IPv6都有。在默认情况下,DNS服务器会返回多个IP地址,而本地机器则是根据各个地址的响应速度自动选择主机。
通常,人们会采用修改系统目录下的hosts文件,将Google的地址指定为IPv6的那个地址,使本地机器不去访问DNS服务器,而直接从本地获取IP地址进行访问。
其实,可以采用更简洁的方法,而不必修改hosts文件。
目前,一些公益组织已经提供纯IPv6协议的DNS服务器,设置IPv6的服务器,可以返回IPv6的地址(同时也返回IPv4的地址)。(注意:由于目前GFW并没有对IPv6的DNS进行封锁,用户可以通过该种方法突破一些GFW不允许访问的站点。)
设置IPv6 DNS地址为:2001:470:20::2 ,就可以轻松访问所有IPv6网站,当然前提是解析出来的所有地址中IPv6的地址响应速度最快,一个极端的解决方案是关闭IPv4协议,不过貌似很多人不喜欢没有IPv4网络的时代,至少目前是这样的。
设置完成之后,Google几乎所有的产品都可以通过IPv6访问!Cool!

Enjoy the new (future) Internet Protocol!

以上参考<http://blog.csdn.net/wangjingfei/article/details/5396845>

2012/11/2更新

Google Public DNS IP addresses
The Google Public DNS IP addresses (IPv4) are as follows:
8.8.8.8
8.8.4.4
The Google Public DNS IPv6 addresses are as follows:
2001:4860:4860::8888
2001:4860:4860::8844

来自Google

Quote Of The Day