|
电力:只有一件事会限制Google的表现,那就是公司能买多少电。他最新的数据中心之一(编号:项目02)位于俄勒冈州的哥伦比亚河附近,这个数据中心使用着18亿瓦特低价的水力发电站的电。这并非偶然,这正是亚洲与美国网络的连接处。这个“字节工厂”有两个电脑中心,每一个都有一个足球场那么大。 GOOGL并不阅读词汇。它寻找这些文字的模式,或者是英文或者是梵语。如果它根据你的搜索请求的模式得到1000个结果,但却找到一百万个由一个类似模式得到的结果,它会把这些点连接起来,并礼貌地询问你是否愿本想要查询这些词语,尽管你的肥手指可能把“对冲基金”错拼成“对葱基金”。
广告服务器
每一个查询都同时通过一个广告数据库,与之相匹配的数据会被送至页面服务器,以便它们能出现在搜索结果显示页。广告团队在跟搜索团队赛跑。Google立志尽可能提高搜索速度。如果广告匹配的结果所花费的时间比搜索结果用时更长,它就不会呈现在页面上,Google也就不能再此项搜索上赚到钱。 页面生成器
Google的页面服务器它对某一项查询的成千上万次搜索结果收集起来,组织所有的数据,然后把这些机灵而又简单的搜索结果呈现在你浏览器的窗口中,整个过程比你读这个局在所花的时间还要短。
显示结果 一般为0.25秒,或者更短。Google机器人:Google部署了一项称为蜘蛛(spiders)的项目,为的是建立它自己的互联网副本。在一些热门的网站,googlebot可能一小时内要跟踪若干次该网站的链接。每一次搜索,“蜘蛛们”就会把每一篇文章获带脉的每一个字都保存下来。原始数据将会被搜索集群中,穿过整个工厂,并且有计划地加速替换掉那些在索引服务器和档案服务器中的数据,从而保证搜索结果是新鲜的,而非静止的。
页面排序:当GOOGLE形成了一个搜索结果清单时,通过对内容200多个因素分析,Google会决定一个网站有多可靠。这个网站的内容有多重要。Google方式的秘密是,它会通过每一个网站被其他不同网站链接的情况,对该网站的重要性做出评估,换言之,一个网站能否视为可靠,很大程度上取决于链接它的那些网站的质量。
|