无庸置疑,Google公司是当今世界信息产业的翘楚,同时,我们更应该看到,它和微软等一大批知名公司一样,也是信息技术的研究者和开拓者。且不说Google创立之初提出的PageRank算法解决了网页排名问题,在一定程度上奠定了实用的现代信息搜索产业的基础,单说最近比较热门的、跟大家生活工作密切相关的云计算和大数据,其成功应用和深入研究,正是以Google的研究成果为基础的。2003年,Google在19th ACM Symposium on Operating Systems Principles (SOSP‘03)上发表论文,提出了Google File System(GFS)[1],用以支持以搜索引擎为典型实例的大规模、分布式、数据密集应用,解决了海量数据的底层存储和检索问题。2004年,Google接着在6th Symposium on Operating Systems Design & Implementation (OSDI 2004)上发表论文,提出了MapReduce计算架构及其实现[2],解决了海量数据的分布式计算处理问题。2006年,Google又在OSDI 2006上发表论文,提出了Bigtable架构及其实现[3],解决了海量数据,尤其是海量超链接数据的结构化存储和检索问题。