上QQ阅读APP看书,第一时间看更新
第1章
大数据平台技术的演进
大数据平台是数据库的一个分支,主要是指可以作为数据仓库和数据分析的平台。大数据平台是在传统数据库的基础上演进而来的,是指新一代的分布式数据库。传统数据经历了理论爆炸期、系统实现期、市场选择期,最后以Oracle、DB2、SQL Server为代表的关系型数据库占据大部分市场,纵横数据库江湖十余年。
随着互联网时代的到来,数据库软件加硬件的升级赶不上业务的需求,于是以Hadoop为核心的分布式“大数据平台”(因为和传统数据库差异较大,所以不能称之为数据库)和以Greenplum为代表的MPP架构数据库先后崛起并走向成熟。Hadoop以其扩展性强、成本低、开源生态等优势迅速抢占数据库的市场,同时也出现了兼容性差、查询性能不足、架构复杂的问题。MPP架构数据库随后登上舞台,既继承了传统数据库的ACID特性和Hadoop的分布式特性,又避免了Hadoop的复杂性,具有后发优势,被市场广泛看好。