大数据时代最重要的标志就是数据类型的多样性,各种非结构化数据逐渐成为企业数据的主流。据Gartner预测,企业数据将在五年内增加800%,其中80%是非结构化的,来自团体、社区,以及社交网络的非业务数据会成为这种趋势中的大部分。非结构化数据的爆炸式增长,使传统数据库面临巨大挑战,新型数据管理工具的作用日益凸显。 在这些新型管理工具中,Hadoop和NoSQL是最关键的两类。其中,图形数据库(graph database)是本文重点讨论的内容。图形数据库是NoSQL的一种,即非关系型数据库,它应用图形理论存储实体之间的关系信息。最常见的是社会网络中人与人之间的关系,这种关系网络用传统关系型数据库存储的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。 常见的图形数据库包括Neo4j、FlockDB。其中Neo4j是一个用Java实现、完全兼容ACID的图形数据库。数据以一种针对图形网络进行过优化的格式保存在磁盘上。Neo4j的内核是一种极快的图形引擎,具有数据库产品期望的所有特性,如恢复、两阶段提交、符合XA等  

Keywords:  


Leave a Reply

Your email address will not be published. Required fields are marked *