2025年图数据库权威指南-Neo4j

全球领先的图数据库技术综述 写给关系型数据库开发人员的图数据库权威指南Neo4j Inc. 2018.1全球领先的图数据库写给关系型数据库开发人员的图数据库权威指南写给关系型数据库开发人员的图数据库权威指南 第一章、 为什么关系型数据库不是万能的? 关系型数据库(RDBMS)是非常强大的技术工具。自从上世纪八十年代起, 关系型数据库就是大多数软件和应用系统的发电站,而且这一状况今天仍然在继续。最初设计时,关系型数据库 针对的是规范的、类似纸张表格的表状数据结构, 而且它的确非常出色地满足了这种需求。对于适合的应用案例和架构,关系型数据库是存储和组织数据的最佳工具。 关系型数据库在表中存储高度结构化的数据。表通常具有事先定义好的列和包含相同类型信息的行,它们要求开发人员和应用对使用到的数据都必须严格地进行定义。 然而,在大数据时代,数据的格式和类型更加多样、数据量更大、变化更加频繁 、更新更加快速,而更重要的是数据之间的关系和联结越来越得到重视。今天对数据处理的需求和应用已经不再满足于简单的表状结构。 如果我们回顾一下历史,关系型数据库的名称来自于 E.F. Codd的关系代数中“关系”的数学概念,它具有非常特定的含义。这个名称其实和存在于现实世界中事物之间的关系没什么太大联系。 一直以来,开发人员在做的都是怎样将数据存储到关系模型的列和行中。 而这并不是现实生活中数据存在的实际形式。实事求是地说,数据更应被看作是对象, 以及存在于无数对象间的连接。 这种复杂的、存在于现实生活的数据在规模、产生速度和多样性上飞速增长 。与此同时,数据之间的关联也在以更加快速的节奏增长,这些联结往往包含着比数据本身更有价值的知识。 这就是新问题产生的根本原因:关系型数据库并非为保存和处理这种丰富的、存在于数据间的联系而设计。 为什么关系型数据库不是万能的? 1什么是图数据库? 关系型数据库和图数据库的建模比较 7查询语言的比较: SQL vs. Cypher 17 将关系数据库中的数据导入到图数据库中 29 其实并不像其名称听上去的那样,关系型数据库并不擅长处理今天高度关联的数据。其根本原因是关系型数据库并不具备足够强大的存储和管理数据项之间关系的能力。 目 录425更多资源关系型数据库并不擅长存储关系 其实并不像其名称听上去的那样,关系型数据库并不非常擅长处理今天高度关联的数据。其根本原因是关系型数据库并不具备足够强大的存储和管理数据项之间关系的能力。Neo4j Inc. 2018.2 其带来的主要问题就是,今天的企业和机构由于没有适用于处理高度关联的数据的技术手段,而错失低风险、高利润、数据驱动的决策机会。现今的软件应用都需要适应敏捷开发的要求 今天,所有的开发团队都不得不面对变化频繁的业务和用户需求,而这些变化往往要求对已有的数据架构和视图进行修改。 数据库管理员 (DBAs)和开发人员时常要应对来自业务部门改变和增加数据库元素及属性的要求,以满足经常变化的业务,例如存储最新社交平台的数据。 然而这种经常性的数据库模式的改变对关系型数据库是存在问题的,而且改变的代价昂贵。 其主要原因是关系型数据库面对变化并不能很好地适应。固定的数据库模式只适用于能够事先明确的业务问题,在不需要经常改动的情况下才能运行稳定。 缓慢和昂贵的数据库模式重设计同样对敏捷软件开发带来负面影响,它使得团队无法进行快速的创新,错失巨大的市场机会。 结论就是,关系型数据库不是为适应灵活快速的业务发展而设计的。对数据关联的查询是怎样拖垮关系型数据库性能的? 尽管有了更加先进的计算技术、更快的处理器和高速的网络,某些类型的关系型数据库应用却越来越慢。这种性能的下滑有一些众所周知的症状(参见下文关于“SQL查询的限制”部分),但究其根源总无外乎一个共同因素:对数据关系的查询。 虽然关系型数据库并非为处理连接的数据而开发和优化,但是任何试图从数据间关联中寻找答案的查询,例如推荐引擎、欺诈检测或者社交网络图,都必须使用大量的数据库表间的连接(JOIN)操作。 在关系型数据库中,对其他表中记录的引用是通过定义指向另一表中的主键属性的外键字段来表示的。参见下面图1中的一个例子。图1: 在一个关系型数据库中使用 JOIN连接Persons和Departments表,这里使用了外键约束。写给关系型数据库开发人员的图数据库权威指南Neo4j Inc. 2018. 今天的企业和机构由于没有适用于处理高度关联的数据的技术手段,而错失低风险、高利润、数据驱动的决策机会。3 表间的引用由限制来得到强制执行,但是这仅仅在引用不是可选的情况下。在执行查询时,JOIN操作比较主表和被连接表中每条记录的主键和外键的值。多数情况下,键字段建有索引以提高这种的比较操作的性能,但是即便如此,这样的操作还是会消耗大量的计算能力和内存,并且随着查询复杂度的增长而呈指数级增长。 于是,在关系型数据库中对联结的数据进行建模和存储几乎不可避免地带来极端的复杂性。这种复杂性包括长达成百上千行的SQL查询语句,有时仅仅实现了简单的功能。查询性能因着查询的复杂性、数据间关系的数量和层次,以及数据库的规模的增长而越来越糟糕。 今天的软件应用都需要满足实时处理、始终可用的要求。传统的关系型数据库在要求处理大量数据间关联的应用中已经不能胜任。关系型数据库应用受限于SQL的五大征兆 多数关系型数据库应用在其能力范围之内都可以运行地很好。但是,有些则因着数据库本身的限制而运行缓慢,特别是当关系型数据库被用来处理高度联结的数据时。 以下是试图用关系型数据库解决数据联结型问题时会遇到的五大典型征兆: 1. 有大量的连接 JOIN操作 当查询中包含了过多的表连接的时候,复杂性和计算资源消呈爆炸性地增长。这相应地增加了查询的执行时间。 2. 有大量的自连接 Self-JOIN操作 (也称作递归连接) 自连接查询在层次和树状的数据库结构中非常常见,然而,重复连接表自身以达到遍历关系的目的是非常低效的。事实是,我们见过的这世界上最长的SQL查询就包含递归的自连接。 3. 频繁变

立即下载
综合
2025-08-26
30页
3.16M
收藏
分享

2025年图数据库权威指南-Neo4j,点击即可下载。报告格式为PDF,大小3.16M,页数30页,欢迎下载。

本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图5 中国智能算力规模及预测(基于FP盩目计算),2020-2028
综合
2025-08-26
来源:2025年数字政府新进阶白皮书-IDC
查看原文
图4 政务转型的阶段划分
综合
2025-08-26
来源:2025年数字政府新进阶白皮书-IDC
查看原文
图3 中国政府行业人工智能投资,2023年-2028年
综合
2025-08-26
来源:2025年数字政府新进阶白皮书-IDC
查看原文
图2 中国人工智能和生成式人工智能支出指南,2023年-2028年
综合
2025-08-26
来源:2025年数字政府新进阶白皮书-IDC
查看原文
2023年-2025年 相关政策梳理
综合
2025-08-26
来源:2025年数字政府新进阶白皮书-IDC
查看原文
图 5-3 分布式新能源调控技术示意
综合
2025-08-26
来源:绿色转型驱动中国风光发电高质量发展展望
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起