自从 ISO 最近发布 GQL(图查询语言)标准以来,图数据库供应商和研究机构之间就它将如何影响行业进行了多次讨论。显然,它的流行得到了图数据库在不同领域的广泛应用的支持——从推荐引擎到供应链,需要一种标准的统一语言来查询和管理图数据库。
GQL 的意义在于它能够用单一的标准化查询语言替换多个特定于数据库的查询语言。这促进了图数据库之间的互操作性,并要求结束对某些图数据库供应商的依赖。此外,除了查询语言之外,GQL还定义了图数据库应该是什么,以及它应该具备哪些关键特征最终被标准化,为图数据库行业的发展奠定了深远的影响力基础。在本文中,我将带您了解 GQL 的一些重要术语,并探索其对行业的变革潜力。
GQL的关键术语和定义
GQL 旨在建立一种统一的声明式图数据库查询语言,该语言既兼容现代数据类型,又能直观地表达图的复杂逻辑。它定义了一个全面而强大的框架,用于与属性图数据库(包括 DQL、DML 和 DDL)进行交互,为图数据管理和分析提供了一种现代而灵活的方法。以下是图形数据库的开发人员或用户应注意的 GQL 的一些关键定义。
属性图数据模型
GQL 在包括节点(顶点)和边(关系)的数据模型上运行,允许基于模式的分析和灵活的数据添加。该数据模型是专门为属性图数据库量身定制的,因为GQL基于相对成熟的图查询语言,应用广泛,吸收了其优势并解决了新标准。
资源描述框架 (RDF) 曾经是另一种类型的图数据模型,它不作为标准图数据模型包含在 GQL 中。根据 GQL 定义,很明显属性图数据模型是事实上的标准。
图形模式匹配 (GPM)
GQL 定义的 GPM 语言使用户能够为复杂的数据分析编写简单的查询。传统的图形数据库查询语言支持单一模式匹配,而 GQL 进一步促进了跨多个模式的复杂模式匹配。例如,GQL 支持路径聚合、变量分组和嵌套模式匹配以及可选过滤,从而提供处理更复杂业务逻辑的表达功能。
GQL 架构
GQL 允许接受任何数据的无架构图和受“GQL 架构”中指定的预定义图类型约束的必需架构图。GQL 的这种双重方法支持两种类型的模式,可满足广泛的数据管理需求,从无模式图的灵活性到模式约束图的精度。
无模式图允许随时向节点或关系添加新属性,而无需修改数据模型。这种适应性在处理复杂和不断变化的数据时是有益的,但从另一个角度来看,无模式图将数据管理复杂性的负担(例如处理数据一致性和数据质量)转移到开发人员身上。
相反,强制模式图提供了一个严格的框架,可以保证数据的一致性和完整性。强制架构中的确定性数据结构使任何数据更改都清晰且易于管理。此外,预定义的数据结构增强了数据的可理解性和可用性,从而为用户和系统带来了优化的查询流程。虽然强制模式图可能会牺牲一些灵活性,但在数据结构定义明确且输出数据表现出规则模式的生产环境中,这种权衡通常是合理的。
图形类型
图形类型是将图形内容限制为特定节点和边类型的模板,提供一定程度的数据控制和结构。在 GQL 定义下,一个图类型可以应用于多个图,这意味着相同的图结构类型可以在不同的应用程序中共享,使其更加灵活。例如,企业的数据在不同部门、不同区域之间可能不同,并且数据权限可能相互隔离。在这种情况下,使用相同的图类型可以方便业务管理,因为具有相同图类型的多个图可以实现权限管理和数据隐私合规法规。
GQL 的显著进步
GQL 目录和 GQL 数据的分离
GQL 引用 SQL: GQL-catalog 定义了一个持久且可扩展的目录初始化运行时环境。GQL 列出其存储的数据对象,包括各种元数据,如图形、图形类型、过程、函数等。 GQL 目录可以从数据本身独立维护或升级,从而实现灵活的权限管理和统一、标准化的目录管理方法。
多图联合查询
GQL 支持多图联合查询。通过在查询过程中使用不同的图表达式,用户可以对不同的图执行并集、条件规则和联接等操作。此功能有利于反欺诈调查以及公共和私人知识图谱集成等场景,在这些场景中,交叉引用公共和私人数据集至关重要。由于数据合规性、维护等原因,这些场景既需要数据隔离,也需要集成数据分析。因此,需要将数据拆分为多个图,但需要将它们组合起来才能完成一定的业务需求。
支持无向图
与之前对关系始终具有方向的图数据库的定义不同,GQL 允许无向图。在某些情况下,顶点之间自然没有关系的方向,例如友谊。虽然可以按照指示对这些关系进行建模,但这样做需要两条单独的边,从而使建模和查询过程变得复杂。
总之,GQL的标准化是图数据库行业向前迈出的重要一步。它不仅提供了简化的用户体验,而且 GQL 还参考了现实世界的用例,规范了属性图数据库是什么以及它们应该拥有哪些功能。它提升了图形数据库对所有利用它们的行业的变革潜力。