近年来,人工智能(AI)与数据库的结合成为研究热点,旨在让用户能够通过自然语言与数据库进行交互,从而更便捷地获取和管理数据。然而,现有的Text2SQL和检索增强生成(RAG)等方法在处理复杂查询时存在局限性。为了解决这一问题,研究人员提出了一种名为表格增强生成(TAG)的新范式。
TAG是一种统一且通用的框架,旨在回答基于数据库的自然语言问题。它通过将语言模型(LM)的强大推理和知识能力与数据管理系统的可扩展计算能力相结合,使用户能够针对自定义数据源提出任意自然语言问题。这种结合不仅可以弥补现有方法的不足,还为AI和数据库的融合开辟了新的研究途径。
TAG模型由三个关键步骤组成:查询合成、查询执行和答案生成。首先,查询合成步骤将用户的自然语言请求转化为可执行的数据库查询。然后,查询执行步骤在数据库系统中执行该查询,以高效地计算相关数据。最后,答案生成步骤利用语言模型和相关数据生成最终的自然语言答案。
为了评估TAG的性能,研究人员开发了一系列基准测试,并发现标准方法在回答查询方面的准确率不超过20%。这表明在处理需要语义推理或世界知识的查询时,现有方法存在明显的局限性。然而,通过使用手工编写的TAG管道,研究人员发现准确率可以提高20%至65%。
尽管TAG模型在处理复杂查询方面取得了显著进展,但仍存在一些挑战。首先,TAG模型的实现需要对数据库和语言模型有深入的理解,这对于非专业人士来说可能具有挑战性。其次,TAG模型的性能在很大程度上取决于所使用的语言模型的质量和数据的可用性。