测试平台系列(56) JSON深层次对比方案

简介: JSON深层次对比方案

大家好,我是米洛,求三连!

回顾


上一节我们引入了AceEditor帮助我们在线执行/调试SQL语句,这一届我们讲点儿断言相关的内容。

数据比对


接口测试中,我们常常需要对接口的返回参数进行校验。如果采用数据驱动的方式,涉及到多组入参/出参的比对的情况下,怎么对预期json和实际json进行一个全方位的对比呢?

今天,他来了。

其实这个话题很早以前源自于虫师selenium群大师兄精哥的指点,而我和饭佬,属于偷师成功的典范。

不过我在这个基础上也加了一点自己的东西,最终效果是一样的。

核心点


这个算法的核心点就在于递归,一层一层去递归,最终达到拿到所有差异的过程。

具体一点

具体一点,假设我们现在有2个json对象,分别是:


# 预期结果
a = """
{
    "name": "lixiaoyao",
    "age": 19,
    "wife": ["linyueru", "zhaolinger"],
    "job": {
        "yuhang": "混混",
        "suzhou": "林家堡姑爷",
        "suoyaota": "仙剑派弟子"
    }
}
"""
# 实际结果
b = """
{
    "name": "lixiaoyao",
    "age": 23,
    "wife": ["anu", "zhaolinger"],
    "job": {
        "yuhang": "混混",
        "suzhou": "林家堡姑爷",
        "suoyaota": "仙剑派子弟"
    }
}
"""

不仔细看还挺难发现这里面的差异,因为json内容不算很少,所以肉眼比较难看出来。

那么我们何不利用代码,去帮我们智能对比呢?

步步为营


确认参数

首先我们需要知道我们要比对什么,其实就是2个string,但他们是JSON格式的。

所以我们可以确定好2个基本参数: def compare(a: str, b: str)

  • a 预期结果
  • b 实际结果
    但是我们需要深层次比对,所以我们需要额外传入一些数据:
  • ans
    用来存放比对的信息,比如 123 != 124
  • path
    这个用来存放当前的路径,比如上述例子的job->suoyaota这个地方的值就不一样,一个是仙剑派弟子,另一个是仙剑派子弟,所以我们不但要记录值,还要记录他的路径。

思考


在Python中,数据结构较为简单,我们看看JSON序列化JSONDecoder类

就能大概知道了:

1.jpg

image

可以看到,基本上json的数据类型能够对应的,我们可以再简化一下:

能继续深入对比不能继续深入对比这2种。

什么意思呢?

比如a和b的name都是lixiaoyao,lixiaoyao是个字符串,当它不为json字符串的时候,是一个不能继续深入对比的数据。

所以此时我们的递归到这一层就应该终止,直接比对a和b的name字段,如果不一样,根据path,把diff结果添加到ans中。

那什么又是可深入比较对象呢?我认为有3种:

  1. List

Python的数组里面可以继续遍历,里面还有可能继续有json数据,所以可继续对比。

  1. Dict

这个不用多说了,大家都知道这个是最容易疯狂嵌套的。

  1. JSON字符串

注意他其实是字符串的一种,只不过他能被反序列化为可继续遍历的对象。

编写转换为Python对象的方法



def _to_json(string):
    try:
        float(string)
        return string
    except:
        try:
            if isinstance(string, str):
                return json.loads(string)
            return string
        except:
            return string

首先我们拿到的数据是我们期望它是一个字符串,我们最先判断它是不是数值类型,如果是,直接返回这个字符串。

为什么呢?因为这个字符串如果是数值类型,那么他已经确定不可继续遍历了,我们把它原路返回。

但因为他也可能不是字符串而是Python对象比如dict或者其他数据,所以我们接着判断他是不是字符串,如果能被反序列化又不是数值的话,那说明他就是JSON字符串,如果通通不是,那我们把数据原路返回。

这一步只是为了筛选出字符串内容为JSON的数据,如果不是则直接返回之前的数据。

编写_compare核心方法



def _compare(self, a, b, ans, path):
    a = self._to_json(a)
    b = self._to_json(b)
    if type(a) != type(b):
        ans.append(f"{self._weight(path)} 类型不一致, 分别为{type(a)} {type(b)}")
        return
    if isinstance(a, dict):
        keys = []
        for key in a.keys():
            pt = path + "/" + key
            if key in b.keys():
                self._compare(a[key], b[key], ans, pt)
                keys.append(key)
            else:
                ans.append(f"{self._weight(pt)} 在后者中不存在")
        for key in b.keys():
            if key not in keys:
                pt = path + "/" + key
                ans.append(f"{self._weight(pt)} 在后者中多出")
    elif isinstance(a, list):
        i = j = 0
        while i < len(a):
            pt = path + "/" + str(i)
            if j >= len(b):
                ans.append(f"{self._weight(pt)} 在后者中不存在")
                i += 1
                j += 1
                continue
            self._compare(a[i], b[j], ans, pt)
            i += 1
            j += 1
        while j < len(b):
            pt = path + "/" + str(j)
            ans.append(f"{self._weight(pt)} 在前者中不存在")
            j += 1
    else:
        if a != b:
            ans.append(
                f"{self._weight(path)} 数据不一致: {JsonService._color(a)} "
                f"!= {self._color(b, 1)}" if path != "" else
                f"数据不一致: {self._color(a)} != {JsonService._color(b, 1)}")

先用_to_json转为Python对象,获得ab。接着判断他们的类型是否一致,如果不一致则没必要继续比较了,比如一个是list,另一个是dict,根本没有比较的意义,直接ans.append错误信息即可,记得带上path参数。

self._weight是为了在html日志中更好地展示效果,加了一些style样式,可以先忽略。

如果类型也一致了,我们继续来看a是什么类型。

  • 如果是字典
    我们的比较是以a(预期结果)为单位的,所以一切以a为标准。
    那么我们遍历a和b的keys,分别找出a字典里面有,b字典没有的key,和b字典里面有,而a字典里面没有的key。
    注意,这里代码可以简化,字典的keys是支持集合操作的,交由大家思考优化。
    中间去遍历了a和b都有key,然后继续调用了self._compare方法,并把path改为了path+"/"+key,这样的话路径就为字典的深一层的路径了,继续递归调用。
  • 如果是list
    与dict其实类似,定义了2个指针,依次走完2个数组,当a数组已经走完了,b里面还有值,就把b里面剩下的值(属于多出的信息)都添加到错误信息之中。
    其中也获取了新的path,只不过数组是用的索引,而dict用的是key作为路径。
    接着递归。。。
  • 如果不是这2种
    注意这里是递归结束的条件,那我们直接比较。数据不一致,则把不一致的数据写到ans数组中。

大体思路就是这样,给大家看看color和weight。

2.jpg

image

测验刚才的结果


3.jpg

为了方便显示diff,我取消了文字高亮

可以看到age不一样,老婆不一样,锁妖塔的职业也不一样。所以,你学费了吗?

提高点

优化字典之间的key

最终源码+测试代码



import json
class JsonCompare:
    def compare(self, exp, act):
        ans = []
        self._compare(exp, act, ans, '')
        return ans
    def _compare(self, a, b, ans, path):
        a = self._to_json(a)
        b = self._to_json(b)
        if type(a) != type(b):
            ans.append(f"{path} 类型不一致, 分别为{type(a)} {type(b)}")
            return
        if isinstance(a, dict):
            keys = []
            for key in a.keys():
                pt = path + "/" + key
                if key in b.keys():
                    self._compare(a[key], b[key], ans, pt)
                    keys.append(key)
                else:
                    ans.append(f"{pt} 在后者中不存在")
            for key in b.keys():
                if key not in keys:
                    pt = path + "/" + key
                    ans.append(f"{pt} 在后者中多出")
        elif isinstance(a, list):
            i = j = 0
            while i < len(a):
                pt = path + "/" + str(i)
                if j >= len(b):
                    ans.append(f"{pt} 在后者中不存在")
                    i += 1
                    j += 1
                    continue
                self._compare(a[i], b[j], ans, pt)
                i += 1
                j += 1
            while j < len(b):
                pt = path + "/" + str(j)
                ans.append(f"{pt} 在前者中不存在")
                j += 1
        else:
            if a != b:
                ans.append(
                    f"{path} 数据不一致: {a} "
                    f"!= {b}" if path != "" else
                    f"数据不一致: {a} != {b}")
    def _color(self, text, _type=0):
        if _type == 0:
            # 说明是绿色
            return """<span style="color: #13CE66">{}</span>""".format(text)
        return """<span style="color: #FF4949">{}</span>""".format(text)
    def _weight(self, text):
        return """<span style="font-weight: 700">{}</span>""".format(text)
    def _to_json(self, string):
        try:
            float(string)
            return string
        except:
            try:
                if isinstance(string, str):
                    return json.loads(string)
                return string
            except:
                return string
if __name__ == "__main__":
    # 预期结果
    a = """
    {
        "name": "lixiaoyao",
        "age": 19,
        "wife": ["linyueru", "zhaolinger"],
        "job": {
            "yuhang": "混混",
            "suzhou": "林家堡姑爷",
            "suoyaota": "仙剑派弟子"
        }
    }
    """
    # 实际结果
    b = """
    {
        "name": "lixiaoyao",
        "age": 23,
        "wife": ["anu", "zhaolinger"],
        "job": {
            "yuhang": "混混",
            "suzhou": "林家堡姑爷",
            "suoyaota": "仙剑派子弟"
        }
    }
    """
    obj = JsonCompare()
    ans = obj.compare(a, b)
    print(ans)




相关文章
|
2月前
|
机器学习/深度学习 人工智能 监控
提升软件质量的关键路径:高效测试策略与实践在软件开发的宇宙中,每一行代码都如同星辰般璀璨,而将这些星辰编织成星系的过程,则依赖于严谨而高效的测试策略。本文将引领读者探索软件测试的奥秘,揭示如何通过精心设计的测试方案,不仅提升软件的性能与稳定性,还能加速产品上市的步伐,最终实现质量与效率的双重飞跃。
在软件工程的浩瀚星海中,测试不仅是发现缺陷的放大镜,更是保障软件质量的坚固防线。本文旨在探讨一种高效且创新的软件测试策略框架,它融合了传统方法的精髓与现代技术的突破,旨在为软件开发团队提供一套系统化、可执行性强的测试指引。我们将从测试规划的起点出发,沿着测试设计、执行、反馈再到持续优化的轨迹,逐步展开论述。每一步都强调实用性与前瞻性相结合,确保测试活动能够紧跟软件开发的步伐,及时适应变化,有效应对各种挑战。
|
4月前
|
Kubernetes 测试技术 Perl
混沌测试平台 Chaos Mesh
混沌测试平台 Chaos Mesh
129 1
|
16天前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法。本文介绍 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,同时提供 Python 实现示例,强调其在确保项目性能和用户体验方面的关键作用。
24 6
|
22天前
|
人工智能 供应链 安全
AI辅助安全测试案例某电商-供应链平台平台安全漏洞
【11月更文挑战第13天】该案例介绍了一家电商供应链平台如何利用AI技术进行全面的安全测试,包括网络、应用和数据安全层面,发现了多个潜在漏洞,并采取了有效的修复措施,提升了平台的整体安全性。
|
1月前
|
监控 安全 测试技术
构建高效的精准测试平台:设计与实现指南
在软件开发过程中,精准测试是确保产品质量和性能的关键环节。一个精准的测试平台能够自动化测试流程,提高测试效率,缩短测试周期,并提供准确的测试结果。本文将分享如何设计和实现一个精准测试平台,从需求分析到技术选型,再到具体的实现步骤。
108 1
|
1月前
|
Web App开发 定位技术 iOS开发
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
51 1
|
2月前
|
人工智能 监控 测试技术
云应用开发平台测试
云应用开发平台测试
66 2
|
1月前
|
监控 安全 测试技术
构建高效精准测试平台:设计与实现全攻略
在软件开发过程中,精准测试是确保产品质量的关键环节。一个高效、精准的测试平台能够自动化测试流程,提高测试覆盖率,缩短测试周期。本文将分享如何设计和实现一个精准测试平台,从需求分析到技术选型,再到具体的实现步骤。
53 0
|
2月前
|
机器学习/深度学习 存储 测试技术
从0到1:如何规划一套流量回放自动化测试方案
本文介绍了流量回放自动化测试的完整方法,从企业战略到交付的四个关键环节:Discovery(深度挖掘)、Define(定义目标)、Design(详细设计)和Delivery(交付与反馈)。通过这些步骤,帮助企业优化系统性能和稳定性,确保产品的高质量。
63 4
|
2月前
|
存储 NoSQL 大数据
大数据-51 Redis 高可用方案CAP-AP 主从复制 一主一从 全量和增量同步 哨兵模式 docker-compose测试
大数据-51 Redis 高可用方案CAP-AP 主从复制 一主一从 全量和增量同步 哨兵模式 docker-compose测试
38 3