图像处理之积分图应用三(基于NCC快速相似度匹配算法)

简介: 图像处理之积分图应用三(基于NCC快速相似度匹配算法)

图像处理之积分图应用三(基于NCC快速相似度匹配算法)


基于Normalized cross correlation(NCC)用来比较两幅图像的相似程度已经是一个常见的图像处理手段。在工业生产环节检测、监控领域对对象检测与识别均有应用。NCC算法可以有效降低光照对图像比较结果的影响。而且NCC最终结果在0到1之间,所以特别容易量化比较结果,只要给出一个阈值就可以判断结果的好与坏。传统的NCC比较方法比较耗时,虽然可以通过调整窗口大小和每次检测的步长矩形部分优化,但是对工业生产检测然后不能达到实时需求,通过积分图像实现预计算,比较模板图像与生产出电子版之间的细微差异,可以帮助企业提高产品质量,减少次品出厂率,把控质量。


一:NCC相关的数学知识


什么是NCC - (normalized cross correlation)归一化的交叉相关性,是数学上统计两组数据之间是否有关系的判断方法,貌似搞大数据分析比较流行相关性分析和计算。正常的计算公式如下:


mxn表示窗口大小,这样的计算复杂度就为O(m x n x M x N)。从上面公式就可以看出其中均值和平方和可以通过积分图预计算得到,对于模板和目标图像大小一致的应用场景来说

NCC的计算公式可以表示为如下:


其中根据积分图像可以提前计算出任意窗口大小和与平方和,这样就对

上述两个计算实现了窗口半径无关的常量时间计算,唯一缺少的是下面计算公式

通过积分图像建立起来窗口下面的待检测图像与模板图像的和与平方和以及他们的交叉乘积五个积分图索引之后,这样就完成了整个预计算生成。依靠索引表查找计算结果,NCC就可以实现线性时间的复杂度计算,而且时间消耗近似常量跟窗口半径大小无关,完全可以满足实时对象检测工业环境工作条件。


二:算法步骤


1. 预计算模板图像和目标图像的积分图


2. 根据输入的窗口半径大小使用积分图完成NCC计算


3. 根据阈值得到匹配或者不匹配区域。


4. 输出结果


为了减小计算量,我们可以要把输入的图像转换为灰度图像,在灰度图像的基础上完成整个NCC计算检测。我们这个给出的基于RGB图像的NCC计算完整代码,读者可以在此基础上修改实现单通道图像检测。


三: 运行结果:


输入的模板图像与待检测图像,左边是模板图像,右边是待检测图像,左上角有明显污点。图像显示如下:

输入待检测图像与模板比较以及检测计算出NCC的图像显示如下:

其中左侧是待检测图像,上面有黑色污点,右侧输出的非黑色区域表明,程序已经发现此区域与标准模板不同,越白的区域表示周围跟模板相同位置反差越大,越是可疑的污染点,这样就可以得到准确定位,最终带检测图像绘制最可疑红色矩形窗口区域

四:相关代码实现

1. 计算两张图像每个像素交叉乘积的积分图代码如下:

  public void caculateXYSum(byte[] x, byte[] y, int width, int height) {
    if(x.length != y.length)
      return;
    xysum = new float[width*height];
    this.width = width;
    this.height = height;
    // rows
    int px = 0, py = 0;
    int offset = 0, uprow=0, leftcol=0;
    float sp2=0, sp3=0, sp4=0;
    for(int row=0; row<height; row++ ) {
      offset = row*width;
      uprow = row-1;
      for(int col=0; col<width; col++) {
        leftcol=col-1;
        px=x[offset]&0xff;
        py=y[offset]&0xff;
        int p1 = px*py;
        // 计算平方查找表
        sp2=(leftcol<0) ? 0:xysum[offset-1]; // p(x-1, y)
        sp3=(uprow<0) ? 0:xysum[offset-width]; // p(x, y-1);
        sp4=(uprow<0||leftcol<0) ? 0:xysum[offset-width-1]; // p(x-1, y-1);
        xysum[offset]=p1+sp2+sp3-sp4;
        offset++;
      }
    }
  }

获取任意窗口大小的交叉乘积的代码如下:

  public float getXYBlockSum(int x, int y, int m, int n) {
    int swx = x + n/2;
    int swy = y + m/2;
    int nex = x-n/2-1;
    int ney = y-m/2-1;
    float sum1, sum2, sum3, sum4;
    if(swx >= width) {
      swx = width - 1;
    }
    if(swy >= height) {
      swy = height - 1;
    }
    if(nex < 0) {
      nex = 0;
    }
    if(ney < 0) {
      ney = 0;
    }
    sum1 = xysum[ney*width+nex];
    sum4 = xysum[swy*width+swx];
    sum2 = xysum[swy*width+nex];
    sum3 = xysum[ney*width+swx];
    return ((sum1 + sum4) - sum2 - sum3);
  }

其余部分的积分图计算,参见本人博客《图像处理之积分图算法》
2. 预计算建立积分图索引的代码如下:

    // per-calculate integral image for targetImage
    byte[] R = new byte[width * height];
    byte[] G = new byte[width * height];
    byte[] B = new byte[width * height];
    getRGB(width, height, pixels, R, G, B);
    IntIntegralImage rii = new IntIntegralImage();
    rii.setImage(R);
    rii.process(width, height);
    IntIntegralImage gii = new IntIntegralImage();
    gii.setImage(G);
    gii.process(width, height);
    IntIntegralImage bii = new IntIntegralImage();
    bii.setImage(B);
    bii.process(width, height);
 
    // setup the refer and target image index sum table
    rii.caculateXYSum(R, referRGB[0].getImage(), width, height);
    gii.caculateXYSum(G, referRGB[1].getImage(), width, height);
    bii.caculateXYSum(B, referRGB[2].getImage(), width, height);
    int size = (xr * 2 + 1) * (yr * 2 + 1);

3. 通过积分图查找实现快速NCC计算的代码如下:

    int r1=0, g1=0, b1=0;
    int r2=0, g2=0, b2=0;
    
    float sr1=0.0f, sg1=0.0f, sb1 = 0.0f;
    float sr2=0.0f, sg2=0.0f, sb2 = 0.0f;
    
    float xyr = 0.0f, xyg = 0.0f, xyb = 0.0f;
    
    for (int row = yr; row < height - yr; row++) {
      for (int col = xr; col < width - xr; col++) {
        
        r1 = rii.getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        g1 = gii.getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        b1 = bii.getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        
        r2 = referRGB[0].getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        g2 = referRGB[1].getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        b2 = referRGB[2].getBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        
        sr1 = rii.getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        sg1 = gii.getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        sb1 = bii.getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        
        sr2 = referRGB[0].getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        sg2 = referRGB[1].getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        sb2 = referRGB[2].getBlockSquareSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        
        xyr = rii.getXYBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        xyg = gii.getXYBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        xyb = bii.getXYBlockSum(col, row, (yr * 2 + 1), (xr * 2 + 1));
        
        float nccr = calculateNCC(r1, r2, sr1, sr2, xyr, size);
        float nccg = calculateNCC(g1, g2, sg1, sg2, xyg, size);
        float nccb = calculateNCC(b1, b2, sb1, sb2, xyb, size);
        
        outPixels[row * width + col] = (nccr + nccg + nccb);
      }
    }
    
    System.out.println("time consum : " + (System.currentTimeMillis() - time));

4. 归一化输出NCC图像与结果代码如下:

    // normalization the data
    float max = 0.0f, min = 100.0f;
    for(int i=0; i<outPixels.length; i++) {
      max = Math.max(max, outPixels[i]);
      min = Math.min(min, outPixels[i]);
    }
    
    // create output image 
    float delta = max - min;
    BufferedImage bi = new BufferedImage(width, height, BufferedImage.TYPE_INT_ARGB);
    int ry = -1;
    int rx = -1;
    for(int row = 0; row<height; row++) {
      for(int col=0; col<width; col++) {
        int gray = (int)(((outPixels[row*width+col]-min) / delta) *255);
        gray = 255 - gray;
        if(min == outPixels[row*width+col]) {
          bi.setRGB(col, row, Color.RED.getRGB());
          ry = row;
          rx = col;
        } else {
          int color = (0xff << 24) | (gray << 16) | (gray << 8) | gray;
          bi.setRGB(col, row, color);
        }
      }
    }
    if(rx > 0 && ry > 0) {
      Graphics2D g2d = image.createGraphics();
      g2d.setPaint(Color.RED);
      g2d.drawRect(rx-xr, ry-yr, xr*2, yr*2);
    }


相比传统的NCC计算方法,此方法的计算效率是传统方法几百倍提升,而且窗口越大效率提升越明显,有人对此作出的统计如下:

可见基于积分图快速NCC可以极大提升执行效率减少计算时间,实现窗口半径无关NCC比较。

最后

本文是关于积分图使用的第三篇文章,可以说积分图在实际图像处理中应用十分广泛,本人会继续努力深挖与大家分享。希望各位顶下次文以表支持, 谢谢!本人坚持分享有用实用的图像处理算法!需要大家多多支持。

相关文章
|
25天前
|
存储 监控 算法
员工上网行为监控中的Go语言算法:布隆过滤器的应用
在信息化高速发展的时代,企业上网行为监管至关重要。布隆过滤器作为一种高效、节省空间的概率性数据结构,适用于大规模URL查询与匹配,是实现精准上网行为管理的理想选择。本文探讨了布隆过滤器的原理及其优缺点,并展示了如何使用Go语言实现该算法,以提升企业网络管理效率和安全性。尽管存在误报等局限性,但合理配置下,布隆过滤器为企业提供了经济有效的解决方案。
72 8
员工上网行为监控中的Go语言算法:布隆过滤器的应用
|
25天前
|
存储 缓存 算法
探索企业文件管理软件:Python中的哈希表算法应用
企业文件管理软件依赖哈希表实现高效的数据管理和安全保障。哈希表通过键值映射,提供平均O(1)时间复杂度的快速访问,适用于海量文件处理。在Python中,字典类型基于哈希表实现,可用于管理文件元数据、缓存机制、版本控制及快速搜索等功能,极大提升工作效率和数据安全性。
62 0
|
2月前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
61 1
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
80 1
|
2月前
|
机器学习/深度学习 人工智能 算法
探索人工智能中的强化学习:原理、算法及应用
探索人工智能中的强化学习:原理、算法及应用
|
3天前
|
算法 数据安全/隐私保护 计算机视觉
基于Retinex算法的图像去雾matlab仿真
本项目展示了基于Retinex算法的图像去雾技术。完整程序运行效果无水印,使用Matlab2022a开发。核心代码包含详细中文注释和操作步骤视频。Retinex理论由Edwin Land提出,旨在分离图像的光照和反射分量,增强图像对比度、颜色和细节,尤其在雾天条件下表现优异,有效解决图像去雾问题。
|
3天前
|
算法 数据可视化 安全
基于DWA优化算法的机器人路径规划matlab仿真
本项目基于DWA优化算法实现机器人路径规划的MATLAB仿真,适用于动态环境下的自主导航。使用MATLAB2022A版本运行,展示路径规划和预测结果。核心代码通过散点图和轨迹图可视化路径点及预测路径。DWA算法通过定义速度空间、采样候选动作并评估其优劣(目标方向性、障碍物距离、速度一致性),实时调整机器人运动参数,确保安全避障并接近目标。
|
13天前
|
算法 数据安全/隐私保护
室内障碍物射线追踪算法matlab模拟仿真
### 简介 本项目展示了室内障碍物射线追踪算法在无线通信中的应用。通过Matlab 2022a实现,包含完整程序运行效果(无水印),支持增加发射点和室内墙壁设置。核心代码配有详细中文注释及操作视频。该算法基于几何光学原理,模拟信号在复杂室内环境中的传播路径与强度,涵盖场景建模、射线发射、传播及接收点场强计算等步骤,为无线网络规划提供重要依据。
|
14天前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a实现时间序列预测,采用CNN-GRU-SAM网络结构。卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征。完整代码含中文注释和操作视频,运行效果无水印展示。算法通过数据归一化、种群初始化、适应度计算、个体更新等步骤优化网络参数,最终输出预测结果。适用于金融市场、气象预报等领域。
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
|
14天前
|
算法
基于龙格库塔算法的锅炉单相受热管建模与matlab数值仿真
本设计基于龙格库塔算法对锅炉单相受热管进行建模与MATLAB数值仿真,简化为喷水减温器和末级过热器组合,考虑均匀传热及静态烟气处理。使用MATLAB2022A版本运行,展示自编与内置四阶龙格库塔法的精度对比及误差分析。模型涉及热传递和流体动力学原理,适用于优化锅炉效率。

热门文章

最新文章