图像处理入门 100 题,有人把它翻译成了中文版!

简介: 图像处理入门 100 题,有人把它翻译成了中文版!


之前,我发文推荐过一份
图像处理入门 100 题,主要针对图像处理的一些基本操作,非常适合入门!


但是,这份资源教程是由日本人写的,日文版,读起来非常不方便。好消息,最近我在逛 GitHub 的时候,发现有人将这份教程翻译成了中文版。该项目包含了 CV 领域,OpenCV 图像处理入门 100 题实例解析,并配备完整的 Pyhon 代码。


首先,放上原版日文地址:


https://github.com/yoyoyo-yo/Gasyori100knock


对应的中文版翻译地址:


https://github.com/gzr2017/ImageProcessing100Wen


image.png

Tutorial


image.png

这部分的极简教程主要是介绍图像处理开源库 OpenCV 的安装,读取、显示图像、操作像素等一些基本操作。分为 Python 版和 C++ 两种形式。


作者推荐了 OpenCV 的极简安装方法:


1. 安装 MiniConda


地址:https://conda.io/miniconda.html


2. 创建虚拟环境并激活


$ conda create python = 3.6  -  n gasyori 100
$ source actiavte gasyori 100

3. 安装包


$ pip install -r requirement.txt

其中,requirement.txt 文件在项目根目录下,下载至命令行所在目录直接运行上述命令即可。


该项目总共包含了 100 道图像处理入门题,下面分别来看一下!


问题 1-10


image.png

这部分提供了 Python 和 C++ 两种形式。例如看中值滤波算法。


Python:


import cv2
import numpy as np
# Read image
img = cv2.imread("imori_noise.jpg")
H, W, C = img.shape
# Gaussian Filter
K_size = 3
sigma = 1.3
## Zero padding
pad = K_size // 2
out = np.zeros((H + pad*2, W + pad*2, C), dtype=np.float)
out[pad:pad+H, pad:pad+W] = img.copy().astype(np.float)
## Kernel
K = np.zeros((K_size, K_size), dtype=np.float)
for x in range(-pad, -pad+K_size):
    for y in range(-pad, -pad+K_size):
        K[y+pad, x+pad] = np.exp( -(x**2 + y**2) / (2* (sigma**2)))
K /= (sigma * np.sqrt(2 * np.pi))
K /= K.sum()
tmp = out.copy()
for y in range(H):
    for x in range(W):
        for c in range(C):
            out[pad+y, pad+x, c] = np.sum(K * tmp[y:y+K_size, x:x+K_size, c])
out = out[pad:pad+H, pad:pad+W].astype(np.uint8)
# Save result
cv2.imwrite("out.jpg", out)
cv2.imshow("result", out)
cv2.waitKey(0)
cv2.destroyAllWindows()

C++ 版:


#include <opencv2/core.hpp>
#include <opencv2/highgui.hpp>
#include <iostream>
#include <math.h>
// gaussian filter
cv::Mat gaussian_filter(cv::Mat img, double sigma, int kernel_size){
  int height = img.rows;
  int width = img.cols;
  int channel = img.channels();
  // prepare output
  cv::Mat out = cv::Mat::zeros(height, width, CV_8UC3);
  // prepare kernel
  int pad = floor(kernel_size / 2);
  int _x = 0, _y = 0;
  double kernel_sum = 0;
  // get gaussian kernel
  float kernel[kernel_size][kernel_size];
  for (int y = 0; y < kernel_size; y++){
    for (int x = 0; x < kernel_size; x++){
      _y = y - pad;
      _x = x - pad;
      kernel[y][x] = 1 / (2 * M_PI * sigma * sigma) * exp( - (_x * _x + _y * _y) / (2 * sigma * sigma));
      kernel_sum += kernel[y][x];
    }
  }
  for (int y = 0; y < kernel_size; y++){
    for (int x = 0; x < kernel_size; x++){
      kernel[y][x] /= kernel_sum;
    }
  }
  // filtering
  double v = 0;
  for (int y = 0; y < height; y++){
    for (int x = 0; x < width; x++){
      for (int c = 0; c < channel; c++){
      v = 0;
      for (int dy = -pad; dy < pad + 1; dy++){
        for (int dx = -pad; dx < pad + 1; dx++){
          if (((x + dx) >= 0) && ((y + dy) >= 0)){
            v += (double)img.at<cv::Vec3b>(y + dy, x + dx)[c] * kernel[dy + pad][dx + pad];
          }
        }
      }
      out.at<cv::Vec3b>(y, x)[c] = v;
      }
    }
  }
  return out;
}
int main(int argc, const char* argv[]){
  // read image
  cv::Mat img = cv::imread("imori_noise.jpg", cv::IMREAD_COLOR);
  // gaussian filter
  cv::Mat out = gaussian_filter(img, 1.3, 3);
  //cv::imwrite("out.jpg", out);
  cv::imshow("answer", out);
  cv::waitKey(0);
  cv::destroyAllWindows();
  return 0;
}

问题 11-20


image.png

问题 21-30


image.png

问题 31-40


image.png

问题 41-50


image.png

问题 51-60


image.png

问题 61-70


image.png

问题 71-80


image.png

问题 81-90


image.png

问题 91-100


image.png

该项目最大的特色就是 100 题循序渐进,基本涵盖了 OpenCV 的关键知识点。如果你正在入门 CV,正在学习 OpenCV,那么这个项目将会是一个不错的从入门到进阶的教程。上手代码,亲自跑一跑结果,希望对大家有所帮助!

相关文章
|
监控 安全 网络安全
|
安全 Android开发 开发者
Android 原生 Picture in Picture 画中画功能避坑指南(下)
Android 原生 Picture in Picture 画中画功能避坑指南(下)
648 0
|
存储 监控 C语言
西门子S7-1200编程实例,关断延迟定时器指令如何使用?
在西门子S7-1200中有四种类型的定时器:TON接通延迟定时器、TONR保持型接通延迟定时器、TOF关断延迟定时器、TP脉冲定时器。
西门子S7-1200编程实例,关断延迟定时器指令如何使用?
|
11月前
|
人工智能 数据挖掘 Linux
DeepSeek满血版大赏:官方得了“MVP”,第三方是“躺赢狗”?
DeepSeek开源了6710亿参数的R1和2360亿参数的V3两大满血版模型,助力第三方AI平台快速提升性能。此举不仅扩大了DeepSeek的技术影响力,还通过数据飞轮效应优化模型,同时为企业级用户提供灵活变现方式。对于大众,这意味着更多选择、更低使用成本和更快技术迭代。尽管第三方平台可能“阉割”或定制功能,但它们将顶级AI带入更多场景,如比亚迪车机、腾讯元宝等,让AI更普及。官方与第三方各有所长:官方提供最强性能,第三方确保稳定体验。最终,DeepSeek与第三方共同推动AI发展,实现技术普惠。
562 2
|
6月前
|
传感器 数据可视化 定位技术
AR巡检系统:数字化传统工作流程SOP的第一步
传统巡检SOP常存在步骤遗漏、记录滞后、依赖经验等问题。AR巡检系统通过虚实融合,将SOP转化为可视化指引与智能校验流程,提升执行效率与准确性。通过SOP数字化拆解、场景化嵌入与数据闭环,实现巡检过程标准化、操作可追溯。阿法龙XR云平台助力工业智能化转型,提供高质量AR工业软件解决方案。
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
1555 64
|
编解码 开发工具 Android开发
Android平台如何实现外部RTSP|RTMP流注入轻量级RTSP服务模块(内网RTSP网关)
今天分享的是外部RTSP或RTMP流,拉取后注入到本地轻量级RTSP服务模块,供内网小并发场景下使用,这里我们叫做内网RTSP网关模块。
335 0
|
前端开发
css flex布局两个元素水平居中垂直居中
css flex布局两个元素水平居中垂直居中
389 1
|
传感器 存储 IDE
Arduino的PID库
Arduino的PID库是一个用于实现比例-积分-微分(PID)控制算法的软件库。它能帮助开发者精确控制各种需要调节的系统,如温度、速度等,通过自动调整参数来达到或维持设定值。使用简单,适用于各种Arduino项目。
1141 3
|
tengine 应用服务中间件 Linux
【Linux环境】如何在Nginx(或Tengine)服务器上安装ssl证书----介绍nginx服务器类型证书的下载与安装操作
【Linux环境】如何在Nginx(或Tengine)服务器上安装ssl证书----介绍nginx服务器类型证书的下载与安装操作
1022 0