数字图像处理(2):数字图像基础

Last updated on November 6, 2025 am

这是SJTU-CS3324《数字图像处理》课程的知识点整理系列。本文整理部分为“第 2 章:数字图像基础”。

数字图像处理基础

  • 数字图像的分类
    • 灰度图像(Gray Scale Image):I=f(m,n)I = f(m, n)0I2550 \le I \le 255
    • 二值图像(Binary Image):f(m,n){0,1}f(m, n) \in \{0, 1\}
    • 彩色图像(Color Image):RGB 模式下,由 fr(m,n)f_r(m, n)fg(m,n)f_g(m, n)fb(m,n)f_b(m, n) 组成
    • 不可见光的图像(Image from Invisible light):伽马射线、X 射线、紫外线、红外线、微波、无线电波
    • 光谱图像(Spectrum Image):fk(m,n),k=1,,Kf_k(m, n), k = 1, \dots, K,飞机/卫星生成,用于物体识别、图像匹配
    • 图像序列(视频)(Images sequence,Video)
    • 立体图像(Stereovision):左视角 + 右视角,可用于 3D 重建
    • 射线断层图像(Tomogram Image):用于图像重建、CT
    • 带水印的图像(Image with watermark)
  • 数字图像处理
    • 底层处理:像素级别
      • 图像增强:锐化、去噪、descratch、同态滤波(homomorphic filtering)
      • 图像复原、图像压缩、图像分割
    • 中高层处理:图像分析、图像识别、图像理解、模式识别、计算机视觉
  • 图像通信系统

  • 图像质量问题
    • 客观评价:PSNR、MSE
    • 主观评价

采样与重建(Sampling & Reconstruction)

  • 采样与重建:对坐标值进行数字化称为采样,采样的逆过程是重建
  • 空间频率:单位距离内图像灰度值的变化次数
  • 采样定理(Sampling theorem):只要采样频率足够高(大于信号最高频率的 2 倍),原始的连续信号(有限带宽)就可以被完美重建,不会失真
    • 1D 情况:原始信号 f(x)f(x) 被重建的条件是

      Δx12ωu\Delta x \leq \frac{1}{2 \omega_u}

      其中 Δx\Delta x 是采样间隔,ωu\omega_uf(x)f(x) 的最高空间频率
    • 2D 情况:原始信号 f(x,y)f(x, y) 被重建的条件是

      Δx12ωuΔy12ωv\begin{gathered} \Delta x \leq \frac{1}{2 \omega_u} \\ \Delta y \leq \frac{1}{2 \omega_v} \end{gathered}

      即在 xxyy 方向上都必须满足采样定理,才能无失真地重建图像(使用理想低通滤波器
    • 注意:1D 和 2D 情况都要求原信号带宽有限(limited-band)

量化(Quantization)

  • 量化:对幅度值进行数字化称为量化,会造成图像信息损失

z=fs(m,n)f(m,n)(l bits, k=2l)z=f_s(m, n) \rightarrow f(m, n)\left(l \text { bits, } k=2^l\right)

  • 量化失真:人眼对灰度的感知有一个敏感阈值,只要选择足够大的 kk,就可以使得量化带来的失真小于这个阈值,从而人类无法察觉

辐射度学基础 (Radiometry Fundamentals)

  • 视敏度 (Visual Acuity):人眼对不同波长的光的敏感度不同,对波长为 555nm 的绿光最敏感
    • P(λ)P(\lambda):不同波长的光带来相同亮度感知时的辐射功率
    • 视敏度(Visual sensitivity):

      K(λ)=1P(λ),Km=K(555)K(\lambda)=\frac{1}{P(\lambda)}, K_m=K(555)

    • 相对视敏函数(relative visual acuity function):

      v(λ)=K(λ)Km=K(λ)K(555)=P(555)P(λ)v(\lambda)=\frac{K(\lambda)}{K_m}=\frac{K(\lambda)}{K(555)}=\frac{P(555)}{P(\lambda)}

  • 光通量(Luminous Flux):根据人眼感知定义的光的总功率,单位是  lm\mathrm{~lm}(lumen)
    • 对绿光:

      λ=555 nm,@1w,ϕ=683 lm\lambda=555 \mathrm{~nm}, @ 1 \mathrm{w}, \phi=683 \mathrm{~lm}

    • 对多色光:

      ϕ=683380780P(λ)v(λ)dλ\phi=683 \int_{380}^{780} P(\lambda) v(\lambda) d \lambda

  • 发光强度(Luminous Intensity):点光源在特定方向单位立体角内发出的光通量,单位是  cd\mathrm{~cd}(Candela)

    I=dϕdωI=\frac{d \phi}{d \omega}

  • 照度(Illuminance):单位面积上接收到的光通量,单位是  lx\mathrm{~lx}(lux)

    E=dϕdSE=\frac{d \phi}{d S}

  • 亮度(Brightness):辐射表面的明亮程度,单位是  lx/m2\mathrm{~lx/m^2}

    B=dIαdScosαB=\frac{d I_\alpha}{d S \cos \alpha}

    • 对于一个漫反射表面,其亮度与观察距离无关

色度学基础 (Colorimetry Fundamentals)

  • 光与颜色的关系
    • 不同波长的光有不同的颜色
    • 不同光的组合可能产生相同的颜色
    • 红、绿、蓝可以组成绝大多数颜色

色彩空间(Color space)

  • HSI(Hue, Saturation, Intensity)
    • 色调(H):颜色的种类
    • 饱和度(S):颜色的纯度或鲜艳程度
    • 强度(I):对应于亮度
    • Chroma(色度):Hue & saturation
  • RGB(Red, Green, Blue):用于显示器、投影仪等发光设备
    • 依据:人类的视锥细胞有三种,分别对红、绿、蓝色敏感

ΦR=380780P(λ)Vr(λ)dλΦG=380780P(λ)Vg(λ)dλΦB=380780P(λ)Vb(λ)dλ\begin{gathered} \Phi_R=\int_{380}^{780} P(\lambda) V_r(\lambda) d \lambda \\ \Phi_G=\int_{380}^{780} P(\lambda) V_g(\lambda) d \lambda \\ \Phi_B=\int_{380}^{780} P(\lambda) V_b(\lambda) d \lambda \end{gathered}

  • XYZ(CIE 1931):一个标准的、设备无关的色彩空间,包含了人类能看见的所有颜色
    • 要想获得白光,Φr:Φs:Φb=1:4.5907:0.0601\Phi_{\mathrm{r}}: \Phi_{\mathrm{s}}: \Phi_{\mathrm{b}}=1: 4.5907: 0.0601
    • 规定基色单位当量,白光由 1[R]+1[G]+1[B]1[R] + 1[G] + 1[B] 描述
    • 将 RGB 坐标转换为 XYZ 坐标:

      (XYZ)=(2.76891.75181.130214.59070.060100.05655.5943)(RGB)\left(\begin{array}{l} X \\ Y \\ Z \end{array}\right)=\left(\begin{array}{ccc} 2.7689 & 1.7518 & 1.1302 \\ 1 & 4.5907 & 0.0601 \\ 0 & 0.0565 & 5.5943 \end{array}\right)\left(\begin{array}{l} R \\ G \\ B \end{array}\right)

    • 在归一化后,所有颜色可以在 2D 平面中表示

      F=X[X]+Y[Y]+Z[Z]X+Y+Z=mx=Xm,y=Ym,z=Zmx+y+z=1\begin{gathered} F=X[X]+Y[Y]+Z[Z] \\ X+Y+Z=m^{\prime} \\ x=\frac{X}{m^{\prime}}, y=\frac{Y}{m^{\prime}}, z=\frac{Z}{m^{\prime}} \\ x+y+z=1 \end{gathered}

    • 可以用 xyY 来表示颜色,其中 Y 表示亮度(Intensity)

马蹄形CIE 1931色度图

  • 电视信号中的色彩公式 (Formulas in TV)

人类视觉系统与错觉 (Human Visual System and Illusions)

  • 视网膜上的光感受器

    • 视锥细胞(Cones):明视觉(photopic vision)
    • 视杆细胞(Rods):暗视觉(scotopic vision)
  • 亮度感知范围102106 cd/m210^{-2}-10^6 \mathrm{~cd} / \mathrm{m}^2,范围极大

    • 亮度适应时间:从暗视觉到明视觉更快
    • 适应后的感知范围:明视觉范围更大
    • 主观亮度随周围亮度变化
    • 主观亮度是光强度的对数函数
  • 韦伯比率(Weber Ratio):人眼对相对亮度有较好的判断

ξ=ΔIminI=0.018\xi = \frac{\Delta I_{\min }}{I} = 0.018

  • 分辨率(Resolution):

    • 亮度分辨率(Brightness resolution):人眼分辨不同亮度(灰度)等级的能力,韦伯比率
    • 时间分辨率(Temporal resolution):人眼分辨快速变化的图像的能力,如快速移动的物体
    • 空间分辨率(Spatial resolution):人眼分辨物体空间细节的能力,如精细的条纹
    • 空间和时间分辨率存在 tradeoff,可以应用于图像和视频编码
  • 对颜色的分辨率:人眼对彩色图像的分辨率低于灰度图像

    • 应用:视频压缩,色度分量二次采样(Sub-sampling of chrominance components)
      • 在存储时,保留全部的亮度信息,但大幅减少颜色信息的数量
  • 马赫带(Mach Bands):在不同灰度级交界处,人眼会看到不存在的亮带和暗带

  • 同时对比度(Simultaneous Contrast):同一个灰度的方块,在黑色背景下看起来比在灰色背景下更亮

  • 对比度敏感度函数 (Contrast Sensitivity Function):人眼对中等空间频率的细节最敏感,对极高(非常精细)或极低(大面积缓慢变化)的频率不敏感

  • 掩蔽效应(Masking effects): 一个强烈的视觉特征会降低我们察觉其他特征的能力

视觉质量评价 (Visual Quality Assessment)

  • 主观评价(Subjective Assessment):MOS(平均主观意见分,Mean Opinion Score),由人打分
  • 客观评价(Objective Assessment):
    • 全参考 (Full/Reduced Reference): 需要无失真的原始图像作对比
      • PSNR(峰值信噪比,Peak Signal Noise Ratio):PSNR 值越高,通常代表失真越小

      PSNR=10log1025521MNm=0M1n=0N1[f(m,n)g(m,n)]2P S N R=10 \log _{10} \frac{255^2}{\frac{1}{M N} \sum_{m=0}^{M-1} \sum_{n=0}^{N-1}[f(m, n)-g(m, n)]^2}

      • MSE(均方误差,Mean Square Error):

      MSE=1MNm=0M1n=0N1[f(m,n)g(m,n)]2M S E=\frac{1}{M N} \sum_{m=0}^{M-1} \sum_{n=0}^{N-1}[f(m, n)-g(m, n)]^2

    • 无参考 (No-Reference): 无需原始图像,直接对失真图像进行评价

参考资料

本文参考上海交通大学电子工程系《数字图像处理》课程 CS3324 闵雄阔老师的 PPT 课件整理。


数字图像处理(2):数字图像基础
https://cny123222.github.io/2025/10/28/数字图像处理-2-:数字图像基础/
Author
Nuoyan Chen
Posted on
October 28, 2025
Licensed under