从采样定理到多分辨率
从采样定理到多分辨率
PLAN
- 近似和近似误差
- Shannon-Whittaker 定理及其推广
- 多分辨率
近似和近似误差
数据的表示方式
- 数据属于向量空间(\(\mathbb{N}, \mathbb{R}, \mathbb{R}^d\))
- 对于连续或者离散的信号或图像,可使用希尔伯特空间的元素(正交投影定理 + 希尔伯特基(Hilbert basis))
希尔伯特空间是满足向量加法和数乘的运算规则。定义了具备正定性,线性和共轭对称性的内积。却空间中的每个柯西序列都收敛于空间中的某个元素。
如果两个向量\(x\),\(y\)满足\(\langle x, y\rangle=0\),则称它们是正交的。构成空间的基的正交向量系统被称为希尔伯特基。
- 数据存在压缩的可能
自然表示法 Natural representation
图像是一个像素矩阵,每个像素通过一个颜色空间(color space,例如 RGB、CMYK、Lab、CIE XYZ 等)以规定的比特数进行编码(例如,RGB 颜色空间中,每个像素需要\(3\times 8 = 24\)位。
考虑一部1080p的电影,每一帧的大小为:\(1920\times 1080\times 8\times 3 = 6MB\),也就是说一小时的电影位540GB。
因此压缩是必要的。
观察图像的傅里叶变化
自然图像的傅里叶变换通常分布在低频。
也就是说,存在一种可能。即我们找到一个正交归一基,使得原本的图片可以被表示为:
\[ f=\sum\left(f, e_n\right) e_n \]
这样的形式,且求和只包含重要的项。
近似 approximation
定义
设 \(B=\left(e_n\right)_{n \in \mathbb{N}}\)是一个可分希尔伯特空间的希尔伯特基(Hilbert basis)。函数 \(f \in E\) 的线性近似(linear approximation)是 \(f\) 在由 \(B\) 的前 \(N\) 个元素张成的有限维空间上的正交投影 \(f_N\)(不失一般性的):
\[ f_N = \sum_{n=0}^{N-1} (f, e_n)e_n \]
近似误差 error of approximation
近似误差被定义为:
\[ \varepsilon_1(N)=\left\|f-f_N\right\|^2=\sum_{n=N}^{+\infty}\left|\left(f, e_n\right)\right|^2 \]
Shannon-Whittaker 定理及其推广
采样规则 Regular Sampling
符号定义
对于\(f\in L^2, T>0\),定义采样:
\[ f_T=\sum_{n=-\infty}^{+\infty} f(n T) \delta_{n T} \]
其中\(\delta_{nT}\)是\(nT\)处的狄拉克函数。
\(\hat{f}_T\)是\(f_T\)的傅里叶变换,其表达式为:
\[ \hat{f}_T(\omega)=\sum_{n=-\infty}^{+\infty} f(n T) e^{-i n T \omega} \]
Shannon-Whittaker 定理
命题
对于所有\(\omega\in \mathbb R\),有:
\[ \hat{f}_T(\omega)=\sum_{n=-\infty}^{+\infty} f(n T) e^{-i n T \omega}=\frac{1}{T} \sum_{k=-\infty}^{+\infty} \hat{f}\left(\omega-\frac{2 k \pi}{T}\right) \]
通过间隔\(T\)对\(f\)进行规则采样,其傅里叶变换将呈现出\(2\pi/T\)周期性。
引理:狄拉克梳函数的傅里叶变换
\[ \mathcal{F}\left\{\sum_{n=-\infty}^{+\infty} \delta_{n T}\right\}=\sum_{n=-\infty}^{+\infty} e^{-i n T \omega}=\frac{2 \pi}{T} \sum_{k=-\infty}^{+\infty} \delta_{\frac{2 \pi k}{T}}(\omega) \]
证明:
令\(f(t)\)是一个周期为\(T\)的函数,并考虑其傅里叶级数:
\[ \omega_0=\frac{2 \pi}{T}, \quad c_n=\frac{1}{T} \int_T f(t) e^{-i n \omega_0 t} d t \]
根据傅里叶变换的性质:
\[ \mathcal{F}\{f(t)\}=\mathcal{F}\left\{\sum_{n=-\infty}^{+\infty} c_n e^{i n \omega_0 t}\right\}=\sum_{n=-\infty}^{+\infty} c_n \mathcal{F}\left\{e^{i n \omega_0 t}\right\} \]
因此:
\[ \hat{f}(\omega)=2 \pi \sum_{n=-\infty}^{+\infty} c_n \delta_{n \omega_0}(\omega) \]
对于梳函数\(f=\sum_{n=-\infty}^{+\infty} \delta_{n T}\),有\(c_n=\frac{1}{T}\)。因此:
\[ \mathcal{F}\left\{\sum_{n=-\infty}^{+\infty} \delta_{n T}\right\}=\frac{2 \pi}{T} \sum_{n=-\infty}^{+\infty} \delta_{n \omega_0}(\omega) \]
推广
对于有紧支撑弗利特变换的\(f\),可以写为:
\[ f_T=f \cdot c_T, \quad c_T=\sum_{n=-\infty}^{+\infty} \delta_{n T} \]
同样,可以将其傅里叶变换\(\hat f\)写作:
\[ \hat{f}_T=\frac{1}{2 \pi} \hat{f} * \hat{c}_T \]
根据引理,有:
\[ \hat{c}_T=\frac{2 \pi}{T} \sum_{k=-\infty}^{+\infty} \delta_{\frac{2 \pi k}{T}}(\omega) \]
更进一步的,对于\(u\in S^{'}\) ,当\(u\)与一个狄拉克函数\(\delta_a\)卷积,相当于对\(u\)进行平移:
\[ u * \delta_a=\tau_a u \]
其中,\(\tau_a\)是平移算子。即可证明:
\[ \hat{f}_T(\omega)=\frac{1}{T} \sum_{k=-\infty}^{+\infty} \hat{f}\left(\omega-\frac{2 k \pi}{T}\right) \]
定理
令\(V_T\)为所有满足傅里叶变换支撑在区间\([-\pi / T, \pi / T]\)中的\(L^2\)函数的空间。如果\(f\in V_T\),则对所有\(t\in \mathbb R\),有:
\[ f(t)=\sum_{n=-\infty}^{\infty} f(n T) h_T(t-n T) \]
其中:
\[ h_T(t)=\frac{\sin (\pi t / T)}{\pi t / T} \]
证明
假设 \(\hat{f}\) 和 \(\hat{f}\left(\cdot-\frac{2 k \pi}{T}\right)\) 对于 \(k \neq 0\) 的支撑互不重叠。则在 \(|\omega| \leq \pi / T\) 上,有:
\[ \hat{f}_T(\omega)=\frac{1}{T} \sum_{k=-\infty}^{+\infty} \hat{f}\left(\omega-\frac{2 k \pi}{T}\right) \]
中,对于\(k\ne 0\),有\(\hat{f}\left(\omega-\frac{2 k \pi}{T}\right)\ne\hat{f}(\omega)\),而当\(k\ne 0\)时,\(\hat{f}\left(\omega-\frac{2 k \pi}{T}\right)\)对\(|\omega| \leq \frac{\pi}{T}\)没有贡献。因此有:
\[ \hat{f}_T(\omega)=\frac{1}{T} \hat{f}(\omega) \]
设\(\widehat{f}(\omega)=\hat{h}_T(\omega) \hat{f}_T(\omega)\),其中\(\widehat{h}_T=T \mathbb{1}_{[-\pi / T, \pi / T]}\)。
对于\(t\in \mathbb R\),有:
\[ \begin{aligned}f(t) & =\left(h_T \star f_T\right)(t) \\& =\left(h_T \star \sum_{-\infty}^{\infty} f(n T) \delta_{n T}\right)(t) \\& =\sum_{-\infty}^{\infty} f(n T) h_T(t-n T)\end{aligned} \]
其中,
\[ h_T(t)=\frac{\sin (\pi t / T)}{\pi t / T} \]
结论
在信号处理中,Shannon-Whittaker定理指出,属于 \(V_T\) 的函数 \(f\) 可以通过以规则间隔栗样完全重建。
实际上,这一结果表明,以下集合:
\[ B=\left\{\frac{1}{T^{1 / 2}} h_T(\cdot-n T)\right\}_{n \in \mathbb{Z}} \]
是 \(V_T\) 的一个Hilbert基。
其中:
\[ h_T(t)=\frac{\sin (\pi t / T)}{\pi t / T} \]
具体来说,由于 \(\hat{h}_T=T 1_{[-\pi / T, \pi / T]}\) ,我们可以验证:对于所有 \(f \in V_T\) ,有:
\[ \begin{aligned} \left(f, \frac{1}{T^{1 / 2}} h_T(\cdot-n T)\right) & =\frac{1}{2 \pi T^{1 / 2}} \int_{-\infty}^{\infty} \widehat{f}(\omega) \widehat{h}_T(\omega) e^{\mathrm{i} n T \omega} \mathrm{~d} \omega \\ & =\frac{T^{1 / 2}}{2 \pi} \int_{-\infty}^{\infty} \widehat{f}(\omega) e^{\mathrm{i} n T \omega} \mathrm{~d} \omega=T^{1 / 2} f(n T) \end{aligned} \]
\[ \begin{aligned}\left(\frac{1}{T^{1 / 2}} h_T(\cdot-m T), \frac{1}{T^{1 / 2}} h_T(\cdot-n T)\right) & =h_T((n-m) T) \\& =\mathbb{1}_{\{n=m\}}\end{aligned} \]
以及,Parseval恒等式:
\[ \begin{aligned} f & =\sum_{n=-\infty}^{\infty} f(n T) h_T(\cdot-n T) \\ & =\sum_{n=-\infty}^{\infty}\left(f, \frac{1}{T^{1 / 2}} h_T(\cdot-n T)\right) \frac{1}{T^{1 / 2}} h_T(\cdot-n T) \end{aligned} \]
如果 \(f \in L^2\) 但 \(f \notin V_T\)
我们可以通过考虑正交投影 \(\hat{f} = P_{V_T}f\),构造一个 \(f\) 的近似 \(\hat{f}\)。
\(\hat{f}\) 可以通过在频域中进行滤波简单地获得:
\[ \hat{\widehat{f}} = 1_{[-\pi/T, \pi/T]} \hat{f} \]
正交投影 \(\hat{f}\) 会最小化 \(\| f - \hat{f} \|\)。
然而,这并不意味着 \(\hat{f}\) 在实际中是好的近似。它会去除混叠(Aliasing),但会产生Gibbs效应(Gibbs Effect)。
其他采样定理
所谓的其他采样定理,即找到其他\(h_T\)和\(V_T\),使得:
\[ f \in V_T \Longrightarrow f=\sum_n f(n T) h_T(\cdot-n T) \]
分段常数函数 Piecewise constant functions
考虑 \(h_T=1_{[0, T[}\)
集合 \(\left\{h_T(\cdot-n T)\right\}_{n \in \mathbb{Z}}\) 在 \(L^2(\mathbb{R})\) 中是正交的。进一步,由于 \(\left\|h_T(\cdot-n T)\right\|^2=T\) ,集合:
\[ B=\left\{\frac{1}{T^{1 / 2}} h_T(\cdot-n T)\right\}_{n \in \mathbb{Z}} \]
是一个正交归一集合。
用 \(V_T\) 表示由 \(\left\{\operatorname{span} h_T(\cdot-n T)\right\}_{n \in \mathbb{Z}}\) 组成的Hilbert和( \(B\) 是 \(V_T\) 的Hilbert基)。\(V_T\) 中的函数是定义在区间 \([n T,(n+1) T[\) 上的分段常数函数。
对于所有 \(f \in V_T\) :
\[ \left(f, T^{-1 / 2} h_T(\cdot-n T)\right)=T^{1 / 2} f(n T) \]
Parseval恒等式:
\[ f=\sum_{n \in \mathbb{Z}} f(n T) h_T(\cdot-n T) \]
当 \(f \notin V_T\) 时,我们仍然可以构造 \(f\) 的一个近似 \(\hat{f}=P_{V_T} f\) ,使得 \(\|f-\hat{f}\|\) 最小。 有:
\[ P_{V_T}(f)=\frac{1}{T} \sum_{n \in \mathbb{Z}}\left(f, h_T(\cdot-n T)\right) h_T(\cdot-n T) \]
其中:
\[ \frac{1}{T}\left(f, h_T(\cdot-n T)\right)=\frac{1}{T} \int_{n T}^{(n+1) T} f(t) d t \quad(f \text { 的平均值 }) \]
分段线性函数 Piecewise linear functions
考虑 \(h_T=\mathbb{1}_{[0, T[ } \star \mathbb{1}_{[0, T[ }\)
函数 \(f=\sum_{n \in \mathbb{Z}} f(n T) h_T(\cdot-n T)\) 是定义在区间 \([n T,(n+1) T[\) 上的分段线性函数。
这定义了另一个 \(V_T\) 空间,使得 \(f \in V_T\) 的函数可以通过规则采样精确重建。同样地,如果 \(f \notin V_T\) ,我们仍然可以构造一个近似 \(P_{V_T} f\) 。
如果我们希望通过函数 \(f\)(信号或图像)的规则网格值(步长为 \(T\))在计算机中存储 \(f\),只要 \(f \in V_T\),我们就可以完美地重建 \(f\)。
为了最小化信息丢失,即最小化 \(\|f - P_{V_T}f\|\),我们可能需要选择较小的 \(T\) 值(对应高分辨率)。
反之,如果我们希望压缩信号或图像,可以使用较粗的网格,即降低分辨率,在对信号进行某种低通滤波或局部平均后进行下采样。
为了解决这个问题,我们希望构造一种自适应非均匀网格,在信号快速变化的区域使用更精细的网格。
实现这一目标的一种方法是构造一个多分辨率网格层次结构:
这就是构造小波(Wavelets)的主要思想。
多分辨率:函数表示与压缩问题的尺度空间方法
目标是构建一个Hilbert基,设计如下形式的基函数:
\[ \phi_{j, n}(t)=\frac{1}{\sqrt{2^j}} \phi\left(\frac{t-2^j n}{2^j}\right) \]
其中\(j,n\in\mathbb Z\),通过缩放参数\(s = 2^j\)和平移参数\(ns\)得到。缩放因子相当于之前的\(T\)。这使得可以在不同尺度\(s\) 上对信号进行近似,并通过一系列Hilvert子空间描述信号。
多分辨率 mulyisolution
一个 \(\left(V_j\right){j \in \mathbb{Z}}\) 的 \(L^2(\mathbb{R})\) 的Hilbert子空间序列是一个多分溯率 (Multiresolution),如果它满足以下六个性质(对所有 \(j, n \in \mathbb{Z}\) ):
\(f \in V_j \Longleftrightarrow f\left(\cdot-2^j n\right) \in V_j\)
- \(V_j\) 是关于与 \(2^j\) 成比例的平移不变的;这一假设定义了一个步长为 \(s = 2^j\) 的统一网格,对应于在尺度 \(2^j\) (或分辨率 \(2^{-j}\))上构造近似。
\(f \in V_j \Longleftrightarrow f(\cdot / 2) \in V{j+1}\)(扩展比例为2)
- \(V_j\) 的函数扩展将生成在 \(V_{j+1}\) 中的函数,具有较粗的分辨率。
\(V_{j+1} \subset V_j\)
- 低分辨率空间包含在高分辨率空间中;这些空间是嵌套的。
\(\lim _{j \rightarrow-\infty} V_j=\overline{\bigcup_{j=-\infty}^{\infty} V_j}=L^2(\mathbb{R})\)
- 当分辨率趋于 \(+\infty\) (尺度趋于零)时,对于所有 \(f \in L^2(\mathbb{R})\),有:
\[ \lim_{j \to -\infty} \|f - P_{V_j} f\| = 0 \]
\(\lim _{j \rightarrow+\infty} V_j=\bigcap_{j=-\infty}^{\infty} V_j=\{0\}\)
- 分辨率趋于零时,所有的细节将丢失:
\[ \lim_{j \to +\infty} P_{V_j} f = 0 \]
存在 \(\theta \in L^2(\mathbb{R})\) ,使得 \((\theta(\cdot-n))_{n \in \mathbb{Z}}\) 是 \(V_0\) 的 Riesz基。
Riesz 基的定义 令\((\theta(\cdot-n))_{n \in \mathbb{Z}}\) 是 \(L^2(\mathbb{R})\) 的一组线性无关的函数序列。如果存在常数 \(A, B > 0\),满足对于 \(V_0\) 中的任意函数 \(f\),存在一个序列 \((a_n){n \in \mathbb{Z}} \in \mathbb{R}\),使得:
\[ f = \sum_{n = -\infty}^\infty a_n \theta(\cdot - n) \]
且满足:
\[ A \|f\|^2 \leq \sum_{n = -\infty}^\infty |a_n|^2 \leq B \|f\|^2 \]
则序列\((\theta(\cdot-n))_{n \in \mathbb{Z}}\)是Riesz基。
Riesz基类似于Hilbert基,但放宽了正交性假设。
当 \(A = B = 1\) 时,\((\theta(\cdot - n))_{n \in \mathbb{Z}}\) 是 \(V_0\) 的Hilbert基。
很容易验证,序列
\[ \left( 2^{-j/2} \theta(2^{-j} \cdot - n) \right)_{n \in \mathbb{Z}} \]
是 \(V_j\) 的Riesz基,其界限 \(A\) 和 \(B\) 在所有尺度 \(2^j\) 上相同。
示例
分段常数多分辨率
- 选择 \(\theta = 1_{[0,1[}\),于是 \((\theta(\cdot - n))_{n \in \mathbb{Z}}\) 是 \(L^2(\mathbb{R})\) 的Hilbert子空间 \(V_0\) 的Hilbert基,其中每个分段常数函数定义在区间 \([n, n+1[\) 上。
- 每个 \(V_j\) 是 \(L^2(\mathbb{R})\) 的Hilbert子空间,其上的函数在区间 \([2^j n, 2^j(n+1)[, n \in \mathbb{Z}\) 内为常数。
- 显然,\(V_j \subset V_{j-1}\),因为在较大区间上为常数的函数也在较小区间上为常数。
Shannon多分辨率
- 选择 \(\theta : t \mapsto \frac{\sin(\pi t)}{\pi t}\),于是 \((\theta(\cdot - n))_{n \in \mathbb{Z}}\) 是 \(L^2(\mathbb{R})\) 的Hilbert子空间 \(V_0\) 的Hilbert基,其中函数的傅里叶变换支撑在 \([-\pi, \pi]\) 内。
- 每个 \(V_j\) 是 \(L^2(\mathbb{R})\) 的函数集合,其傅里叶变换支撑在 \([-2^j \pi, 2^j \pi]\) 内。
样条多分辨率 Spline multiresolution
- 定义一个阶数为 \(m\) 的box样条 \(\theta_m\),通过将box \(\theta_0 = 1_{[0,1[}\) 与自身卷积 \(m\) 次,并以0或1/2为中心。
- 当 \(m\) 为偶数时,\(\theta_m\) 的支撑以 \(t = 1/2\) 为中心。
- 当 \(m\) 为奇数时,\(\theta_m\) 的支撑以 \(t = 0\) 为中心,且对称。
- 对于所有 \(m \geq 0\),\((\theta_m(\cdot - n))_{n \in \mathbb{Z}}\) 是 \(L^2\) 空间 \(V_0\) 的Riesz基,其上的函数是分段多项式(阶数为 \(m\)),定义在区间 \([n, n+1[\),且连续可微 \(m-1\) 次。
- 当 \(m > 0\) 时,计算 \(P_{V_j} f\) 并不简单。