压缩感知的核心问题和基础理论 2025-11-04
压缩感知(Compressive Sensing)问题的核心在于:如何从y = A x y = A x y = A x 中重建一个 s-稀疏(s-sparse) 向量 x x x 。
其中,A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N 被称为测量矩阵(measurement matrix) ,且 m < N m < N m < N 。
因此,上述线性方程组是欠定的(underdetermined),但希望通过稀疏性假设可以帮助识别原始的稀疏向量 x x x 。
核心问题在于两种不同的情境:
测量方案是否应当允许对所有 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 进行重建;
或者,我们仅要求:给定某个特定的 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N ,测量方案能够重建这个特定的向量。
第二种情形乍看之下似乎不自然,因为向量 x x x 事先未知。但当矩阵 A A A 随机选择且稀疏向量 x x x 固定时,这种情况在分析恢复保证(nonuniform recovery guarantees)时会变得重要。最小测量数 m m m 取决于具体情境:
在第一种情况下,m = 2 s m = 2s m = 2 s ;
在第二种情况下,m = s + 1 m = s + 1 m = s + 1 。
如果还要求重建方案稳定(stable) (此处的“稳定”含义稍后会更精确定义),则所需的最小测量数还会额外包含一个 ln ( N / s ) \ln(N/s) ln ( N / s ) 因子。因此,仅仅 2 s 2s 2 s 个测量是不足以保证稳定恢复的。
在区分上述两种情境之前,值得注意以下两个性质的等价性:
(a) 若 x ∈ C N x \in \mathbb{C}^N x ∈ C N 是方程 A z = y A z = y A z = y 的唯一 s s s -稀疏解,则有:
{ z ∈ C N : A z = A x , ∥ z ∥ 0 ≤ s } = { x } . \{ z \in \mathbb{C}^N : A z = A x, \| z \|_0 \le s \} = \{ x \}. { z ∈ C N : A z = A x , ∥ z ∥ 0 ≤ s } = { x } .
(b) 向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 可以通过如下优化问题唯一重建:
min z ∈ C N ∥ z ∥ 0 subject to A z = y . (P0) \min_{z \in \mathbb{C}^N} \| z \|_0 \quad \text{subject to} \quad A z = y. \tag{P0} z ∈ C N min ∥ z ∥ 0 subject to A z = y . ( P0 )
事实上,如果 x ∈ C N x \in \mathbb{C}^N x ∈ C N 是 A z = y A z = y A z = y 的唯一 s s s -稀疏解,那么问题 (P0) 的最优解 x # x^\# x # 也必定是 s s s -稀疏的,并且满足 A x # = y A x^\# = y A x # = y ,因此 x # = x x^\# = x x # = x 。
这说明 (a) ⇒ (b)。反之 (b) ⇒ (a) 也显然成立。
在给出这一情形的主要结果之前,我们首先注意到:欠定线性系统中稀疏解的唯一性可以通过多种方式重新表述。
关键记号
设 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N ,并令 S ⊂ [ N ] S \subset [N] S ⊂ [ N ] 。
子矩阵 A S A_S A S :我们用记号 A S A_S A S 表示矩阵 A A A 中仅由索引集合 S S S 中的列构成的子矩阵。
子向量 x S x_S x S :对于 x ∈ C N x \in \mathbb{C}^N x ∈ C N ,我们记 x S x_S x S 为一个与 x x x 在 S S S 中的分量一致、在 S S S 外为零的 C N \mathbb{C}^N C N 向量。形式化地写为:
定理 1 (唯一性与零空间)
设 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N ,以下性质等价:
(a) 每个 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 都是方程 A z = A x A z = A x A z = A x 的唯一 s s s -稀疏解。换言之,若 A x = A z A x = A z A x = A z ,且 x , z x, z x , z 均为 s s s -稀疏向量,则 x = z x = z x = z 。
(b) 矩阵 A A A 的零空间(null space)不包含任何非零的 2 s 2s 2 s -稀疏向量,即:
ker A ∩ { z ∈ C N : ∥ z ∥ 0 ≤ 2 s } = { 0 } . \ker A \cap \{ z \in \mathbb{C}^N : \|z\|_0 \le 2s \} = \{ 0 \}. ker A ∩ { z ∈ C N : ∥ z ∥ 0 ≤ 2 s } = { 0 } .
(c) 对任意满足 card ( S ) ≤ 2 s \text{card}(S) \le 2s card ( S ) ≤ 2 s 的索引集 S ⊂ [ N ] S \subset [N] S ⊂ [ N ] ,子矩阵 A S A_S A S 是单射的(injective) 。
(d) 矩阵 A A A 的任意 2 s 2s 2 s 列是线性无关的。
证明:
(a) ⇔ (b): 设 x , z x, z x , z 为 s s s -稀疏向量,且 A x = A z A x = A z A x = A z 。则 x − z x - z x − z 为 2 s 2s 2 s -稀疏,且满足 A ( x − z ) = 0 A(x - z) = 0 A ( x − z ) = 0 。若 ker A \ker A ker A 不包含任何非零的 2 s 2s 2 s -稀疏向量,则 x = z x = z x = z 。
反之,若对所有 s s s -稀疏向量 x x x 都有唯一性性质
{ z ∈ C N : A z = A x , ∥ z ∥ 0 ≤ s } = { x } , \{ z \in \mathbb{C}^N : A z = A x, \|z\|_0 \le s \} = \{x\}, { z ∈ C N : A z = A x , ∥ z ∥ 0 ≤ s } = { x } ,
设 v ∈ ker A v \in \ker A v ∈ ker A 是 2 s 2s 2 s -稀疏的。我们可以取 v = x − z v = x - z v = x − z ,其中 x , z x, z x , z 是两个 s s s -稀疏向量,且其支撑集 supp ( x ) ∩ supp ( z ) = ∅ \text{supp}(x) \cap \text{supp}(z) = \emptyset supp ( x ) ∩ supp ( z ) = ∅ 。由 A x = A z A x = A z A x = A z 与唯一性假设可得 x = z x = z x = z ,因此 v = 0 v = 0 v = 0 。
(b) ⇔ (c) ⇔ (d): 对任意 2 s 2s 2 s -稀疏向量 v v v ,设 S = supp ( v ) S = \text{supp}(v) S = supp ( v ) ,则有 A v = A S v S A v = A_S v_S A v = A S v S 。
当 S S S 在所有满足 card ( S ) ≤ 2 s \text{card}(S) \le 2s card ( S ) ≤ 2 s 的子集上取遍时,v v v 在所有 2 s 2s 2 s -稀疏向量上取遍。这意味着 A S A_S A S 单射等价于 A A A 的任意 2 s 2s 2 s 列线性无关,从而完成证明。
注(最小测量数):
我们特别注意到: 若希望从测量向量 y = A x ∈ C m y = A x \in \mathbb{C}^m y = A x ∈ C m 中重建任意 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N ,则上面的条件 (a) 成立,因此 (d) 也成立。这意味着:
rank ( A ) ≥ 2 s . \text{rank}(A) \ge 2s. rank ( A ) ≥ 2 s .
由于矩阵秩至多等于行数,因此需要的测量数 m m m 满足:
m ≥ 2 s . m \ge 2s. m ≥ 2 s .
定理 2 (Vandermonde 矩阵构造)
对于任意整数 N ≥ 2 s N \ge 2s N ≥ 2 s ,存在一个测量矩阵 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N ,其行数 m = 2 s m = 2s m = 2 s ,使得任意 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 都可以从测量向量 y = A x ∈ C m y = A x \in \mathbb{C}^m y = A x ∈ C m 中被恢复,且该 x x x 是优化问题 (P₀) 的解。
证明:
令 t N > t N − 1 > ⋯ > t 2 > t 1 > 0 t_N > t_{N-1} > \cdots > t_2 > t_1 > 0 t N > t N − 1 > ⋯ > t 2 > t 1 > 0 ,
并考虑如下矩阵 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N (其中 m = 2 s m = 2s m = 2 s ):
A = [ 1 1 ⋯ 1 t 1 t 2 ⋯ t N ⋮ ⋮ ⋱ ⋮ t 1 2 s − 1 t 2 2 s − 1 ⋯ t N 2 s − 1 ] . (2) A = \begin{bmatrix} 1 & 1 & \cdots & 1 \\ t_1 & t_2 & \cdots & t_N \\ \vdots & \vdots & \ddots & \vdots \\ t_1^{2s-1} & t_2^{2s-1} & \cdots & t_N^{2s-1} \end{bmatrix}. \tag{2} A = 1 t 1 ⋮ t 1 2 s − 1 1 t 2 ⋮ t 2 2 s − 1 ⋯ ⋯ ⋱ ⋯ 1 t N ⋮ t N 2 s − 1 . ( 2 )
取一个指标集合 S = { j 1 < j 2 < ⋯ < j 2 s } S = \{ j_1 < j_2 < \cdots < j_{2s} \} S = { j 1 < j 2 < ⋯ < j 2 s } , 于是子矩阵 A S ∈ C 2 s × 2 s A_S \in \mathbb{C}^{2s \times 2s} A S ∈ C 2 s × 2 s 是一个范德蒙矩阵(Vandermonde matrix)的转置:
det ( A S ) = ∣ 1 1 ⋯ 1 t j 1 t j 2 ⋯ t j 2 s ⋮ ⋮ ⋱ ⋮ t j 1 2 s − 1 t j 2 2 s − 1 ⋯ t j 2 s 2 s − 1 ∣ = ∏ k < ℓ ( t j ℓ − t j k ) > 0. \det(A_S) = \begin{vmatrix} 1 & 1 & \cdots & 1 \\ t_{j_1} & t_{j_2} & \cdots & t_{j_{2s}} \\ \vdots & \vdots & \ddots & \vdots \\ t_{j_1}^{2s-1} & t_{j_2}^{2s-1} & \cdots & t_{j_{2s}}^{2s-1} \end{vmatrix} = \prod_{k < \ell} (t_{j_\ell} - t_{j_k}) > 0. det ( A S ) = 1 t j 1 ⋮ t j 1 2 s − 1 1 t j 2 ⋮ t j 2 2 s − 1 ⋯ ⋯ ⋱ ⋯ 1 t j 2 s ⋮ t j 2 s 2 s − 1 = k < ℓ ∏ ( t j ℓ − t j k ) > 0.
这表明 A S A_S A S 是可逆的 ,从而是单射的(injective)。由于定理 1 的条件 (c) 得到满足,每个 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 都是方程 A z = A x A z = A x A z = A x 的唯一 s s s -稀疏解,因此可以作为问题 (P₀) 的解被成功恢复。
拓展讨论:其他矩阵构造
许多其他矩阵同样满足定理 1 的条件 (c)。
完全正矩阵 (Totally Positive Matrix) :
例如,在式 (2) 的矩阵中,t 1 , … , t N t_1, \ldots, t_N t 1 , … , t N 的整数幂不必一定是连续整数 0 , 1 , … , 2 s − 1 0, 1, \ldots, 2s-1 0 , 1 , … , 2 s − 1 。我们不必固定一个与 t N > ⋯ > t 1 > 0 t_N > \cdots > t_1 > 0 t N > ⋯ > t 1 > 0 相关的 Vandermonde 矩阵,而可以从任意一个**完全正(totally positive)**的矩阵 M ∈ R N × N M \in \mathbb{R}^{N \times N} M ∈ R N × N 出发。完全正矩阵是指对于任意相同基数的索引集 I , J ⊂ [ N ] I, J \subset [N] I , J ⊂ [ N ] ,其子矩阵 M I , J M_{I,J} M I , J 的行列式满足 det M I , J > 0 \det M_{I,J} > 0 det M I , J > 0 ,其中 M I , J M_{I,J} M I , J 表示由 I I I 索引行、J J J 索引列的子矩阵。
接着,我们选取 M M M 的任意 m = 2 s m = 2s m = 2 s 行(索引集合记作 I I I ),构造矩阵 A A A 。对于任意基数为 2 s 2s 2 s 的索引集 S ⊂ [ N ] S \subset [N] S ⊂ [ N ] ,矩阵 A S A_S A S 便退化为 M I , S M_{I,S} M I , S ,因此它是可逆的。
部分傅里叶矩阵 (Partial Fourier Matrix) :
再举一例:数值 t N , … , t 1 t_N, \ldots, t_1 t N , … , t 1 不必是正数或实数,只需满足 det ( A S ) ≠ 0 \det(A_S) \ne 0 det ( A S ) = 0 (而非 det ( A S ) > 0 \det(A_S) > 0 det ( A S ) > 0 )即可。特别地,当我们取
t ℓ = e i 2 π ( ℓ − 1 ) / N , ℓ ∈ [ N ] , t_\ell = e^{i 2\pi (\ell - 1)/N}, \quad \ell \in [N], t ℓ = e i 2 π ( ℓ − 1 ) / N , ℓ ∈ [ N ] ,
部分傅里叶矩阵
A = [ 1 1 1 ⋯ 1 1 e i 2 π / N e i 2 π 2 / N ⋯ e i 2 π ( N − 1 ) / N ⋮ ⋮ ⋮ ⋱ ⋮ 1 e i 2 π ( 2 s − 1 ) / N e i 2 π ( 2 s − 1 ) 2 / N ⋯ e i 2 π ( 2 s − 1 ) ( N − 1 ) / N ] A = \begin{bmatrix} 1 & 1 & 1 & \cdots & 1 \\ 1 & e^{i 2\pi /N} & e^{i 2\pi 2 /N} & \cdots & e^{i 2\pi (N-1)/N} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & e^{i 2\pi (2s-1)/N} & e^{i 2\pi (2s-1)2/N} & \cdots & e^{i 2\pi (2s-1)(N-1)/N} \end{bmatrix} A = 1 1 ⋮ 1 1 e i 2 π / N ⋮ e i 2 π ( 2 s − 1 ) / N 1 e i 2 π 2/ N ⋮ e i 2 π ( 2 s − 1 ) 2/ N ⋯ ⋯ ⋱ ⋯ 1 e i 2 π ( N − 1 ) / N ⋮ e i 2 π ( 2 s − 1 ) ( N − 1 ) / N
同样允许从 y = A x ∈ C 2 s y = A x \in \mathbb{C}^{2s} y = A x ∈ C 2 s 中重建任意 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 。
关于 (P0) 的可行性
事实上,与定理 2 的证明类似的论证表明:对于任意满足 det ( A S ) = 0 \det(A_S) = 0 det ( A S ) = 0 的子集 S ⊂ [ N ] S \subset [N] S ⊂ [ N ] 、且 card ( S ) ≤ 2 s \text{card}(S) \le 2s card ( S ) ≤ 2 s 的矩阵,其集合在 ( 2 s ) × N (2s) \times N ( 2 s ) × N 矩阵空间中 Lebesgue 测度为零。因此,大多数 ( 2 s ) × N (2s) \times N ( 2 s ) × N 矩阵都允许从 y = A x ∈ C 2 s y = A x \in \mathbb{C}^{2s} y = A x ∈ C 2 s 中恢复任意 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 。
一般而言,直接求解 (P₀) 的重建过程在实践中不可行(即这是一个NP-Hard的问题),但在傅里叶测量的情形下,可以使用基于 Prony 方法(Prony’s method) 的更优重建方案。
定理 3 (Prony 方法与可行重建)
对于任意 N ≥ 2 s N \ge 2s N ≥ 2 s ,存在一种可行的重建方法 ,可从前 m = 2 s m = 2s m = 2 s 个离散傅里叶测量中重建任意 s s s -稀疏向量。
证明:
设 x ∈ C N x \in \mathbb{C}^N x ∈ C N 是一个 s s s -稀疏向量,将其视为一个定义在 { 0 , 1 , … , N − 1 } \{0, 1, \ldots, N-1\} { 0 , 1 , … , N − 1 } 上的函数,支持集为 S ⊂ { 0 , 1 , … , N − 1 } S \subset \{0,1,\ldots,N-1\} S ⊂ { 0 , 1 , … , N − 1 } ,其中 ∣ S ∣ = s |S| = s ∣ S ∣ = s 。我们观测到其前 2 s 2s 2 s 个离散傅里叶系数:
x ^ ( j ) : = ∑ k = 0 N − 1 x ( k ) e − i 2 π j k / N , 0 ≤ j ≤ N − 1. \hat{x}(j) := \sum_{k=0}^{N-1} x(k)e^{-i2\pi jk/N}, \quad 0 \le j \le N-1. x ^ ( j ) := ∑ k = 0 N − 1 x ( k ) e − i 2 πjk / N , 0 ≤ j ≤ N − 1.
考虑一个次数为 s s s 的三角多项式:
p ( t ) : = ∏ k ∈ S ( 1 − e − i 2 π k / N e i 2 π t / N ) . p(t) := \prod_{k \in S} (1 - e^{-i2\pi k/N} e^{i2\pi t/N}). p ( t ) := ∏ k ∈ S ( 1 − e − i 2 πk / N e i 2 π t / N ) .
此多项式在 t ∈ S t \in S t ∈ S 时取零,因此我们希望通过确定 p p p (或等价地,其傅里叶变换 p ^ \hat{p} p ^ )来恢复未知的集合 S S S 。
由于 x x x 在补集 S ‾ \overline{S} S 上为零,因而对所有 0 ≤ t ≤ N − 1 0 \le t \le N-1 0 ≤ t ≤ N − 1 有:
p ( t ) x ( t ) = 0. p(t)x(t) = 0. p ( t ) x ( t ) = 0.
由离散卷积可得:
p ^ ∗ x ^ = 0 , \hat{p} * \hat{x} = 0, p ^ ∗ x ^ = 0 ,
即
( p ^ ∗ x ^ ) ( j ) : = ∑ k = 0 N − 1 p ^ ( k ) x ^ ( j − k m o d N ) = 0 , ∀ 0 ≤ j ≤ N − 1. (2.6) (\hat{p} * \hat{x})(j) := \sum_{k=0}^{N-1} \hat{p}(k)\hat{x}(j - k \bmod N) = 0, \quad \forall 0 \le j \le N-1. \tag{2.6} ( p ^ ∗ x ^ ) ( j ) := k = 0 ∑ N − 1 p ^ ( k ) x ^ ( j − k mod N ) = 0 , ∀0 ≤ j ≤ N − 1. ( 2.6 )
由于 p p p 的次数为 s s s ,我们有:
p ^ ( 0 ) = 1 , p ^ ( k ) = 0 对于 k > s . \hat{p}(0) = 1, \quad \hat{p}(k) = 0 \text{ 对于 } k > s. p ^ ( 0 ) = 1 , p ^ ( k ) = 0 对于 k > s .
因此我们需要确定 p ^ ( 1 ) , … , p ^ ( s ) \hat{p}(1), \ldots, \hat{p}(s) p ^ ( 1 ) , … , p ^ ( s ) 。
取方程 (2.6) 中的 s ≤ j ≤ 2 s − 1 s \le j \le 2s-1 s ≤ j ≤ 2 s − 1 ,得到如下线性方程组:
x ^ ( s ) + p ^ ( 1 ) x ^ ( s − 1 ) + ⋯ + p ^ ( s ) x ^ ( 0 ) = 0 , x ^ ( s + 1 ) + p ^ ( 1 ) x ^ ( s ) + ⋯ + p ^ ( s ) x ^ ( 1 ) = 0 , ⋮ x ^ ( 2 s − 1 ) + p ^ ( 1 ) x ^ ( 2 s − 2 ) + ⋯ + p ^ ( s ) x ^ ( s − 1 ) = 0. \begin{aligned} \hat{x}(s) + \hat{p}(1)\hat{x}(s-1) + \cdots + \hat{p}(s)\hat{x}(0) &= 0, \\ \hat{x}(s+1) + \hat{p}(1)\hat{x}(s) + \cdots + \hat{p}(s)\hat{x}(1) &= 0, \\ &\vdots \\ \hat{x}(2s-1) + \hat{p}(1)\hat{x}(2s-2) + \cdots + \hat{p}(s)\hat{x}(s-1) &= 0. \end{aligned} x ^ ( s ) + p ^ ( 1 ) x ^ ( s − 1 ) + ⋯ + p ^ ( s ) x ^ ( 0 ) x ^ ( s + 1 ) + p ^ ( 1 ) x ^ ( s ) + ⋯ + p ^ ( s ) x ^ ( 1 ) x ^ ( 2 s − 1 ) + p ^ ( 1 ) x ^ ( 2 s − 2 ) + ⋯ + p ^ ( s ) x ^ ( s − 1 ) = 0 , = 0 , ⋮ = 0.
即矩阵形式为:
[ x ^ ( s − 1 ) x ^ ( s − 2 ) ⋯ x ^ ( 0 ) x ^ ( s ) x ^ ( s − 1 ) ⋯ x ^ ( 1 ) ⋮ ⋮ ⋱ ⋮ x ^ ( 2 s − 2 ) x ^ ( 2 s − 3 ) ⋯ x ^ ( s − 1 ) ] [ p ^ ( 1 ) p ^ ( 2 ) ⋮ p ^ ( s ) ] = − [ x ^ ( s ) x ^ ( s + 1 ) ⋮ x ^ ( 2 s − 1 ) ] . \begin{bmatrix} \hat{x}(s-1) & \hat{x}(s-2) & \cdots & \hat{x}(0) \\ \hat{x}(s) & \hat{x}(s-1) & \cdots & \hat{x}(1) \\ \vdots & \vdots & \ddots & \vdots \\ \hat{x}(2s-2) & \hat{x}(2s-3) & \cdots & \hat{x}(s-1) \end{bmatrix} \begin{bmatrix} \hat{p}(1) \\ \hat{p}(2) \\ \vdots \\ \hat{p}(s) \end{bmatrix} = - \begin{bmatrix} \hat{x}(s) \\ \hat{x}(s+1) \\ \vdots \\ \hat{x}(2s-1) \end{bmatrix}. x ^ ( s − 1 ) x ^ ( s ) ⋮ x ^ ( 2 s − 2 ) x ^ ( s − 2 ) x ^ ( s − 1 ) ⋮ x ^ ( 2 s − 3 ) ⋯ ⋯ ⋱ ⋯ x ^ ( 0 ) x ^ ( 1 ) ⋮ x ^ ( s − 1 ) p ^ ( 1 ) p ^ ( 2 ) ⋮ p ^ ( s ) = − x ^ ( s ) x ^ ( s + 1 ) ⋮ x ^ ( 2 s − 1 ) .
由于 x ^ ( 0 ) , … , x ^ ( 2 s − 1 ) \hat{x}(0), \ldots, \hat{x}(2s-1) x ^ ( 0 ) , … , x ^ ( 2 s − 1 ) 已知,可以求得 p ^ ( 1 ) , … , p ^ ( s ) \hat{p}(1), \ldots, \hat{p}(s) p ^ ( 1 ) , … , p ^ ( s ) 。虽然此 Toeplitz 矩阵并非总是可逆(例如取 x = [ 1 , 0 , … , 0 ] ⊤ x = [1,0,\ldots,0]^\top x = [ 1 , 0 , … , 0 ] ⊤ 时不可逆),但我们可以找到某个解 q ^ ( 1 ) , … , q ^ ( s ) \hat{q}(1), \ldots, \hat{q}(s) q ^ ( 1 ) , … , q ^ ( s ) ,并定义q ^ ( 0 ) = 1 , q ^ ( k ) = 0 \hat{q}(0) = 1, \hat{q}(k) = 0 q ^ ( 0 ) = 1 , q ^ ( k ) = 0 对 k > s k > s k > s 。于是有:
( q ^ ∗ x ^ ) ( j ) = 0 , s ≤ j ≤ 2 s − 1. (\hat{q} * \hat{x})(j) = 0, \quad s \le j \le 2s-1. ( q ^ ∗ x ^ ) ( j ) = 0 , s ≤ j ≤ 2 s − 1.
这意味着 s s s -稀疏向量 q ⋅ x q \cdot x q ⋅ x 的傅里叶变换q ⋅ x ^ = q ^ ∗ x ^ \widehat{q \cdot x} = \hat{q} * \hat{x} q ⋅ x = q ^ ∗ x ^ 在连续的 s s s 个频率上为零。
由此可得 q ⋅ x = 0 q \cdot x = 0 q ⋅ x = 0 ,即三角多项式 q q q 在集合 S S S 上取零。由于 q q q 的次数至多为 s s s ,其零点集恰好为 S S S 。
因此,我们可以通过以下方式恢复 S S S :
求解 p ( t ) = 0 p(t) = 0 p ( t ) = 0 的根;
或找出 ∣ p ( j ) ∣ |p(j)| ∣ p ( j ) ∣ 最小的 s s s 个位置。
最后,通过前 2 s 2s 2 s 个傅里叶系数建立的线性方程组可解出 x ( j ) , j ∈ S x(j), \quad j \in S x ( j ) , j ∈ S 。
注(Prony 方法的局限性):
尽管此重建过程在理论上优雅,但存在重要缺陷:它对稀疏性误差不稳定,也不具备对测量误差的鲁棒性。
我们将在第 11 章证明:任何稳定的 s s s -稀疏重建方法都至少需要 m ≈ c s ln ( e N / s ) m \approx c\, s \ln(eN/s) m ≈ c s ln ( e N / s ) 次测量,其中 c > 0 c > 0 c > 0 是依赖于稳定性条件的常数。
在这一设定下,s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N 是事先固定的 ,随后才选择测量矩阵 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N 。
此时,使得 x x x 成为与测量 y = A x y = A x y = A x 一致的唯一 s s s -稀疏向量的条件,依赖于 A A A 和 x x x 本身。乍看之下这似乎不自然,因为 x x x 在选择 A A A 前未知。但其背后的思想是:对于“多数” ( s + 1 ) × N (s+1) \times N ( s + 1 ) × N 的矩阵,条件自然成立。这在实际中是合理的,因为测量矩阵常常随机选取。
定理 4 (固定向量的恢复)
对于任意 N ≥ s + 1 N \ge s + 1 N ≥ s + 1 ,给定一个 s s s -稀疏向量 x ∈ C N x \in \mathbb{C}^N x ∈ C N ,存在一个具有 m = s + 1 m = s + 1 m = s + 1 行的测量矩阵 A ∈ C m × N A \in \mathbb{C}^{m \times N} A ∈ C m × N ,使得向量 x x x 可以从测量向量 y = A x ∈ C m y = A x \in \mathbb{C}^m y = A x ∈ C m 中唯一恢复,且 x x x 是问题 (P₀) 的解。
证明:
设 A ∈ C ( s + 1 ) × N A \in \mathbb{C}^{(s+1) \times N} A ∈ C ( s + 1 ) × N 。假设该矩阵不能 通过 ℓ 0 \ell_0 ℓ 0 -最小化从 y = A x y = A x y = A x 恢复 s s s -稀疏向量 x x x 。
则存在一个与 x x x 不同的向量 z ∈ C N z \in \mathbb{C}^N z ∈ C N ,其支持集为 S = supp ( z ) = { j 1 , … , j s } S = \text{supp}(z) = \{ j_1, \ldots, j_s \} S = supp ( z ) = { j 1 , … , j s } ,且满足 A z = A x A z = A x A z = A x 。若 ∥ z ∥ 0 < s \|z\|_0 < s ∥ z ∥ 0 < s ,则补齐 S S S 至大小为 s s s 。于是有:
A ( z − x ) = 0. A(z - x) = 0. A ( z − x ) = 0.
情况 1: 若 supp ( x ) ⊂ S \text{supp}(x) \subset S supp ( x ) ⊂ S ,则
( A ( z − x ) ) [ S ] = 0 , (A(z - x))_{[S]} = 0, ( A ( z − x ) ) [ S ] = 0 ,
这意味着方阵 A S A_S A S 不可逆。因此,定义
f ( a 1 , 1 , … , a m , N ) : = det ( A S ) = 0. f(a_{1,1}, \ldots, a_{m,N}) := \det(A_S) = 0. f ( a 1 , 1 , … , a m , N ) := det ( A S ) = 0.
情况 2: 若 supp ( x ) ⊄ S \text{supp}(x) \not\subset S supp ( x ) ⊂ S ,定义子空间
V : = { u ∈ C N : supp ( u ) ⊂ S } + C x , V := \{ u \in \mathbb{C}^N : \text{supp}(u) \subset S \} + \mathbb{C}x, V := { u ∈ C N : supp ( u ) ⊂ S } + C x ,
其维数为 s + 1 s + 1 s + 1 。线性映射 G : V → C s + 1 G : V \to \mathbb{C}^{s+1} G : V → C s + 1 ,定义为 v ↦ A v v \mapsto A v v ↦ A v ,是不可逆的 ,因为 G ( z − x ) = 0 G(z - x) = 0 G ( z − x ) = 0 。设 G G G 在基底 ( e j 1 , … , e j s , x ) (e_{j_1}, \ldots, e_{j_s}, x) ( e j 1 , … , e j s , x ) 下的矩阵为:
B x , S : = [ a 1 , j 1 ⋯ a 1 , j s ∑ j ∈ supp ( x ) x j a 1 , j ⋮ ⋱ ⋮ ⋮ a s + 1 , j 1 ⋯ a s + 1 , j s ∑ j ∈ supp ( x ) x j a s + 1 , j ] . B_{x,S} := \begin{bmatrix} a_{1,j_1} & \cdots & a_{1,j_s} & \sum_{j \in \text{supp}(x)} x_j a_{1,j} \\ \vdots & \ddots & \vdots & \vdots \\ a_{s+1,j_1} & \cdots & a_{s+1,j_s} & \sum_{j \in \text{supp}(x)} x_j a_{s+1,j} \end{bmatrix}. B x , S := a 1 , j 1 ⋮ a s + 1 , j 1 ⋯ ⋱ ⋯ a 1 , j s ⋮ a s + 1 , j s ∑ j ∈ supp ( x ) x j a 1 , j ⋮ ∑ j ∈ supp ( x ) x j a s + 1 , j .
定义
g S ( a 1 , 1 , … , a m , N ) : = det ( B x , S ) = 0. g_S(a_{1,1}, \ldots, a_{m,N}) := \det(B_{x,S}) = 0. g S ( a 1 , 1 , … , a m , N ) := det ( B x , S ) = 0.
这说明矩阵 A A A 的元素必须满足:
( a 1 , 1 , … , a m , N ) ∈ f − 1 ( { 0 } ) ∪ ⋃ card ( S ) = s g S − 1 ( { 0 } ) . (a_{1,1}, \ldots, a_{m,N}) \in f^{-1}(\{0\}) \cup \bigcup_{\text{card}(S)=s} g_S^{-1}(\{0\}). ( a 1 , 1 , … , a m , N ) ∈ f − 1 ({ 0 }) ∪ card ( S ) = s ⋃ g S − 1 ({ 0 }) .
由于 f f f 与所有 g S g_S g S 都是非零多项式函数,而每个集合 f − 1 ( { 0 } ) f^{-1}(\{0\}) f − 1 ({ 0 }) 、g S − 1 ( { 0 } ) g_S^{-1}(\{0\}) g S − 1 ({ 0 }) 的 Lebesgue 测度为零,它们的并集的测度也为零。因此,只需选择矩阵 A A A 的元素避开这一测度为零的集合,即可保证 x x x 能从 y = A x y = A x y = A x 被唯一恢复。
主题: 压缩感知, 稀疏恢复