压缩感知的核心问题和基础理论

2025-11-04

压缩感知（Compressive Sensing）问题的核心在于：如何从 $y = A x$ 中重建一个 s-稀疏（s-sparse） 向量 $x$ 。

其中， $A \in \mathbb{C}^{m \times N}$ 被称为测量矩阵（measurement matrix），且 $m < N$ 。
因此，上述线性方程组是欠定的（underdetermined），但希望通过稀疏性假设可以帮助识别原始的稀疏向量 $x$ 。

核心问题在于两种不同的情境：

测量方案是否应当允许对所有 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 进行重建；
或者，我们仅要求：给定某个特定的 $s$ -稀疏向量 $x \in \mathbb{C}^N$ ，测量方案能够重建这个特定的向量。

第二种情形乍看之下似乎不自然，因为向量 $x$ 事先未知。但当矩阵 $A$ 随机选择且稀疏向量 $x$ 固定时，这种情况在分析恢复保证（nonuniform recovery guarantees）时会变得重要。最小测量数 $m$ 取决于具体情境：

在第一种情况下， $m = 2s$ ；
在第二种情况下， $m = s + 1$ 。

如果还要求重建方案稳定（stable）（此处的“稳定”含义稍后会更精确定义），则所需的最小测量数还会额外包含一个 $\ln(N/s)$ 因子。因此，仅仅 $2s$ 个测量是不足以保证稳定恢复的。

在区分上述两种情境之前，值得注意以下两个性质的等价性：

(a) 若 $x \in \mathbb{C}^N$ 是方程 $A z = y$ 的唯一 $s$ -稀疏解，则有：
$\{ z \in \mathbb{C}^N : A z = A x, \| z \|_0 \le s \} = \{ x \}.$

(b) 向量 $x \in \mathbb{C}^N$ 可以通过如下优化问题唯一重建：

\min_{z \in \mathbb{C}^N} \| z \|_0 \quad \text{subject to} \quad A z = y. \tag{P0}

事实上，如果 $x \in \mathbb{C}^N$ 是 $A z = y$ 的唯一 $s$ -稀疏解，那么问题 (P0) 的最优解 $x^\#$ 也必定是 $s$ -稀疏的，并且满足 $A x^\# = y$ ，因此 $x^\# = x$ 。
这说明 (a) ⇒ (b)。反之 (b) ⇒ (a) 也显然成立。

情形 1：均匀恢复（Uniform Recovery）

在给出这一情形的主要结果之前，我们首先注意到：欠定线性系统中稀疏解的唯一性可以通过多种方式重新表述。

关键记号

设 $A \in \mathbb{C}^{m \times N}$ ，并令 $S \subset [N]$ 。

子矩阵 $A_S$ ：我们用记号 $A_S$ 表示矩阵 $A$ 中仅由索引集合 $S$ 中的列构成的子矩阵。
子向量 $x_S$ ：对于 $x \in \mathbb{C}^N$ ，我们记 $x_S$ 为一个与 $x$ 在 $S$ 中的分量一致、在 $S$ 外为零的 $\mathbb{C}^N$ 向量。形式化地写为：

定理 1 (唯一性与零空间)

设 $A \in \mathbb{C}^{m \times N}$ ，以下性质等价：

(a) 每个 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 都是方程 $A z = A x$ 的唯一 $s$ -稀疏解。换言之，若 $A x = A z$ ，且 $x, z$ 均为 $s$ -稀疏向量，则 $x = z$ 。

(b) 矩阵 $A$ 的零空间（null space）不包含任何非零的 $2s$ -稀疏向量，即：
$\ker A \cap \{ z \in \mathbb{C}^N : \|z\|_0 \le 2s \} = \{ 0 \}.$

(d) 矩阵 $A$ 的任意 $2s$ 列是线性无关的。

证明：

(a) ⇔ (b)： 设 $x, z$ 为 $s$ -稀疏向量，且 $A x = A z$ 。则 $x - z$ 为 $2s$ -稀疏，且满足 $A(x - z) = 0$ 。若 $\ker A$ 不包含任何非零的 $2s$ -稀疏向量，则 $x = z$ 。
反之，若对所有 $s$ -稀疏向量 $x$ 都有唯一性性质
$\{ z \in \mathbb{C}^N : A z = A x, \|z\|_0 \le s \} = \{x\},$
设 $v \in \ker A$ 是 $2s$ -稀疏的。我们可以取 $v = x - z$ ，其中 $x, z$ 是两个 $s$ -稀疏向量，且其支撑集 $\text{supp}(x) \cap \text{supp}(z) = \emptyset$ 。由 $A x = A z$ 与唯一性假设可得 $x = z$ ，因此 $v = 0$ 。
(b) ⇔ (c) ⇔ (d)： 对任意 $2s$ -稀疏向量 $v$ ，设 $S = \text{supp}(v)$ ，则有 $A v = A_S v_S$ 。
当 $S$ 在所有满足 $\text{card}(S) \le 2s$ 的子集上取遍时， $v$ 在所有 $2s$ -稀疏向量上取遍。这意味着 $A_S$ 单射等价于 $A$ 的任意 $2s$ 列线性无关，从而完成证明。

注（最小测量数）：

我们特别注意到：若希望从测量向量 $y = A x \in \mathbb{C}^m$ 中重建任意 $s$ -稀疏向量 $x \in \mathbb{C}^N$ ，则上面的条件 (a) 成立，因此 (d) 也成立。这意味着：
$\text{rank}(A) \ge 2s.$
由于矩阵秩至多等于行数，因此需要的测量数 $m$ 满足：
$m \ge 2s.$

定理 2 (Vandermonde 矩阵构造)

对于任意整数 $N \ge 2s$ ，存在一个测量矩阵 $A \in \mathbb{C}^{m \times N}$ ，其行数 $m = 2s$ ，使得任意 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 都可以从测量向量 $y = A x \in \mathbb{C}^m$ 中被恢复，且该 $x$ 是优化问题 (P₀) 的解。

证明：

令 $t_N > t_{N-1} > \cdots > t_2 > t_1 > 0$ ，
并考虑如下矩阵 $A \in \mathbb{C}^{m \times N}$ （其中 $m = 2s$ ）：

A = \begin{bmatrix} 1 & 1 & \cdots & 1 \\ t_1 & t_2 & \cdots & t_N \\ \vdots & \vdots & \ddots & \vdots \\ t_1^{2s-1} & t_2^{2s-1} & \cdots & t_N^{2s-1} \end{bmatrix}. \tag{2}

取一个指标集合 $S = \{ j_1 < j_2 < \cdots < j_{2s} \}$ ，于是子矩阵 $A_S \in \mathbb{C}^{2s \times 2s}$ 是一个范德蒙矩阵（Vandermonde matrix）的转置:

\det(A_S) = \begin{vmatrix} 1 & 1 & \cdots & 1 \\ t_{j_1} & t_{j_2} & \cdots & t_{j_{2s}} \\ \vdots & \vdots & \ddots & \vdots \\ t_{j_1}^{2s-1} & t_{j_2}^{2s-1} & \cdots & t_{j_{2s}}^{2s-1} \end{vmatrix} = \prod_{k < \ell} (t_{j_\ell} - t_{j_k}) > 0.

这表明 $A_S$ 是可逆的，从而是单射的（injective）。由于定理 1 的条件 (c) 得到满足，每个 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 都是方程 $A z = A x$ 的唯一 $s$ -稀疏解，因此可以作为问题 (P₀) 的解被成功恢复。

拓展讨论：其他矩阵构造

许多其他矩阵同样满足定理 1 的条件 (c)。

完全正矩阵 (Totally Positive Matrix)：
例如，在式 (2) 的矩阵中， $t_1, \ldots, t_N$ 的整数幂不必一定是连续整数 $0, 1, \ldots, 2s-1$ 。我们不必固定一个与 $t_N > \cdots > t_1 > 0$ 相关的 Vandermonde 矩阵，而可以从任意一个**完全正（totally positive）**的矩阵 $M \in \mathbb{R}^{N \times N}$ 出发。完全正矩阵是指对于任意相同基数的索引集 $I, J \subset [N]$ ，其子矩阵 $M_{I,J}$ 的行列式满足 $\det M_{I,J} > 0$ ，其中 $M_{I,J}$ 表示由 $I$ 索引行、 $J$ 索引列的子矩阵。
接着，我们选取 $M$ 的任意 $m = 2s$ 行（索引集合记作 $I$ ），构造矩阵 $A$ 。对于任意基数为 $2s$ 的索引集 $S \subset [N]$ ，矩阵 $A_S$ 便退化为 $M_{I,S}$ ，因此它是可逆的。
部分傅里叶矩阵 (Partial Fourier Matrix)：
再举一例：数值 $t_N, \ldots, t_1$ 不必是正数或实数，只需满足 $\det(A_S) \ne 0$ （而非 $\det(A_S) > 0$ ）即可。特别地，当我们取
$t_\ell = e^{i 2\pi (\ell - 1)/N}, \quad \ell \in [N],$
部分傅里叶矩阵
$A = \begin{bmatrix} 1 & 1 & 1 & \cdots & 1 \\ 1 & e^{i 2\pi /N} & e^{i 2\pi 2 /N} & \cdots & e^{i 2\pi (N-1)/N} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & e^{i 2\pi (2s-1)/N} & e^{i 2\pi (2s-1)2/N} & \cdots & e^{i 2\pi (2s-1)(N-1)/N} \end{bmatrix}$
同样允许从 $y = A x \in \mathbb{C}^{2s}$ 中重建任意 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 。

关于 (P0) 的可行性

事实上，与定理 2 的证明类似的论证表明：对于任意满足 $\det(A_S) = 0$ 的子集 $S \subset [N]$ 、且 $\text{card}(S) \le 2s$ 的矩阵，其集合在 $(2s) \times N$ 矩阵空间中 Lebesgue 测度为零。因此，大多数 $(2s) \times N$ 矩阵都允许从 $y = A x \in \mathbb{C}^{2s}$ 中恢复任意 $s$ -稀疏向量 $x \in \mathbb{C}^N$ 。

一般而言，直接求解 (P₀) 的重建过程在实践中不可行（即这是一个NP-Hard的问题），但在傅里叶测量的情形下，可以使用基于 Prony 方法（Prony’s method） 的更优重建方案。

定理 3 (Prony 方法与可行重建)

对于任意 $N \ge 2s$ ，存在一种可行的重建方法，可从前 $m = 2s$ 个离散傅里叶测量中重建任意 $s$ -稀疏向量。

证明：

设 $x \in \mathbb{C}^N$ 是一个 $s$ -稀疏向量，将其视为一个定义在 $\{0, 1, \ldots, N-1\}$ 上的函数，支持集为 $S \subset \{0,1,\ldots,N-1\}$ ，其中 $|S| = s$ 。我们观测到其前 $2s$ 个离散傅里叶系数：
$\hat{x}(j) := \sum_{k=0}^{N-1} x(k)e^{-i2\pi jk/N}, \quad 0 \le j \le N-1.$
考虑一个次数为 $s$ 的三角多项式：
$p(t) := \prod_{k \in S} (1 - e^{-i2\pi k/N} e^{i2\pi t/N}).$
此多项式在 $t \in S$ 时取零，因此我们希望通过确定 $p$ （或等价地，其傅里叶变换 $\hat{p}$ ）来恢复未知的集合 $S$ 。

由于 $x$ 在补集 $\overline{S}$ 上为零，因而对所有 $0 \le t \le N-1$ 有：
$p(t)x(t) = 0.$
由离散卷积可得：
$\hat{p} * \hat{x} = 0,$
即

(\hat{p} * \hat{x})(j) := \sum_{k=0}^{N-1} \hat{p}(k)\hat{x}(j - k \bmod N) = 0, \quad \forall 0 \le j \le N-1. \tag{2.6}

由于 $p$ 的次数为 $s$ ，我们有：
$\hat{p}(0) = 1, \quad \hat{p}(k) = 0 \text{ 对于 } k > s.$
因此我们需要确定 $\hat{p}(1), \ldots, \hat{p}(s)$ 。
取方程 (2.6) 中的 $s \le j \le 2s-1$ ，得到如下线性方程组：

\begin{aligned} \hat{x}(s) + \hat{p}(1)\hat{x}(s-1) + \cdots + \hat{p}(s)\hat{x}(0) &= 0, \\ \hat{x}(s+1) + \hat{p}(1)\hat{x}(s) + \cdots + \hat{p}(s)\hat{x}(1) &= 0, \\ &\vdots \\ \hat{x}(2s-1) + \hat{p}(1)\hat{x}(2s-2) + \cdots + \hat{p}(s)\hat{x}(s-1) &= 0. \end{aligned}

即矩阵形式为：

\begin{bmatrix} \hat{x}(s-1) & \hat{x}(s-2) & \cdots & \hat{x}(0) \\ \hat{x}(s) & \hat{x}(s-1) & \cdots & \hat{x}(1) \\ \vdots & \vdots & \ddots & \vdots \\ \hat{x}(2s-2) & \hat{x}(2s-3) & \cdots & \hat{x}(s-1) \end{bmatrix} \begin{bmatrix} \hat{p}(1) \\ \hat{p}(2) \\ \vdots \\ \hat{p}(s) \end{bmatrix} = - \begin{bmatrix} \hat{x}(s) \\ \hat{x}(s+1) \\ \vdots \\ \hat{x}(2s-1) \end{bmatrix}.

由于 $\hat{x}(0), \ldots, \hat{x}(2s-1)$ 已知，可以求得 $\hat{p}(1), \ldots, \hat{p}(s)$ 。虽然此 Toeplitz 矩阵并非总是可逆（例如取 $x = [1,0,\ldots,0]^\top$ 时不可逆），但我们可以找到某个解 $\hat{q}(1), \ldots, \hat{q}(s)$ ，并定义 $\hat{q}(0) = 1, \hat{q}(k) = 0$ 对 $k > s$ 。于是有：
$(\hat{q} * \hat{x})(j) = 0, \quad s \le j \le 2s-1.$
这意味着 $s$ -稀疏向量 $q \cdot x$ 的傅里叶变换 $\widehat{q \cdot x} = \hat{q} * \hat{x}$ 在连续的 $s$ 个频率上为零。

由此可得 $q \cdot x = 0$ ，即三角多项式 $q$ 在集合 $S$ 上取零。由于 $q$ 的次数至多为 $s$ ，其零点集恰好为 $S$ 。

因此，我们可以通过以下方式恢复 $S$ ：

求解 $p(t) = 0$ 的根；
或找出 $|p(j)|$ 最小的 $s$ 个位置。

最后，通过前 $2s$ 个傅里叶系数建立的线性方程组可解出 $x(j), \quad j \in S$ 。

注（Prony 方法的局限性）：

尽管此重建过程在理论上优雅，但存在重要缺陷：它对稀疏性误差不稳定，也不具备对测量误差的鲁棒性。

我们将在第 11 章证明：任何稳定的 $s$ -稀疏重建方法都至少需要 $m \approx c\, s \ln(eN/s)$ 次测量，其中 $c > 0$ 是依赖于稳定性条件的常数。

情形 2：非均匀恢复（Non-Uniform Recovery）

在这一设定下， $s$ -稀疏向量 $x \in \mathbb{C}^N$ 是事先固定的，随后才选择测量矩阵 $A \in \mathbb{C}^{m \times N}$ 。
此时，使得 $x$ 成为与测量 $y = A x$ 一致的唯一 $s$ -稀疏向量的条件，依赖于 $A$ 和 $x$ 本身。乍看之下这似乎不自然，因为 $x$ 在选择 $A$ 前未知。但其背后的思想是：对于“多数” $(s+1) \times N$ 的矩阵，条件自然成立。这在实际中是合理的，因为测量矩阵常常随机选取。

定理 4 (固定向量的恢复)

对于任意 $N \ge s + 1$ ，给定一个 $s$ -稀疏向量 $x \in \mathbb{C}^N$ ，存在一个具有 $m = s + 1$ 行的测量矩阵 $A \in \mathbb{C}^{m \times N}$ ，使得向量 $x$ 可以从测量向量 $y = A x \in \mathbb{C}^m$ 中唯一恢复，且 $x$ 是问题 (P₀) 的解。

证明：

设 $A \in \mathbb{C}^{(s+1) \times N}$ 。假设该矩阵不能通过 $\ell_0$ -最小化从 $y = A x$ 恢复 $s$ -稀疏向量 $x$ 。
则存在一个与 $x$ 不同的向量 $z \in \mathbb{C}^N$ ，其支持集为 $S = \text{supp}(z) = \{ j_1, \ldots, j_s \}$ ，且满足 $A z = A x$ 。若 $\|z\|_0 < s$ ，则补齐 $S$ 至大小为 $s$ 。于是有：
$A(z - x) = 0.$

情况 1： 若 $\text{supp}(x) \subset S$ ，则
$(A(z - x))_{[S]} = 0,$
这意味着方阵 $A_S$ 不可逆。因此，定义
$f(a_{1,1}, \ldots, a_{m,N}) := \det(A_S) = 0.$
情况 2： 若 $\text{supp}(x) \not\subset S$ ，定义子空间
$V := \{ u \in \mathbb{C}^N : \text{supp}(u) \subset S \} + \mathbb{C}x,$
其维数为 $s + 1$ 。线性映射 $G : V \to \mathbb{C}^{s+1}$ ，定义为 $v \mapsto A v$ ，是不可逆的，因为 $G(z - x) = 0$ 。设 $G$ 在基底 $(e_{j_1}, \ldots, e_{j_s}, x)$ 下的矩阵为：
$B_{x,S} := \begin{bmatrix} a_{1,j_1} & \cdots & a_{1,j_s} & \sum_{j \in \text{supp}(x)} x_j a_{1,j} \\ \vdots & \ddots & \vdots & \vdots \\ a_{s+1,j_1} & \cdots & a_{s+1,j_s} & \sum_{j \in \text{supp}(x)} x_j a_{s+1,j} \end{bmatrix}.$
定义
$g_S(a_{1,1}, \ldots, a_{m,N}) := \det(B_{x,S}) = 0.$

这说明矩阵 $A$ 的元素必须满足：

(a_{1,1}, \ldots, a_{m,N}) \in f^{-1}(\{0\}) \cup \bigcup_{\text{card}(S)=s} g_S^{-1}(\{0\}).

由于 $f$ 与所有 $g_S$ 都是非零多项式函数，而每个集合 $f^{-1}(\{0\})$ 、 $g_S^{-1}(\{0\})$ 的 Lebesgue 测度为零，它们的并集的测度也为零。因此，只需选择矩阵 $A$ 的元素避开这一测度为零的集合，即可保证 $x$ 能从 $y = A x$ 被唯一恢复。

主题：压缩感知, 稀疏恢复