Mar 8, 2026

miniyuan

误差分析

数值分析基本概念

一般形式

数值计算问题可统一表述为：

F(x, d) = 0

其中：

$x$ ：待求解（如方程的根、微分方程的解）
$d$ ：问题参数（如系数、初值、边界条件）
$F$ ：描述解与参数关系的函数

根据已知量与未知量的组合，可分为三类：

类型	已知	未知	应用示例
直接问题	$F, d$	$x$	求解线性方程组 $Ax=b$
反问题	$F, x$	$d$	由测量数据反推材料参数
识别问题	$x, d$	$F$	从实验数据构建物理模型

而数值方法就是离散化求解上述问题的过程，可以理解为使用近似问题序列 $F_n(x_n, d_n) = 0$ 求近似解 $x_n$ 。 $n$ 通常表示离散规模（如迭代次数、网格加密度）。

我们称 $x_n, d_n, F_n$ 为近似解、近似参数、近似函数。相对地，强调原问题的 $x, d, F$ 为准确解、准确参数、准确函数。

数值问题的适定性

适定性（Well-Posedness）。

定义：数值计算问题是适定的，当且仅当满足：

解存在：对给定 $d$ ，至少存在一个解 $x$
解唯一：解在解空间中唯一
解关于参数连续：参数 $d$ 的微小扰动 $\delta d$ 仅引起解 $x$ 的微小变化 $\delta x$ 。具体来说，设问题扰动为 $F(x + \delta x, d + \delta d) = 0$ ，则对任意 $d$ ，存在 $\eta_0 > 0$ 和 $K_0 > 0$ ，使得当 $\|\delta d\| \leq \eta_0$ 时： $\|\delta x\| \leq K_{0} \|\delta d\|$

注：不适定问题在反问题中极为常见，需通过正则化等技术转化为适定问题。

数值方法的一致性

一致性（Consistency）。

定义：对近似问题序列 $F_n(x_n, d_n) = 0$ ，若

F_n(x, d) - F(x, d) \to 0 \quad (n \to \infty)

其中 $x$ 是原问题的准确解，则称该序列一致。

数值方法的稳定性

稳定性（Stability）。

定义：对近似问题序列 $F_n(x_n, d_n) = 0$ ，若对任意 $d_n$ ，存在 $\eta_0 > 0$ 和 $K_0 > 0$ ，使得当 $\|\delta d_n\| \leq \eta_0$ 时：

\|\delta x_n\| \leq K_{0} \|\delta d_n\|

则称该序列稳定。

注：有时使用相同的数学关系、不同的计算方向会导致截然不同的数值稳定性。

数值方法的收敛性

收敛性（Convergence）。

定义：对近似问题序列 $F_n(x_n, d_n) = 0$ ，若对任意 $\varepsilon > 0$ ，存在 $n_0 \in \mathbb N$ 和 $\delta > 0$ ，使得当 $n > n_0$ 且 $\|\delta d_n\| \leq \delta$ 时：

\|x(d) - x_n(d + \delta d_n)\| \leq \varepsilon

则称该序列收敛。

总结

数值问题的适定性就是数值问题的解存在唯一，且关于参数连续。
数值方法的一致性就是近似函数接近准确函数。
数值方法的稳定性就是近似解关于近似参数连续。
数值方法的收敛性就是近似解接近准确解。

Lax-Richtmyer 定理：

对满足 $\text{Consistency}$ 的数值方法，有：

\text{Stability} \Leftrightarrow \text{Convergence}

注：由于收敛性涉及到准确解，故一般不好判断。该定理可将收敛性转化为稳定性进行判断。

误差

误差的来源

类型	定义	例子	改进方式
模型误差	数学模型的差异	用球体近似地球计算表面积	改进物理建模
观测误差	参数测量不精确	地球半径的测量误差	改进仪器精度
截断误差	无限过程截断为有限步骤	Taylor 展开舍弃高阶项、数值积分离散化	改进算法阶数
舍入误差	计算机有限精度表示实数	$\pi, \sqrt{2}$ 的浮点近似	改用高精度计算

例：单摆运动方程 $\displaystyle L\frac{d^2\phi}{dt^2} + g\sin\phi + \mu\frac{d\phi}{dt} = 0$

模型误差：用常数 $\mu$ 简化摩擦模型
截断误差：小角度近似 $\sin\phi \approx \phi$
观测误差： $L, g, \mu$ 的测量误差

绝对误差与相对误差

定义：

绝对误差： $e(x^*) = x - x^*$ 有时也简称为误差。
绝对误差限： $|e(x^*)| \leq \varepsilon$ 其中绝对误差绝对值的上界 $\varepsilon$ 即为绝对误差限。
相对误差： $e_r(x^*) = \frac{e(x^*)}{x} \approx \frac{e(x^*)}{x^*}$
相对误差限： $|e_r(x^*)| \leq \varepsilon_r = \frac{\varepsilon}{|x^*|}$ 其中相对误差绝对值的上界 $\varepsilon_r$ 即为相对误差限。

注：

绝对误差反映误差的绝对大小，相对误差反映误差的相对程度，所以相对误差更加本质。
严格上讲我们求相对误差（限）时应该写成 $e_r \le \text{val}$ ，不过不严格区分了。

误差传播

设 $y = f(x) = f(x_1, \dots, x_n)$ ，近似参数 $x^* = (x_1, \dots, x_n)$ ，对应的近似解 $y^* = f(x^*)$ 。我们可用下式估算 $x^*$ 的误差造成 $y^*$ 的误差：

绝对误差传播： $\begin{aligned} e(y^*) &\approx \sum_{i=1}^n \frac{\partial f}{\partial x_i}(x^*) e(x_i^*) \\ &= \nabla f(x^*)^\top \mathbf{e}(x^*) \end{aligned}$
相对误差传播： $\begin{aligned} e_r(y^*) &\approx \sum_{i=1}^n \frac{\partial f}{\partial x_i}(x^*) \frac{x_i^*}{y^*} e_r(x_i^*) \\ &= \nabla_{\ln} f(x^*)^\top \mathbf{e}_r(x^*) \end{aligned}$ 其中 $\nabla_{\ln} f(x) \in \mathbb{R}^n, \quad \left( \nabla_{\ln} f(x) \right)_i = \frac{\partial \ln f}{\partial \ln x_i}(x) = \frac{x_i}{f(x)} \frac{\partial f}{\partial x_i}(x)$

注：本质上是因为 $e_r(y^*) = \frac{y - y^*}{y^*} \approx \Delta (\ln y)$

基本运算的误差传播：

运算	绝对误差	相对误差
加减法 $x_1 \pm x_2$	$e(x_1) \pm e(x_2)$	$\displaystyle \frac{x_1}{x_1\pm x_2}e_r(x_1) \pm \frac{x_2}{x_1\pm x_2}e_r(x_2)$
乘法 $x_1x_2$	$x_2e(x_1) + x_1e(x_2)$	$e_r(x_1) + e_r(x_2)$
除法 $x_1/x_2$	$\displaystyle \frac{x_2e(x_1) - x_1e(x_2)}{x_2^2}$	$e_r(x_1) - e_r(x_2)$
幂函数 $x^n$	$n x^{n-1} e(x)$	$n e_r(x)$

注：有时先进行一些恒等变形再计算可以减少误差。

先验与后验误差分析

先验误差分析

在算法运行之前，仅根据问题的参数 $d$ 、函数 $F$ 以及解 $x$ 的假设性质，对误差上界进行的理论估算。

向前分析：

估计对参数扰动 $\delta d$ 引起的误差：
$\|x - x_n\| \le \mathcal{C}(d, n, \text{Properties}(x))$
其中 $\mathcal{C}$ 是不依赖于具体计算结果的常数或函数。
向后分析：

将近似解 $x_n$ 视为某个带有扰动的输入 $d + \delta d$ 对应的精确解。估计 $\delta d$ 的大小：
$\eta_{\text{back}} = \min \{ \|\delta d\| \mid F(x_n, d+\delta d) = 0 \}$

后验误差分析

在算法运行结束或运行中，进一步利用计算结果，如数值解 $x_n$ ，对实际误差进行的定量评估。

也即：

\|x - x_n\| \le C \cdot \eta(x_n, d)

其中 $C$ 是常数， $\eta$ 是基于 $x_n$ 构造的误差估计子。

注：后验误差分析是自适应算法（Adaptive Algorithms）的灵魂。若 $\eta(x_n, d) > \varepsilon_{tol}$ ，则算法可以自动调整参数重新计算。

有效数字与浮点数表示

有效数字

定义： $x^*$ 若可规格化为以下浮点数

\pm 0.\alpha_1\alpha_2\cdots\alpha_n \times 10^m, \quad \alpha_1 \neq 0

其中写出的数字都是准确的，则称 $x^*$ 有 $n$ 位有效数字。

等价定义： $x^*$ 的绝对误差限若满足

|e(x^*)| \le \frac{1}{2} \times 10^{m-n}

其中 $m$ 为 $x^*$ 规格化表示中的指数，则称 $x^*$ 有 $n$ 位有效数字。

性质：

绝对误差限：
$|e(x^*)| \le \frac{1}{2} \times 10^{m-n}$
相对误差限：
$|e_r(x^*)| \le \frac{1/2 \times 10^{m-n}}{\alpha_1 \times 10^{m-1}} = \frac{1}{2\alpha_1} \times 10^{-(n-1)}$
相对误差限反推有效数字：

若 $x^* \ne 0$ 的相对误差限满足：
$|e_r(x^*)| \leq \frac{1}{2(\alpha_1+1)} \times 10^{-(n-1)}$
则 $x^*$ 至少有 $n$ 位有效数字。

证明：用等价定义以及 $|e(x^*)| = |e_r(x^*)| \cdot |x^*|$ 。

注：精度（Precision） $\ne$ 准确度（Accuracy）。精度使用有效数字位数定义，准确度使用准确的有效数字位数定义。

IEEE-754 标准

学 ICS 去吧。

数值计算中的关键注意事项

避免相近数相减
防止量级悬殊数加减
优化计算步骤，即降低复杂度，也避免误差积累
选择合适精度类型，进行数值边界分析与类型安全检查
重视累积误差