跳过导航至主内容
Skip to article

研究笔记 · Research Note

反问题与正则化

Zhenyu He · Jobs Stroustrup 阅读约 2 分钟

反问题与正则化 (Inverse Problems & Regularization)

页面用途:Zhenyu 在 2021 年本科末期(Yuk Yung / King-Fai Li 指导)系统自学的数学方法领域。

定义

反问题 (Inverse Problem):给定一个正向模型 为已知的观测/物理算子, 为观测数据, 为待反演的未知量, 为噪声),求未知量 的过程。

不适定 (Ill-posed) 遵循 Hadamard 1902 定义,一个问题如果不满足以下三条之一就是 ill-posed:

  1. 解存在 (existence)
  2. 解唯一 (uniqueness)
  3. 解对数据连续依赖 (stability, 即小的数据扰动不应造成大的解变化)

离散反问题 (Discrete Inverse Problem):物理上连续的反问题离散化后得到线性系统 ,其中 常为条件数极大()的矩阵——微小的数据噪声会被放大成解空间里的巨大扰动。

正则化 (Regularization) 的核心思想:放弃”严格拟合数据”(即求 )的野心,换取解的稳定性,引入一个正则项 和正则化参数

常见的 :Tikhonov 的 为差分算子给出平滑性约束)、sparsity 的 (导向 compressive sensing)。

核心论点:正则化参数 的选择

过小 → 解被噪声主导(欠正则化); 过大 → 解被正则项主导,失真(过正则化)。选择”刚刚好”的 是反问题方法论的核心。Zhenyu 在 repo 中系统对比了四种方法:

1. L-Curve Method

  • 绘制 的对数对数图
  • 曲线通常呈”L”形:水平段对应过正则化( 增加变化小),垂直段对应欠正则化( 减小爆炸)
  • “拐角”处是最佳
  • 优点:几何直观、无需知道噪声水平
  • 缺点:拐角定义依赖数据,有时曲线并无明显 L 形

2. L-Curve Curvature Method

  • L-Curve 的数值增强版:显式计算曲率 ,最佳 对应 极值
  • 优点:自动化、无主观”拐角识别”
  • 缺点:对噪声敏感,需要谨慎的数值求导

3. Generalized Cross Validation (GCV)

  • Golub、Heath、Wahba 1979 提出
  • 目标函数:,其中 是”帽子矩阵”
  • 本质:留一交叉验证的期望形式的闭式近似
  • 优点:有强理论基础、无需噪声水平、完全自动
  • 缺点:目标函数可能 flat(最小值区域不显著),在高度相关数据上会低估

4. Morozov Discrepancy Principle

  • 假设已知噪声水平
  • 选择 使 (残差恰好等于噪声水平)
  • 优点:统计上合理(解不应比数据噪声更精细)
  • 缺点:必须预先知道 ,这在实际反演中经常不可得

不同观点 / 实践对比

Hansen(《Discrete Inverse Problems》2010)的立场:L-Curve 是首选——在未知噪声水平时,它的几何直觉最强、最鲁棒。书中大量例子(包括 gravity problem Fig 5.9)用的都是 L-Curve 搭配少量辅助方法。

Golub 1979 的 GCV 立场:GCV 在随机噪声下是统计最优的(在预测误差 的期望意义下)。适合噪声水平未知但分布假设成立的问题。

Zhenyu 在 DSCOVR 实验中观察到的DSCOVR_test/):

  • L-Curve 与 L-Curve Curvature 结果接近
  • GCV 在真实 DSCOVR 数据上偏小(倾向于欠正则化)
  • 没有”银弹”——最稳妥的做法是多种方法并用 + 检查解的物理合理性

核心工具

  • SVD 分解 + Tikhonov 解析解,解写作 ——filter factor 视角揭示了”哪些奇异方向被保留、哪些被压制”
  • 条件数分析 估计问题的”坏度”
  • Picard 条件:检查 是否在 衰减到噪声水平前衰减足够快——违反 Picard 条件意味着问题根本性无法从数据中恢复解
  • Filter factors,Tikhonov 把 变成光滑过渡;Truncated SVD 把 变成阶跃函数(选前 个奇异分量)

开放问题

  • 非线性反问题:这里讨论的都是线性 。实际气候、医学成像、地球物理反演常是非线性的(),正则化和参数选择还有什么差异?
  • Bayesian 视角统一:正则化参数 在 Bayesian 里对应先验的 precision,选择 等价于 Type-II MLE / MAP——这与 GP-贝叶斯反演 的 MCMC over hyperparameter 观点的取舍?
  • Deep learning 学的”正则化”:dropout、weight decay、data augmentation——和经典 Tikhonov 的数学联系?

应用场景

Zhenyu 已经用过或计划用的:

  • DSCOVR 单点光曲线 → 地球表面反照率 map()
  • MODIS × CALIPSO 联合气溶胶反演(PKU-Undergraduate-Research
  • 核冬天中烟尘廓线反演(未来)
  • 系外行星 spin-orbit tomography(Kawahara / Aizawa 方法)

迁移场景(其他领域):

  • 医学成像(CT、MRI)
  • 地球物理勘探
  • 遥感大气痕量气体反演(甲烷、CO₂)
  • 天文图像重建

来源

  • — 代码 + 四种方法的对比实验 + 自学笔记
  • PKU-Undergraduate-Research — MCMC Retrieval Methods 项目背景
  • 教科书(raw 里的 PDF):Hansen《Discrete Inverse Problems》2010
  • 原始论文(raw 里的 PDF):Golub, Heath, Wahba 1979(GCV 发明)
  • 讲义(raw 里的 PDF):Morozov discrepancy principle
  • [待补充] Zhenyu 的 research-angle 独立 LLM Wiki 中的进一步 .docx 学习笔记(例如 Hansen_numerical_test_zyh.docxTestOnUsingKawahara_3pointsLinearRegress_HansenBookEg.docx)——将来合并进来后此 concept 页可扩展

相关页面