跳过导航至主内容
Skip to article

研究笔记 · Research Note

Hardened Balancing Principle (HBP)

Zhenyu He · Jobs Stroustrup 阅读约 5 分钟

Hardened Balancing Principle (HBP)

页面用途: Caltech DSCOVR retrieval 项目 (2021.03–2022.03, with Yuk Yung and UCR co-advisor) Zhenyu 自己在 Bauer 2007 framework 基础上 generalize + 系统 benchmark 的 automatic regularization-parameter selector.

定义

Hardened Balancing Principle (HBP) 是 Bauer 2007 在 Bauer & Hohage 2005 的 Balancing Principle (BP) 基础上提出的 自动 Tikhonov 正则化参数 选择方法, Zhenyu 在 Caltech DSCOVR 项目中 (1) 从 (Tikhonov) 起始做完整符号推导, (2) generalize 到 exponential concentration assumption, (3) 在 4 个 benchmark 上系统 stress-test 与 L-curve / GCV / Morozov discrepancy / Kawahara Bayesian 对比, (4) 采用为 DSCOVR automatic pipeline 的主 selector。

HBP 相对 BP 的核心优势: BP 的 Lepskij-type stopping rule 需要 (i) prior knowledge of noise level , (ii) tuning constant ; HBP 通过 “minimum difference regularization parameter” 构造, 两者都不需要

Bauer 2007 Definition 5.1 (HBP 构造骨架):

  • “minimum difference regularization parameter”:
  • Balancing functional (简化):
  • HBP 选

核心论点

1. 从 (Tikhonov) 起始的 exponential concentration 推导

Zhenyu 从 Tikhonov 情形 出发, 用 Bauer 的 exponential concentration assumption, 推导出 HBP 的 自动选择公式。完整 90 段 derivation 含:

  • Lepskij-type stopping rule 的 generalization
  • Mathé-Pereverzev 2003 geometric framework
  • Tikhonov → BP → HBP 的 逐步 simplification
  • Exponential concentration assumption 的 verification 方法 (difference function 的 minimum selection)

[Future expansion] Full mathematical derivation reserved for a follow-up post; this page captures the methodology skeleton only.

2. 系统 stress test 结果

Zhenyu 在 4 个 benchmark 上同时跑 HBP 与 4 个传统方法 (L-curve / GCV / Morozov discrepancy / Kawahara Bayesian cost):

Benchmark配置HBP 表现
Hansen gravity problem500-instance randomizationAutomatic, 最 robust, 稳定 converge
Golub 1979 LaplaceCondition number 2.88e28 (Zhenyu 实测) vs paper 原 1.54e5 — 比原论文更 ill-conditioned 的 stress testAutomatic, 仍然 work
3-point linear regressionProf. King-Fai Li × Zhenyu Bayesian 化闭式解交叉验证一致
DSCOVR real PC2 time series2-year EPIC PC2, 实际 viewing geometry W (DSCOVR 轨道 + Earth rotation + pixelation + sun-illumination)HBP automatic λ 收敛范围与 Siteng Fan 的 manual benchmark 匹配

3. Pipeline 主 selector 决策 logic (经过 4 方法 stress-test 后的 motivated decision)

MethodDSCOVR 上表现选 / 不选理由
L-curve视觉 elbow 与理论 curvature 不一致 (axis-scale bug, 见 L-Curve-Axis-Scale-Ambiguity)unreliable 除非 axis-scale 校正
Kawahara Bayesian costHansen toy 上 case-by-case 不稳定 (5/5 失败于 ) + DSCOVR W 下 failnot robust for arbitrary W
GCVlong flat region → sensitive to noise direction + underestimates best λstatistical bias
Morozov discrepancysystematic error (always biased to right of L-curve elbow) + 需要 systematic bias + prior info requirement
HBPAutomatic, 不需要 / , 在 DSCOVR 上表现可与 Siteng manual 结果匹配最 robust 且 automatic

HBP 的采用不是任意 choice, 而是经过 Hansen textbook 4 方法的系统 stress-test 后的 motivated decision

与其他 regularization 方法对比

vs L-curve (反问题与正则化 所述经典方法):

  • L-curve 需要 “拐角识别” — 要么 naked-eye (scale-dependent artifact, 见 L-Curve-Axis-Scale-Ambiguity), 要么计算 curvature (对 noise 敏感 + axis-scale 依赖)
  • HBP 不需要 geometric interpretation, 完全 algebraic → 更适合 pipeline

vs GCV (Golub 1979):

  • GCV 在 Golub 1979 原论文 example (condition 1.54e5) 上 work, 但 Zhenyu 复现时 condition 推到 2.88e28, 首次发现 noise-direction dependence (5 instance 中第 4 个 完全不同) → 后来系统化为 DSCOVR contribution (d) “Direction of Noise Vector Influences Regularization”
  • HBP 对这个 geometry-dependence 更 robust

vs Morozov Discrepancy Principle:

  • Discrepancy 要求 , 必须预先知道 ; HBP 完全 data-driven, 不需要

vs Kawahara 2016 Bayesian cost:

  • Kawahara 的 evidence maximization 在特定 toy model work, 但 |x_{sol}| 大时 (e.g., ) 在 Hansen toy 上 5/5 fail; DSCOVR 的 W 下也 fail
  • HBP 在 Zhenyu 的 benchmark 中 唯一在所有 4 benchmark 都 work 的方法

Downstream influence (方法学影响力)

Subsequent collaborators applied HBP to extended regimes (low / high clouds), demonstrating methodology transfer beyond the original PC2 land/ocean retrieval.

开放问题

  • 非线性 forward operator 下 HBP 是否仍然 valid? Bauer 2007 原 framework 是 linear Tikhonov, 非线性拓展需要重新推导 exponential concentration 性质
  • 高维 regime (n > 10000) 下 HBP 的 computational cost vs. GCV (需要 trace of hat matrix) 的实际对比
  • Bayesian 解释: HBP 在 Bayesian framework 下是否对应某 specific hyperprior? 与 GP-贝叶斯反演 的 Type-II MLE 是否可 unify?

[Future expansion] Full math derivations, Bauer 2007 reading notes, and Mathé-Pereverzev 2003 geometric framework details reserved for a follow-up post.

来源

  • research_wiki/projects/mcmc_retrieval/overview.md §贡献 (a) Hardened Balancing Principle (HBP) 应用 + 数学展开 (2021-09-27 + paper draft 90-paragraph section)

  • research_wiki/projects/mcmc_retrieval/overview.md §🌟 贡献 (a) 扩展: HBP 在 DSCOVR case 上的系统测试

  • research_wiki/projects/mcmc_retrieval/overview.md §贡献 (a) 扩展 Table (L-curve / Kawahara / GCV / Discrepancy / HBP 决策 logic)

  • HBP mathematical writeup with collaborator acknowledgments (working manuscript, not publicly submitted).

  • Bauer 2007 — HBP 方法源论文 (Definition 5.1)

  • Bauer & Hohage 2005 — Balancing Principle 前身

  • Mathé & Pereverzev 2003 — geometric framework

  • [待补充] Zhenyu research-angle 独立 wiki 中的 HBP 学习笔记 (合并后此页扩展到 full derivation depth)

相关页面