研究笔记 · Research Note
GP 贝叶斯反演 (Gaussian Process Bayesian Inversion)
GP 贝叶斯反演 (Gaussian Process Bayesian Inversion)
页面用途:Zhenyu 2021 年本科末期在 DSCOVR 地球反演项目中实践的贝叶斯反演方法学。和 反问题与正则化 互为对偶——后者是频率学派视角(选单一”最佳” ),本页面是贝叶斯视角( 是概率变量,用 MCMC 积出来)。
定义
贝叶斯反演 (Bayesian Inversion):把反问题 转化为后验分布推断:
- 似然 :由观测模型决定,通常取
- 先验 :表达我们对解的”合理性”期望
- 后验 :我们真正想要的结果——不只是一个 的点估计,而是对解的不确定性的完整刻画
高斯过程先验 (GP Prior):。把未知量 视作索引在某空间(如球面、时空网格)上的随机函数,核函数 编码”相邻点之间应该多相似”的假设。
共轭性的好处:若似然是高斯、先验是 GP,则后验也是高斯,均值和协方差有闭式:
这个闭式后验均值在形式上等价于 Tikhonov 解 (当 时)——这是贝叶斯视角与经典正则化的对偶。
核心论点
1. Tikhonov ≡ 共轭高斯先验下的后验均值
设 (各向同性高斯先验),。后验均值: 正则化参数 = 噪声精度 / 先验精度。这揭示:选 = 选先验强度。
2. GP 核函数就是”结构化先验”
各向同性高斯先验是最弱的结构。换上 RBF kernel 立刻获得”空间平滑”的强先验——相邻点应该相似。在 Zhenyu 的 DSCOVR 反演里:
- 空间:在 HEALPix 球面网格上用 RBF, 控制”相信 Earth 的陆海分布有多大尺度的结构”
- 时间:另一个 RBF kernel 控制”同一地点在时间上变化应该多慢”
- 联合:用 separable kernel 避免全联合协方差的 计算
3. 层级贝叶斯:超参数也当成随机变量
核函数里的超参数(RBF 的 / / )本身也不确定。两种处理方式:
- Type-II MLE / Empirical Bayes:最大化 (边缘似然),取单点
- Fully Bayesian:对超参数积分 ,用 MCMC over 近似——Zhenyu 在 里选了这条路
4. MCMC 超参数采样的实践要点
- Affine-invariant ensemble sampler (
emcee, Foreman-Mackey 2013) 适合中等维度超参数 - Log-space 重参数化:
log10_alpha,log10_sigma—— 避免”alpha 跨六个数量级”的采样灾难 - 混合积分:给定一个 样本, 是高斯闭式;所以只需要 MCMC 采 ,然后 for each 取高斯解析 + ,最后做 Gaussian Mixture approximation —— 这是 rao-blackwell 的思想
- 数值稳定性: 大且病态,用 Cholesky(
scipy.linalg.solve(..., assume_a="pos"))而非显式inv;log-determinant 用np.linalg.slogdet
不同观点
频率学派 vs 贝叶斯
- 频率派选单一 (见 反问题与正则化)——快、对小问题够用
- 贝叶斯 MCMC 出整个后验分布——慢、但不确定性量化更诚实
MCMC vs Variational Inference
- MCMC:收敛到真后验,但慢
- VI:近似后验(mean-field 或 structured),快但偏差不可控
- Zhenyu 当前用 MCMC(问题维度不大,emcee 够用);VI 若要上生产环境可以考虑
GP 的计算瓶颈
- 的 Cholesky 是标准 GP 对 的致命伤
- Separable kernel (
KS ⊗ KT) 是 Kawahara/Aizawa 脉络下的实用突破 - 更现代:inducing points (SGPR)、random features、KISS-GP、GPyTorch 的 LazyTensor —— 未来扩展方向
Kawahara / Aizawa 系外行星 Spin-Mapping 脉络(学术谱系)
Zhenyu 的 DSCOVR 地球反演直接借鉴了一条系外行星研究的方法论:
- Cowan & Agol 2008:从系外行星总亮度光曲线反演表面纹理可行性分析
- Kawahara & Fujii 2010 / Kawahara 2016:SOT (Spin-Orbit Tomography) 方法提出——把行星自转的光变曲线逆推为表面 albedo map
- Aizawa 2020 ApJ 896 22 (repo 里有 PDF):Dynamic SOT 扩展——允许 map 随时间变化(考虑云/季节)
- Zhenyu 的迁移:把 SOT 从”观测系外行星”反用到”观测地球”【在Siteng Fan的方法上更进一步】——DSCOVR 在 L1 点看到的地球是个”从外部观测的行星”,完美的方法迁移靶场
这条脉络贴合 Zhenyu PhD 方向(气候 / 行星大气),也是他在 Caltech / UCR 合作里的核心贡献。
应用场景
- 从光曲线反演系外行星 / 地球表面图
- 遥感大气反演中的多参数联合不确定性量化
- 气候模拟输出与观测的 data assimilation
- 任何需要”平滑解 + 不确定性量化”的问题
开放问题
- 非共轭似然:若噪声非高斯(如 Poisson 光子计数、Student-t 重尾),闭式后验不可得,需要更复杂的 MCMC 方案
- 实时反演:DSCOVR 每小时有新观测,是否需要 sequential Bayesian update(Kalman 类方法)而非每次重跑 MCMC?
来源
- — 完整代码实现 + 复现 Kawahara/Aizawa 方法 + DSCOVR 真实数据实验
- PKU-Undergraduate-Research — MCMC Retrieval Methods 项目背景(Yuk Yung / King-Fai Li 指导)
- 教科书(raw):Bishop《Pattern Recognition and Machine Learning》2006 — 第 6 章 GP
- 论文(raw):Aizawa 2020 ApJ 896 22 — Dynamic SOT
- 隐含论文:Kawahara & Fujii 2010、Cowan & Agol 2008(本 repo 未直接存但方法被继承)
- [Future expansion] Kawahara 系列论文、具体推导细节、Zhenyu 自己写的 Chinese
.docx学习笔记
相关页面
- 反问题与正则化 — 频率学派对偶视角
- MCMC-贝叶斯反演 — skill 页
- Python-科学计算 — emcee / scipy / healpy 实现
- 卫星遥感与数据处理 — DSCOVR 数据处理
- 气候物理与大气科学 — 应用领域