主题
Search

反问题


为了预测测量的结果,需要 (1) 被研究系统的模型,以及 (2) 将模型参数与被测量参数联系起来的物理理论。这种在给定定义模型参数值的情况下对观测结果的预测构成了“正常问题”,或者用反问题理论的术语来说,是正向问题。“反问题”包括使用实际观测的结果来推断表征被研究系统的参数值。

反问题可能难以解决,至少有两个不同的原因:(1) 模型参数的不同值可能与数据一致(知道主桅杆的高度不足以计算船长的年龄),以及 (2) 发现模型参数的值可能需要探索巨大的参数空间(在 100 维的干草堆中找到一根针是困难的)。

尽管大多数反问题的公式直接进入 优化 问题的设置,但实际上最好从概率公式开始,然后优化公式作为副产品出现。

考虑一个具有体积概念的 流形 M。那么对于任何 A subset M

 V(A)=int_AdV.
(1)

体积概率是一个函数 f,它将概率与任何 A subset M 相关联

 P(A)=int_AdVf.
(2)

如果 M 是一个配备了一些坐标 {x^1,...,x^n} 的度量流形,那么

 dV=sqrt(detg)dx^1 ^ ... ^ dx^n
(3)

P(A)=int_Adx^1 ^ ... ^ dx^nsqrt(detg)f_()
(4)
=int_Adx^1 ^ ... ^ dx^nf^_.
(5)

(注意体积概率 f 是不变的,但概率密度 f^_ 不是;它是一个密度。)

体积概率的基本运算是它们的乘积,

 (f·g)(P)=1/nuf(P)g(P),
(6)

其中 nu=int_MdVf(P)g(P)。这对应于“概率的组合”,非常适合许多基本的推断问题。

考虑一个例子,其中两架飞机对一名遇难者的地理坐标进行了两次估计。设概率由两个体积概率 f(phi,lambda)g(phi,lambda) 表示。结合这两条信息的体积概率是

 (f·g)(phi,lambda)=(f(phi,lambda)g(phi,lambda))/(intdS(phi,lambda)f(phi,lambda)g(phi,lambda)).
(7)

体积概率的乘积运算扩展到以下情况

1. 在第一个流形 M 上定义了一个体积概率 f(P)

2. 在第二个流形 N 上定义了另一个体积概率 phi(Q)

3. 存在从 MN 的应用 P|->Q=Q(P)

那么,上面介绍的基本运算变为

 g(P)=1/nuf(P)phi(Q(P)),
(8)

其中 nu=int_MdV(P)f(P)phi(Q(P))

在一个典型的反问题中,有

1. 一组模型参数 {m^1,m^2,...,m^n}

2. 一组可观测参数 {o^1,o^2,...,o^n}

3. 关系 o^i=o^i(m^1,m^2,...,m^n) 预测可能的观测结果。

模型参数是模型参数流形 M 上的坐标,而可观测参数是可观测参数流形 O 上的坐标。当 M 上的点表示为 MM^'、... 并且 O 上的点表示为 OO^'、... 时,模型参数和可观测参数之间的关系可以写成 M|->O=O(M)

一个典型的反问题的三个基本要素是

1. 关于模型参数的一些先验信息,由在 M 上定义的体积概率 rho_(prior)(M) 表示。

2. 关于可观测参数获得的一些实验信息,由在 O 上定义的体积概率 sigma_(obs)(O) 表示。

3. 我们刚刚看到的“正向建模”关系 M|->O=O(M)

方程 (8) 的使用导致

 rho_(post)(M)=1/nurho_(prior)(M)sigma_(obs)(O(M)),
(9)

其中 nu 是归一化常数。此体积概率表示关于模型参数的最终信息(通过组合可用信息获得)。方程 (9) 提供了反问题的更通用解。常见方法(蒙特卡罗、优化等)可以看作是此方程的特定用途。

考虑一个来自采样的例子,对先验体积概率 rho_(prior)(M) 进行采样,以获得(许多)随机模型 M_1M_2、.... 对于每个模型 M_i,解决正向建模问题,O_i=O_i(M_i)。给予每个模型 M_isigma_(obs)(O_i(M_i)) 成正比的“生存”概率。幸存的模型 M_(1^')M_(2^')、... 是后验体积概率的样本

 rho_(post)(M)=1/nurho_(prior)(M)sigma_(obs)(O(M)).
(10)

考虑一个来自最小二乘拟合的例子,模型参数流形可能是一个线性空间,向量表示为 mm^'、...,并且先验信息可能具有高斯形式

 rho_(prior)(m)=kexp[-1/2(m-m_(prior))^(T)C_m^(-1)(m-m_(prior))].
(11)

可观测参数流形可能是一个线性空间,向量表示为 oo^'、...,并且测量带来的信息可能具有高斯形式

 sigma_(obs)(o)=kexp[-1/2(o-o_(obs))^(T)C_o^(-1)(o-o_(obs))]).
(12)

对于这些符号,正向建模关系变为

 o=o(m).
(13)

那么,模型参数的后验体积概率为

 rho_(post)(m)=kexp[-S(m)],
(14)

其中失配函数 S(m) 是平方和

 2S(m)=(m-m_(prior))^(T)C_m^(-1)(m-m_(prior)) 
 +(o(m)-o_(obs))^(T)C_o^(-1)(o(m)-o_(obs)).
(15)

最大似然模型是最大化 rho_(post)(m) 的模型 m。它也是最小化 S(m) 的模型。它可以使用拟牛顿算法获得,

 m_(n+1)=m_n-H_n^(-1)gamma_n,
(16)

其中 黑塞矩阵 S

 H_n=I+C_mO_n^(T)C_o^(-1)O_n
(17)

并且 梯度 S

 gamma_n=C_mO_n^(T)C_o^(-1)(o(m_n)-o_(obs))+(m_n-m_(prior)).
(18)

这里,切线线性算子 O_n 通过以下方式定义

 o(m_n+deltam)=o(m_n)+O_ndeltam+....
(19)

正如我们所看到的,算法收敛的模型 m_infty 最大化了后验体积概率 rho_(post)(m)

为了估计后验不确定性,可以证明,在高斯体积概率的协方差算子,在 m_infty 处与 rho_(post)(m) 相切的是 H_infty^(-1)C_m


此条目由 Albert Tarantola 贡献

使用 Wolfram|Alpha 探索

参考文献

Groetsch, C. W. 反问题:本科生练习. Washington, DC: Math. Assoc. Amer., 1999.Kozhanov, A. I. 复合型方程和反问题. Utrecht, Netherlands: VSP, 1999.Mosegaard, K. and Tarantola, A. "反问题的概率方法。" 在 国际地震与工程地震学手册,A 部分. New York: Academic Press, pp. 237-265, 2002.Prilepko, A. I.; Orlovsky, D. G.; and Vasin, I. A. 数学物理中反问题的求解方法. New York: Dekker, 1999.Tarantola, A. 反问题理论和模型参数估计. Philadelphia, PA: SIAM, 2004. http://www.ccr.jussieu.fr/tarantola/.

在 Wolfram|Alpha 上引用

反问题

请引用为

Tarantola, Albert. "反问题。" 来自 MathWorld--Wolfram Web 资源,由 Eric W. Weisstein 创建. https://mathworld.net.cn/InverseProblem.html

主题分类