变分法是一种证明某些方程存在性和唯一性结果的方法;特别是,它可以应用于一些偏微分方程。该方法的工作原理如下:假设我们要解决一个关于变量
的方程(这个变量也可以是一个函数)。我们寻找一个函数,其最小值满足该方程,然后证明存在一个最小值。因此,我们得到了一个存在性结果。
在某些情况下,我们还能够证明满足方程的值
是该函数的最小值。如果我们现在了解该函数的最小值的数量,我们也将知道该方程解的数量。如果该函数只有一个最小值,那么我们就得到了一个唯一性结果。
有时,变分法也以“相反的方式”工作:我们有一个难以找到最小值的函数。然后我们证明该函数的最小值正是易于求解的偏微分方程的解。然后我们求解偏微分方程以获得函数的最小值。
考虑方程组

对于函数
。如果存在函数
使得

我们发现,方程组
当且仅当以下条件满足时成立

如果
满足正确的条件,那么
恰好在一个点
成立
证明:
由于
是强凸函数,所以对所有
,
是正定的。因此,每个临界点都是局部最小值(这是局部极小值的充分条件)。因此,我们只需证明只有一个局部最小值即可。
1.
我们证明存在局部最小值。
我们在
处使用泰勒公式
![{\displaystyle \forall x\in \mathbb {R} ^{d}:\exists \lambda \in [0,1]:f(x)=f(0)+x^{T}\nabla f(0)+{\frac {1}{2}}x^{T}H_{f}(\lambda x)x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff4b82286e7eb92c4299dc64489447d4962039bc)
因此,
![{\displaystyle {\begin{aligned}\forall x\in \mathbb {R} ^{d}:f(x)&=f(0)+x^{T}\nabla f(0)+{\frac {1}{2}}x^{T}H_{f}(\lambda x)x&{\text{ for a }}\lambda \in [0,1]\\&\geq f(0)+x^{T}\nabla f(0)+{\frac {c}{2}}\|x\|^{2}&f{\text{ is strongly convex}}\\&\geq f(0)-\|x\|\|\nabla f(0)\|+{\frac {c}{2}}\|x\|^{2}&{\text{Cauchy-Schwarz inequality}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cd56732ff66aeb96145f80ee6e9b6e63f1364154)
对于一个
。因此,存在一个
使得

根据极值定理,存在一个最小值
在
中。它不能在边界上取得,因为如果
,那么
,因此根据
,
,这意味着
不是最小值。因此它是在内部取得,因此是一个局部最小值。事实上,从
和
在
上是最小值,甚至可以推断它是
的全局最小值。
2.
我们证明只有一个局部最小值。
设
和
是两个局部最小值。我们证明
,从而排除两个不同最小值存在的可能性。我们定义一个函数
如下所示

让我们计算
的一阶和二阶导数

由于
和
都是局部极小值,
和
。因此,

以及

因此,根据中值定理,存在一个
使得

但由于

,
意味着
.
推论 13.3:
假设我们有一个方程组

如果存在一个函数
,它是强凸的,并且

,那么方程组
恰好有一个解。
证明:参见练习 1。
示例 13.4:
另一个例子在练习 2 中给出。