凹凸性的另一种定义与直观重构 在微分几何的宏大叙事里,凹凸性似乎一直和“凸”字绑定在一起。就像-description 里的结论,往往把凸的定义讲得头头是道,再用一坨公式证明凹凸也能算凸。但实际上,数学界早就有人把“凹凸”提出来了。
特别是给欧几里得空间里光滑凸函数加个二次导数。
这种定义别看听起来像是在堆砌符号,但它的核心逻辑实际上挺好办。 这就好比你在平面上画一条曲线。传统的凸函数定义是说,曲线和它切线围成的区域要么在曲线上方,要么就在曲线下方,一辈子不翻白眼。但要是你换个角度想,只看二阶导数,情况就彻底不同了。假设你有一个光滑函数,它的二阶导数一辈子非负。
这时候,你能够直接定义它的凹凸性。
如何定义呢?最好办的办法就是看二阶导数的符号。
要是二阶导数大于零,那就是下凸;要是小于零,那就是上凸。
这就像看一个抛物线,开口向上就是下凸,开口向下就是上凸。
这种定义不需求管切线跟曲线下方的关系,直接看二阶导数就行。 这就引出了难题。
为啥给欧氏空间里的凸函数加个二阶导数定义能行得通?出于数学大厦讲究的是“一致性”,局部和全局的视角要是能重合,那就是对的。对于凸函数,二阶导数一辈子非负。
故此这时候,下凸和凸是同一个意思,上凸和凸是同一个意思。
这时候,凹凸性就退化成了一种更精细的细分。 再来看个例子。假设你有一个函数 $f(x)$,在实数轴上。标准的凸函数定义是:对于任意两点 $x_1, x_2$ 和任意 $lambda in [0,1]$,都有 $f(lambda x_1 + (1-lambda)x_2) le lambda f(x_1) + (1-lambda)f(x_2)$。
这实际上是说函数图像在连接两点的线段下方。但要是你手里有二阶导数 $f''(x) ge 0$,那你只需求验证 $f''(x)$ 恒大于零,这立马就能推出上述不等式。
这时候,凹凸性就变成了一个判定工具。
只要二阶导数恒大于零,你就直接断定它是下凸。 那有没有可能反过来?比如二阶导数是负的,但函数还是凸的?这就有点巧了。二阶导数负的时候,函数实际上是凹的,这时候它不知足凸的定义。
故此,二阶导数的符号直接锁定了凹凸性。
只要二阶导数恒大于等于零,它就是下凸;只要恒小于等于零,它就是上凸。 这种定义的优势在哪?起初,它不需求依赖具体的几何位置,比如切线是否穿过曲线。
这在某些高维空间要么非欧几里得空间里特别有用。它和欧拉-拉格朗日方式里的 Hessian 矩阵直接对应。
要是你要判断一个多元函数是凸的,你只需求看 Hessian 矩阵是不是半正定的。而在单变量情况里,只要一阶导数从负变正,要么二阶导数恒大于零,函数就是递增的。
这时候,凹凸性就和单调性挂钩了。 实际上,给凸函数加二阶导数这个操作,本质上就是给函数加了一个“加速度”的监控。
要是加速度(即一阶导数)一直在增添,那函数就只能一直往下掉,要么先上后下,但绝不会形成“笑”的弧度(即不能像山谷一样连接两点)。
要是加速度一直在削减,那函数只能一直往上爬,要么先下后上,但绝不会形成“山”的弧度(即不能像山峰一样连接两点)。 再深入一点,这种定义在泛微分方程里特别关键。
要是你在解一个偏微分方程,一般需求边界条件加上初始条件。
要是不明确函数是凸的,解出来的轨迹可能不稳定。
这时候,凹凸性作为一个强约束条件,能保证解的存有性和唯一性。
比如牛顿法求极值的时候,要是目标函数是凸的,那么一步步走下去,最终一定能碰到那个最陡的地方,并且不会绕圈。 还有个有趣的点,就是它和詹森不等式相关。詹森不等式说,函数值的加权平均,不会小于函数在权重平均下的值。
这实际上就是一种说功能值的“超凸”性质。
要是你把二阶导数看作是一个小小的“权重”放大器,那函数的凹凸性就在这个放大器的功能下被进一步确认了。 不过,这种定义也带来了一些争议。
比方说,有些双曲几何里的空间,别看局部看起来像欧氏空间,但二阶导数的定义却可能失效。
这时候,我们就得退回到传统的切线定义,哪怕它略微有点费事。但在欧氏空间这个标准框架下,二阶导数定义简直是把凹凸性抠得死死的。 最终总结一下,凹凸性在欧氏空间里,通过二阶导数这个“过滤器”,直接筛选出哪局部函数是下凸,哪局部函数是上凸。
这比传统的切线定义更直接,也更符合当前分析的直觉。
只要二阶导数符号明确,凹凸性就立竿见影。