全微分的概念
全微分是多元函数微分学中的一个核心概念,它描述了当函数的所有自变量都发生微小变化时,函数值的总的、线性的近似改变量。与偏导数关注单一变量变化不同,全微分考虑的是所有变量同时变化对函数值的综合影响。
如果一个多元函数在某一点的变化量可以用一个关于自变量变化量的线性函数来很好地近似,我们就称这个函数在该点是可微的,这个线性函数就叫做函数在该点的全微分。
数学定义
假设有一个二元函数 \(z = f(x, y)\)。
函数的增量 (Total Increment):
当自变量 \(x\) 从 \(x_0\) 变为 \(x_0 + \Delta x\), \(y\) 从 \(y_0\) 变为 \(y_0 + \Delta y\) 时,函数的全增量为:
\[\Delta z = f(x_0 + \Delta x, y_0 + \Delta y) - f(x_0, y_0)
\]
可微性 (Differentiability):
如果函数 \(f(x, y)\) 在点 \((x_0, y_0)\) 的全增量 \(\Delta z\) 可以表示为:
\[\Delta z = A \Delta x + B \Delta y + o(\rho)
\]
其中 \(A\) 和 \(B\) 是只与点 \((x_0, y_0)\) 有关的常数,\(\rho = \sqrt{(\Delta x)^2 + (\Delta y)^2}\) 是点 \((x_0+\Delta x, y_0+\Delta y)\) 与点 \((x_0, y_0)\) 之间的距离,而 \(o(\rho)\) 是比 \(\rho\) 更高阶的无穷小(即 \(\lim_{\rho \to 0} \frac{o(\rho)}{\rho} = 0\)),那么我们就称函数 \(f(x, y)\) 在点 \((x_0, y_0)\) 可微。
全微分 (Total Differential):
如果函数 \(f(x, y)\) 在点 \((x_0, y_0)\) 可微,那么其全增量 \(\Delta z\) 的线性主部 \(A \Delta x + B \Delta y\) 就称为函数 \(f(x, y)\) 在点 \((x_0, y_0)\) 的全微分,记作 \(dz\) 或 \(df(x_0, y_0)\)。
可以证明,如果 \(f\) 可微,那么常数 \(A\) 和 \(B\) 恰好是函数在该点的偏导数:
\[A = \frac{\partial f}{\partial x}(x_0, y_0) \quad \text{and} \quad B = \frac{\partial f}{\partial y}(x_0, y_0)
\]
因此,全微分的表达式为:
\[dz = \frac{\partial f}{\partial x}(x_0, y_0) dx + \frac{\partial f}{\partial y}(x_0, y_0) dy
\]
这里,\(dx\) 和 \(dy\) 分别表示自变量 \(x\) 和 \(y\) 的微分(或微小改变量),即 \(dx = \Delta x\) 和 \(dy = \Delta y\)。
全微分与全增量的关系
全微分 \(dz\) 是全增量 \(\Delta z\) 的线性近似:
\[\Delta z \approx dz
\]
当 \(\Delta x\) 和 \(\Delta y\) 都很小时,这个近似非常精确。
可微的充分条件
一个常用的判断函数是否可微的充分(但非必要)条件是:
如果函数 \(f(x, y)\) 的两个偏导数 \(\frac{\partial f}{\partial x}\) 和 \(\frac{\partial f}{\partial y}\) 在点 \((x_0, y_0)\) 的某个邻域内存在,并且在点 \((x_0, y_0)\) 连续,那么函数 \(f(x, y)\) 在该点可微。
推广到多元函数
对于 \(n\) 元函数 \(w = f(x_1, x_2, \dots, x_n)\),如果在某点可微,其全微分定义为:
\[dw = df = \frac{\partial f}{\partial x_1} dx_1 + \frac{\partial f}{\partial x_2} dx_2 + \dots + \frac{\partial f}{\partial x_n} dx_n
\]
例子
例1: 求函数 \(z = f(x, y) = x^3 + y^3 - 3xy\) 的全微分。
计算偏导数:
\[\frac{\partial z}{\partial x} = 3x^2 - 3y$$ $$\frac{\partial z}{\partial y} = 3y^2 - 3x
\]
由于这两个偏导数在整个 \(xy\) 平面上都是连续的,所以函数 \(f(x, y)\) 在任意点 \((x, y)\) 都可微。
写出全微分:
根据全微分的定义:
\[dz = \frac{\partial z}{\partial x} dx + \frac{\partial z}{\partial y} dy$$ $$dz = (3x^2 - 3y) dx + (3y^2 - 3x) dy
\]
这就是函数 \(z\) 在任意点 \((x, y)\) 的全微分。
例2: 求函数 \(w = f(x, y, z) = e^{xyz}\) 的全微分。
计算偏导数:
\[\frac{\partial w}{\partial x} = e^{xyz} \cdot (yz) = yz e^{xyz}$$ $$\frac{\partial w}{\partial y} = e^{xyz} \cdot (xz) = xz e^{xyz}$$ $$\frac{\partial w}{\partial z} = e^{xyz} \cdot (xy) = xy e^{xyz}
\]
这些偏导数在 \(\mathbb{R}^3\) 空间中处处连续,因此函数 \(w\) 处处可微。
写出全微分:
\[dw = \frac{\partial w}{\partial x} dx + \frac{\partial w}{\partial y} dy + \frac{\partial w}{\partial z} dz$$ $$dw = (yz e^{xyz}) dx + (xz e^{xyz}) dy + (xy e^{xyz}) dz$$ $$dw = e^{xyz} (yz \, dx + xz \, dy + xy \, dz)
\]
例3:用全微分进行近似计算
估计 \(f(x, y) = \sqrt{x^2 + y^2}\) 在 \((x, y)\) 从 \((3, 4)\) 变化到 \((3.01, 3.98)\) 时函数值的改变量。
我们知道 \(\Delta z \approx dz\)。
计算基点 \((x_0, y_0) = (3, 4)\) 处的偏导数:
\[\frac{\partial f}{\partial x} = \frac{x}{\sqrt{x^2 + y^2}} \implies \frac{\partial f}{\partial x}(3, 4) = \frac{3}{\sqrt{3^2 + 4^2}} = \frac{3}{5}$$ $$\frac{\partial f}{\partial y} = \frac{y}{\sqrt{x^2 + y^2}} \implies \frac{\partial f}{\partial y}(3, 4) = \frac{4}{\sqrt{3^2 + 4^2}} = \frac{4}{5}
\]
计算自变量的变化量:
\[dx = \Delta x = 3.01 - 3 = 0.01$$ $$dy = \Delta y = 3.98 - 4 = -0.02
\]
计算全微分 \(dz\):
\[dz = \frac{\partial f}{\partial x}(3, 4) dx + \frac{\partial f}{\partial y}(3, 4) dy$$ $$dz = \left(\frac{3}{5}\right) (0.01) + \left(\frac{4}{5}\right) (-0.02)$$ $$dz = \frac{0.03}{5} - \frac{0.08}{5} = -\frac{0.05}{5} = -0.01
\]
所以,函数值的改变量 \(\Delta z\) 的近似值为 \(-0.01\)。
(实际改变量:\(f(3, 4) = \sqrt{3^2 + 4^2} = 5\)。\(f(3.01, 3.98) = \sqrt{(3.01)^2 + (3.98)^2} = \sqrt{9.0601 + 15.8404} = \sqrt{24.9005} \approx 4.99004\)。实际增量 \(\Delta z = 4.99004 - 5 = -0.00996\),与 \(dz = -0.01\) 非常接近。)
总结来说,全微分是函数全增量的线性近似,由函数在该点的所有偏导数和各自变量的微分(改变量)线性组合而成。它是多元函数局部线性化的基础。
直观地解释一下为什么在可微的定义中,线性部分的系数 \(A\) 和 \(B\) 必须是偏导数 \(\frac{\partial f}{\partial x}\) 和 \(\frac{\partial f}{\partial y}\)。
回顾一下可微的定义:
如果函数 \(z = f(x, y)\) 在点 \((x_0, y_0)\) 可微,那么其全增量 \(\Delta z\) 可以写成:
\[\Delta z = f(x_0 + \Delta x, y_0 + \Delta y) - f(x_0, y_0) = A \Delta x + B \Delta y + o(\rho)
\]
其中 \(A, B\) 是与 \((x_0, y_0)\) 有关的常数,\(\rho = \sqrt{(\Delta x)^2 + (\Delta y)^2}\),且 \(\lim_{\rho \to 0} \frac{o(\rho)}{\rho} = 0\)。
我们需要说明为什么 \(A = \frac{\partial f}{\partial x}(x_0, y_0)\) 并且 \(B = \frac{\partial f}{\partial y}(x_0, y_0)\)。
直观证明思路:
这个可微的定义描述了当 \(x\) 和 \(y\) 同时发生微小变化 \((\Delta x, \Delta y)\) 时,函数值 \(z\) 的变化 \(\Delta z\) 的情况。这个公式必须对所有趋近于 \((0, 0)\) 的 \((\Delta x, \Delta y)\) 都成立。
那么,我们可以考虑一些特殊的变化路径来简化问题,看看能得到什么结论。
情况1:只让 \(x\) 变化,保持 \(y\) 不变
我们让 \((\Delta x, \Delta y)\) 沿着 \(x\) 轴方向趋近于 \((0, 0)\)。也就是说,我们固定 \(\Delta y = 0\),只让 \(\Delta x \to 0\)。
在这种特殊情况下,\(\rho = \sqrt{(\Delta x)^2 + 0^2} = |\Delta x|\)。
\(o(\rho)\) 就变成了 \(o(|\Delta x|)\)。
全增量 \(\Delta z\) 变成了 \(f(x_0 + \Delta x, y_0) - f(x_0, y_0)\)。
将 \(\Delta y = 0\) 代入可微的定义式中:
\[f(x_0 + \Delta x, y_0) - f(x_0, y_0) = A \Delta x + B \cdot 0 + o(|\Delta x|)
\]
\[f(x_0 + \Delta x, y_0) - f(x_0, y_0) = A \Delta x + o(|\Delta x|)
\]
现在,我们将上式两边同时除以 \(\Delta x\)(假设 \(\Delta x \neq 0\)):
\[\frac{f(x_0 + \Delta x, y_0) - f(x_0, y_0)}{\Delta x} = A + \frac{o(|\Delta x|)}{\Delta x}
\]
接下来,我们取极限 \(\Delta x \to 0\)。
等式左边,根据偏导数的定义,\(\lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x, y_0) - f(x_0, y_0)}{\Delta x}\) 正是函数 \(f\) 在 \((x_0, y_0)\) 点关于 \(x\) 的偏导数 \(\frac{\partial f}{\partial x}(x_0, y_0)\)。
等式右边,我们需要看 \(\lim_{\Delta x \to 0} \frac{o(|\Delta x|)}{\Delta x}\)。根据 \(o(|\Delta x|)\) 的定义,我们知道 \(\lim_{\Delta x \to 0} \frac{o(|\Delta x|)}{|\Delta x|} = 0\)。由于 \(\frac{|\Delta x|}{\Delta x}\) 的值是 \(\pm 1\)(有界),所以 \(\lim_{\Delta x \to 0} \frac{o(|\Delta x|)}{\Delta x} = \lim_{\Delta x \to 0} \left(\frac{o(|\Delta x|)}{|\Delta x|} \cdot \frac{|\Delta x|}{\Delta x}\right) = 0 \times (\pm 1) = 0\)。
所以,取极限后,我们得到:
\[\frac{\partial f}{\partial x}(x_0, y_0) = A + 0 \implies A = \frac{\partial f}{\partial x}(x_0, y_0)
\]
情况2:只让 \(y\) 变化,保持 \(x\) 不变
同理,我们让 \((\Delta x, \Delta y)\) 沿着 \(y\) 轴方向趋近于 \((0, 0)\)。即,固定 \(\Delta x = 0\),只让 \(\Delta y \to 0\)。
\(\rho = \sqrt{0^2 + (\Delta y)^2} = |\Delta y|\)。
\(o(\rho)\) 变成 \(o(|\Delta y|)\)。
全增量 \(\Delta z\) 变成 \(f(x_0, y_0 + \Delta y) - f(x_0, y_0)\)。
将 \(\Delta x = 0\) 代入可微定义式:
\[f(x_0, y_0 + \Delta y) - f(x_0, y_0) = A \cdot 0 + B \Delta y + o(|\Delta y|)
\]
\[f(x_0, y_0 + \Delta y) - f(x_0, y_0) = B \Delta y + o(|\Delta y|)
\]
两边同时除以 \(\Delta y\)(假设 \(\Delta y \neq 0\)):
\[\frac{f(x_0, y_0 + \Delta y) - f(x_0, y_0)}{\Delta y} = B + \frac{o(|\Delta y|)}{\Delta y}
\]
取极限 \(\Delta y \to 0\)。
左边是 \(\frac{\partial f}{\partial y}(x_0, y_0)\) 的定义。
右边的 \(\lim_{\Delta y \to 0} \frac{o(|\Delta y|)}{\Delta y} = 0\)。
所以,取极限后得到:
\[\frac{\partial f}{\partial y}(x_0, y_0) = B + 0 \implies B = \frac{\partial f}{\partial y}(x_0, y_0)
\]
结论:
通过考察函数仅仅沿着坐标轴方向(即一次只改变一个变量)这种特殊情况下的变化,我们从可微性的定义出发,直接推导出了线性部分的系数 \(A\) 和 \(B\) 必须等于函数在该点的偏导数。这说明,如果一个函数的变化可以用一个线性函数来近似(即函数可微),那么这个线性函数的系数(即变化率)必然是在各个坐标轴方向上的变化率(即偏导数)。