重新理解高等数学中的极限定义

因为前段时间看到了近期大量的机器学习模型出现，很多的AIGC产品密集面世，忽而觉得自己快要落伍了。所以下定决心想好好学习一下。

所有人工智能的基础都是数学，当然，其他科学也莫不如是。所以，摆在眼前的第一个难题就是：高等数学。有句话叫“出来混总是要还的”，如今就是到了“该还”的时候了。遥想在学校学习时（已然是十多年前了，又是遥想当年），对于高等数学的第一堂课就感到深深地疑惑，倒不是觉得它很难，而是给人一种很怪异的感觉。为什么课本上要把一个原本直观的概念讲得这么的晦涩难懂呢？当时没有学好高数的很大一部分原因是这个吧。因此，最近重新把课本捡起，对于这部分也格外投入。我想要真正地学懂某个东西，最浅而易见的方式就是将它讲给不懂的人听，并且使对方能够听懂了。所以这里简单地总结一下自己的理解，主要是为了让自己在“极限”这个概念上加深理解，更重要的是破除之前疑虑，一解十年遗恨。

话不多说，先放上同济版《高等数学》中对于函数趋于定点的极限定义，如下：

定义设函数 f(x) 在点 x_0 的某一去心领域内有定义. 如果存在常数 A，对于任意给定的正数 \varepsilon (不论它多么小)，总存在正数 \delta，使得当 x 满足不等式 0 < |x - x_0| < \delta 时，对应的函数值 f(x) 都满足不等式

|f(x) - A| < \varepsilon ，

那么常数 A 就叫做函数 f(x) 当 x\rarr x_0 时的极限，记作

\lim\limits_{x\rarr x_0}f(x) = A 或 f(x) \rarr A (当 x\rarr x_0).

这个定义准确地说并不是同济版《高等数学》给的，而是所有高等数学都是这样定义的。在这个定义之前，我们对极限的朴素理解是，它在描述某个变量无限趋近某个值时，它对应的函数值在无限趋近某个值。这样的理解似乎是更符合直觉的，也是更易于理解的。但是教材上为什么不用那种直白的表述而要引入这样一个不易理解的表述来描述这个事实呢？至于这个问题，这里暂且不表。

多年以前，我虽有这样的疑问，但很遗憾地是并没有将它诉诸老师或者网络，从而求得解答。并且由于其看似不证自明而有时又非常突兀地将某个诧异的论点得证，这让年轻时的我常常感到兴致索然，进而对高等数学失去了兴趣。

然而即使时隔多年的现在，无奈重拾课本之初，也是同样的感觉，但不同的是，我总觉得它里面蕴含着很多道理。它应该是在想以某种当前并不易于接受的角度去概述一个自己并不曾见过的“世面”。当某天，如果有幸站上了某个高度再去俯看它全貌的时候，这种描述也许就是我们在那个高度，对于如何描述我们所看到的这一片星辰大海最简洁而明了的语言了。

带着这样的信念，我试着重新理解“极限”的概念，仔细地重新理解了相关的几个章节的内容，以确保即使不理解它，但至少还能套用得了它。也尝试在网络上寻找答案，相信不只是我才有类似的疑问。

事实也是如此，在知乎上也有人问“为什么我觉得高等数学的证明是在套公式”，这个问题跟我的疑问很相似，几乎雷同。这个问题的回答有很多有用的材料，给了我许多的启迪。所以本文的理解主要也来自这些材料。

对我一点点理顺这个逻辑的过程而言，我觉得首先得理解一下“定义、公理、定理、引理、推论”等这些概念。网上有很多的资料。这里个人的理解是这样的：

当我们需要研究某个新的领域时，那么我们就得先明确我们研究的是什么。因为它是独创的，是全新的，在此之前的世界是不存在这个东西的，或者说是没有被发现的，所以需要给这个东西作出全新的定义。而前面提到的这个听上去很绕的“极限”定义就是这样的操作。它是在定义一个全新的领域——极限。因为它需要能够被所有懂数学的人所理解，所以它必须要用“数学的语言”来描述，否则，它将无法在数学的世界里通行。

一个新的领域被定义之后，可能会有一些必然的，易于被大众所接受的规则存在。例如 1+1=2 ，这是不需要证明的（被大家讹传的是证明 1 + 1，也就是哥德巴赫猜想。哥德巴赫猜想最初的内容可表述为“任何一个大于5的整数都可写成三个质数之和”。现在常见的猜想陈述为欧拉的版本，即“任何一个大于2的偶数都可写成两个质数之和"。即所谓的 1+1。而 1+1=2是公理，不需要证明）。这类规则叫作公理。

定理则是需要通过定义或公理加以证明的正确结论。推论是通过定理加以推导得到的结论。其他的概念大家可以在网络上找到，不赘述。

因此，一开始让我疑惑的东西其本不该被疑惑的。因为它是定义！它是在定义一个全新的东西。这里可以稍稍地哲学一点想象这样一个问题，当我们要说A是B的时候，是怎样一个过程？这里不妨作一下简单地推演。首先，B是什么？只有当我们把B定义好之后，我们才能清楚地划分好属于B的界限。而当A具备了B所具有的特定条件，我们才能说A像B。当A完全具备B所有的特质之后，我们才能说A是B。当然，这里看起来更像是 A\supseteq B 而不是 A \subseteq B。这里可能只是一个不恰当的比喻引入的谬误。我们可以更朴素地想一想，如果要把A划归到B这个类别里来，是不是说A一定要具备属于B的的特性呢？所以，当A满足b1,b2,b3等等这些特属于B的条件之后，我们就说它是B。“极限”定义就是在描述“极限”所具备的特性。因此，即使对于极限的定义有再多的疑惑不解，首先要疑惑的不应该是它的正确与否。第一要务应是先理解它在试图描述怎样的一个东西，然后才能质疑其正确性。而至于它描述的东西是否好理解，这其中可能是因为有些东西是“新”的，所以导致了它不好理解而已。例如极限定义引入了 \varepsilon - \delta 语言。它是在用一种数学界普遍认可的“语言”在描述“当某个变量无限逼近某个点时它的函数值无限趋近某个值”这样一个事实。所有具有类似性质的函数它需要满足符合“极限”定义的一些条件才能说它具有极限这样的性质。所以，之所以在证明一些诸如 \lim \limits_{x\rarr\infty}\frac{1}{x} = 0 这样一个一眼可以看出答案的证明题时，这种让人感到诧异，甚至像是在“自欺欺人”、或者不证自明的感觉，也许只是来源于对这种数学语言的生疏而已。

那么，在理解了上述的内容之后，再看一看下面这样的证明题该怎样做呢？

证明：\lim \limits_{x\rarr0}x+1 = 1.

要证明 \lim \limits_{x\rarr0}x+1 = 1 在 x \rarr 0 时的极限是 1 ，首先，它得有极限，如果它连极限都不存在，那证明将是徒劳。其次，它如果有极限，那就要证明它的极限是 1。因此，我们需要明确以下几个问题：

极限的定义是什么？
存在极限的条件是什么？
函数某点处的极限符合怎样的条件？

对于问题2，通过极限存在 准则I' 可以很好地判断，但是这里我们现在不能用，因为这个准则的基础是极限的定义，而现在就是要搞清楚极限的定义，所以不能因为B所以B，这样的逻辑就容易让人觉得“自欺欺人”。针对1、3则在极限的定义中有明确的阐述。所以，一切回到了如何来定义极限这件事情上。那么，我们试着按照 \varepsilon-\delta语言来套一下这个f(x)。

令f(x)=x+1 （这样更好描述“函数”这个概念）。
因为 f(x)=x+1 的定义域是整个实数域，所以它在x=0处以及附近都有定义，因此“设函数 f(x) 在点 x_0 的某一去心领域内有定义”这一点肯定是符合的。这里的 x_0 就是，即 x_0 = 0。
再看“如果存在常数 A，对于任意给定的正数 \varepsilon (不论它多么小)，总存在正数 \delta，使得当 x 满足不等式 0 < |x - x_0| < \delta 时”。也就是说，我们现在开始要构造一个条件，这个条件是要把函数的自变量限定到 x_0 附近，但不是 x_0。这里可以更进一步理解一下 0 < |x - x_0| < \delta 这个条件。绝对值符号要表达的是 x 这个可移动的点与 x_0 这个位置的距离是小于 \delta 的。至于 \delta 有多小，可以先不论，因为我们更关注的是当它小到一定程度时f(x)的情况。但它也不能等于，否则它就走到了x_0的位置上，也就没有“无限逼近”的含义了。所以，在这一步要构造的条件仅仅是让x不断地逼近x_0即可，至于它要逼近到怎样的状态，转到下一步。再根据 x_0 = 0 ，所以 x_0 趋近的状态就可以描述为 0 < |x| < \delta。
“对应的函数值 f(x) 都满足不等式 |f(x) - A| < \varepsilon ”。这里就表明了 x 与 x_0 的接近状态，它需要让 |f(x) - A| < \varepsilon 这个不等式成立。由于我们要证的是 f(x) 的极限是 1 ，因此不等式中的 A 就是1，所以，就是要让 |f(x) - 1| < \varepsilon 成立。这样才能够证明 f(x) 的极限值是 1 。
至此，我们已经顺着“极限”的定义正向地梳理了 \lim\limits_{x\rarr 0}f(x) = 1 所需要符合的“规定”，即所需要满足的条件。当它满足这些条件后它就符合了 x\rarr0 极限定义。所以，我们现在要“揪着辫子”往回走。我们先让符合条件的函数值这个条件得到满足 |f(x) - 1| = |x + 1 - 1| = |x| < \varepsilon ，这样就可以证明这个函数的极限存在且极限是 1。
再往回走，通过第3条得到的条件有，只要x 符合 0 < |x| < \delta 这样的定义时 f(x) 就有 |f(x) - A| < \varepsilon 特点。因此，只要取 \delta = \varepsilon 就有 |x| < \varepsilon 。也就使得 |f(x) - A| < \varepsilon 这个条件得以满足，这样就符合了极限的定义。

在上面的思路整理中第6点中的 |x| < \varepsilon 是很容易让人有“证明了个寂寞”的感觉，怎么结果已经拿到了，又反过来推原因了？以果索因？这里是所有导致“奇怪”感觉的来源。但是这里需要注意的是，|x| < \varepsilon 它是有两个来源的，一个是 |f(x) - A| < \varepsilon 这个关于函数值需要满足的条件化简得到的结果，另一个是自变量 x 在无限逼近这个过程表现出来的状态，即 0 < |x - x_0| < \delta 。由于需要满足函数值需要满足的条件，所以让 \delta 取得 \varepsilon 这个任意小值后得到的。因为它们是一样的，既个表明函数值条件得到了满足，也表明了自变量需要达到的状态。

至此，问题得证。

转载请注明：OpenMind » 重新理解高等数学中的极限定义

日	一	二	三	四	五	六
« 3月				6月 »
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31