tags
💙 灵感|Inbox
date
Jul 8, 2022
status
Published
category
Origin
zhihu.com
summary
事实上,我对导数的定义就跟迷糊,然后微分求那个求正方形面积就更加看不懂了,同济第七版让我越看越迷,…
type
Post
icon
password
slug
1657288103102
Tags
简悦
话说当年学习导数和微分的时候,我也是一头雾水。当时我的感觉就是都有导数了,干嘛还要微分??而且微分看起来和导数长的那么像,咋看都像是导数的重复。最让我迷惑的是 dx 这个玩意,一会可以用来约分,一会又可以当做 0,那么这两个不是矛盾的吗??比如下面一个例子:
今天终于有时间来好好弄明白这个问题了。有人建议说要搞懂这个问题要从微积分的发展史来看,确实是这样,不过我不建议上来就看这个历史,我会放在第二部分来讲。因为上来就看历史,先入为主,会造成更加的混乱。
下面的内容都是本人学习后根据自己所理解而写的,如有错误欢迎大神指正。
一、微分的本质
我直接先下个结论:微分本质是一个微小的线性变化量,是用一个线性函数作为原函数变化的逼近(或者叫近似)。
微分的定义是从导数而来的,我们简单回顾一下。
由导数的定义有
,那么则有
。
则可以得到如下结果:
当
趋近于 0,显然有
。现在我们将
定义为 dy。而
表示的是函数值的变化,显然 dy 的真正含义是对这种变化的逼近。也就是说我们定义微分,就是想借助微分这个工具来研究函数的变化趋势。从上面你可以明白两件事,第一微分,即 dy 不是一个符号哦,是真的有具体值得,它的值为
,第二观察下
,显然是一个关于
的线性函数,因此微分其实在一点处,用一个线性函数的变化来逼近函数的变化,你懂的,线性的东西,其规律好掌握嘛。好了,这下你明白微分到底是什么含义了吧。那么我们根据
还可以推导出更多东西,比如令里面的 y 为 x,则可以得到
,即
。那么 x 的微分也就出来了。说白了,dy 和 dx 表示的就是 y 和 x 的变化量,是一种具体的量,跟我们通常理解的变化差额没什么本质区别,只不过因为
趋近 0 这种极限的性质,让他变得特殊一点而已。因此我们在数学上给他起个牛逼的代号,微分!以后用到微分的地方太多了,所以要起名字。好,那么根据我们的定义,导数和微分的关系自然而然就出来了,由
,自然就得到
。是不是觉得导数和微分的关系其实也没有那么神秘,这一切都只源于那些数学大家的定义而已。所谓定义,肯定是人为的了,没什么道理可讲。
从上面微分的提出过程我们可以到,是沿着极限、导数、微分这个次序来架构的。因此可以说极限是导数和微分的基石。然后在历史上,可不是这样子的,甚至因此而引发了第二次数学危机呢!
这就得联系到开头我提到的那个例子,它的做法到底是对的还是错的呢?好像大多数同学都喜欢这么做。其实是按照目前的微积分体系来看,是错误的。为什么呢?这就要从微分的发展历史来说了。
二、微分的发展历史
我们现在所学的微分学一定是按照先极限、后导数、再微分这个顺序来学。但历史的发展可不讲究顺序性。
其实一开始极限还没有被发明的时候,人们因为实际需要,就迫切的发明出了微分。这段历史中的微积分学称之为古典微积分,古典微积分中产生了无穷小量这个概念,直接导致了第二次数学危机的产生。后来直到 200 多年后极限被发明出来,基于极限体系的微积分才完美解决了这个问题,数学家们开始基于极限思想将导数和微分的概念都重新建立了一遍。因此我们今天学习的都是极限微积分。但是有意思的是,在教材的介绍中,却总使用古典微积分的思想来使学生加强理解,最后的结果就是导致学生在学起来总觉得有糊里糊涂。而且不能真正的体味极限思想的本质含义。
2.1 古典微分
先给大家做个简单的介绍。
出于对函数变化趋势的研究需要,数学家们迫切想要知道函数在某一点处的变化值是多少。如下图:
于是数学家将函数值得变化量直接定义为 dy,而将自变量 x 的变化量直接定义为 dx。那么只要 dx 足够小,也就是说 b 点足够趋近于 a,函数的割线就足够能够描绘出函数在这个邻域中的变化情况。
但是这还不够,数学家还想定义切线。当时给出的定义是 dx 无限小,则割线就会无限与其切线重合。那么小到一定程度(b 与 a 重合),则割线自然就成为了切线。难道不是吗?
可是这个定义漏洞百出。因为我们都知道两点才能确定一条直线,如果 b 点都与 a 点重合了,那怎么会把切线给确定出来呢?数学家解释说,不重合,只是无限小。那么问题又来了,不管多小,只要不重合,那 dx 总会表示一段距离,那割线总会与函数有两个交点,有两个交点又怎么称之为切线呢?你看一个切线的定义真的是让数学家无所适从。其实本质是,dx 作为一个无穷小量,让数学家手足无措。无穷小到底是个什么鬼??奈何当时极限还没有被发明,死活谁也说不清趋近于无穷小的 dx 是个什么鬼。
但是微小的变化量还是迫切需要的,因此数学家赶鸭子上架。强迫定义 dy 为 y 的微分,dx 为 x 的微分(微分即微小的变化量)。因此微分这个词语在哪个时候已经被提出来了。然后把 dy/dx 定义为导数,也就是切线的斜率(即因变量微分与自变量微分之比为导数)。因此导数在那个时候又叫做微分的商。虽然定义了导数来表示斜率,通过点斜式解决了切线的求法。但是上面表述的关于切线的问题本质上并没有得到解决。
再自然而然的在计算导数时,就采取了这种方式(比如求 x 平方的导数):
也自然而然的产生了上图中我红色文字说明的问题。这问题就大了。有人开始抨击,尤其是教会的那些人,质问道 dx 到底是什么,一会为 0,一会又不为 0??为什么一个量会有两种不同形态,而且还能完全没道理的自由转换??于是第二次数学危机就这样爆发了。无穷小量直接挑战了数学的严谨性!没有严谨性的数学,将什么都不是!而在当时没有一个人将无穷小量说的清楚。
总结一下,古典微分学的特点:
(1)dy 和 dx 表示的是自变量和因变量的具体的变化。
(2)根据想象中的无穷小这个东西,定义了切线。
(3)然后将切线的斜率定义为导数。
可以看到古典微分学确实很直观,如果不假思索,确实非常易于理解。这也是为什么我们在教材中,在介绍什么是导数,什么是切线时,还是采用上面那张图来介绍。但是古典微分学的缺陷是非常严重的,就是无穷小量像个炸弹一样,随时把这个体系炸的血肉模糊。如果我们能很好的解决无穷小量这个问题,那么一切危机不都消除了吗?遗憾的直到 200 年后,极限被数学家发明了出来,无穷小才得到完美的解决。
2.2 极限微分学
终于极限被发明了出来。相应的什么是无穷小,也有了确切的、具体的定义。无穷小终于不再是幽灵了,被光明正大的纳入数学体系中。
那么基于极限是怎么定义导数的,大家还有印象吗?其实就是基于下面的这个式子:
数学家学聪明了。先抽象的把什么是导数定义出来(如上式),然后再去图像上讨论切线的含义。这样子一切都完美了。也就是所谓切线,其实就是趋近于 0 时,割线的极限。所谓无穷小,就是极限为 0 的量。还有疑问吗??数学家应该是心里十分痛快的,想大喊一句,还有谁(能挑战我的权威)!!哈哈。那么导数还是切线的斜率,这是没有变的。因此极限的发明本质上是让数学家们手上有了一套可以解释无穷小的理论体系,是一件相当称手的兵器。那么微分是怎么定义呢?就是按照我第一部分将的来定义的。也就是说我微分的定义,不再根据图像上直观来定义了。而是更加抽象了,加入了极限的思想。
其实这里有一个十分十分重要的变化,那就微分的含义看来与之前古典微分学是一样的,但是其本质已经天差地别了。如下:
相同的地方:都是表示微小变化的量。
不同的地方:
(1)古典微分是直接将变化的具体值定义成了微分,也就是直接就是
,但是在极限微分学中是
。一个符号的变化,其实就是极限理论的运用。也就是极限微分学中,微分是变化的逼近,而不是变化本身。
(2)极限微分学与古典微分学真的有很多巧合。所以给你造成了很多错觉。但是这一切真的只是巧合,是人为定义造成的。举例如下:
比如古典微分学中把导数直接定义为 ,这是简单粗暴的,没有任何理论体系的搭建的。而在极限微分学中,导数通过极限来定义的,但是巧合的是,我们再通过导数来定义微分后,竟然也能得到 。(具体过程参见第一部分)。这真的只是巧合,因此我们也继续成导数就是微商。
另外我们在复函函数求导时,有 ,咋一看,貌似是将 dt 约分得到。其实不是这样子的,写成这种形式是经过严格的数学极限证明的(数学分析教材上证明过程),而恰巧竟然跟 dt 被约分这么像。但是记忆的时候可以当做约分这么来记忆。
我想这也是为什么有时候感觉怪怪的,难以理解的原因吧。
三、开头提到的问题
现在来解决开头提到的问题。你大概知道了那种算法是错误的了吧。那是按照古典微分学的算法来算的(也就是 dx 在需要为 0 的时候就为 0,不需要的时候就不为)。那么按照极限微分学,怎么算呢?相信学过高等数学的都会算。过程如下:
我就不算了,上面的结果为 2x。
好了,最后做个总结:
(1)古典微分学和极限微分学最本质的区别就是,在前者的体系中,微分就是变化本身,而在后者中,微分是变化的逼近。
(2)微分是实实在在的一个量,是一个无穷小量(当变化趋近于 0 时)。它也是有自己的运算法则的,参见高等数学教材。其实跟导数的规则差不多。
(3)我们现在所学的体系,是按照先极限、再通过极限定义导数、再通过导数定义微分这个次数来的。但是在历史发展中,是先有的微分(即先定义出 dy),然后根据需要(为了解决切线问题)定义出导数的。
(4)至于为什么要把微分定义出来呢?相信如果你以后在数学的领域接触到更高深的知识,就会明白为啥子非得把微分定义出来了。
(5)求微分是求微分,求导是求导。不要因为某些历史造成的巧合就按照自己臆想的规则胡来(比如约分)。当想不明白的时候,多想想极限的思想。
四、导数和微分的区别
最后说一下导数和微分的区别:
导数:是指函数在某一点处变化的快慢,是一种变化率。 微分:是指函数在某一点处(趋近于无穷小)的变化量,是一种变化的量。
而对于多元函数而言,全微分就是指在各个自变量处的微分的和。也就是说总的变化量指各个分变化量的和,这样子就比较容易理解了。比如二元函数,所以dz=zxdx+zydy。
导数和微分的关系类似于速度和路程。也就是说两个变化量之间的比值为衡量变化快慢的变化率。比如速度就是路程的变化量和时间的变化量的比值。而对于一元导数就为 y 的变化量 dy 与 x 的变化量 dx 之间的比值。
====================================
更多可以参看我的另一篇文章多元函数的偏导数、方向导数、梯度以及微分之间的关系思考
Rainsley
千呼万唤始出来,失踪人口重新回归啦,emmmm,我的上一期文章还是四个月前发布的,具体没更新的原因后续我会以个人的小故事发出来的,最近也许会高产一些。
之前跟大家讲过极限是数分最最基本的概念,有了它才会有后面那么多的可微、可导、连续等概念。注:本文只讨论一元微积分(多元微积分相比一元的要复杂得多,不仅要考虑每个分量,还要考虑到每个分量之间的联系)
其实大家在高中就已经学过导数的概念,当时是由变化率这个概念提纯出来的概念,在函数图像上也有着特殊的几何含义——斜率,所以可以通过函数图像来判断一个函数的导数是否存在,即是否可导或者可微。如下图所示:
高中函数
导数的定义:
可以这样理解,
发生了一个小小的波动
,那么函数值的变化
是否相比与自变量的波动
成线性呢?即
是否成立,这里由于变化微小,所以考虑极限定义,如果这个极限存在那么就将它定义为函数
在该点的斜率,在几何上,也是切线与
轴非负半轴方向夹角的正切值(如上图所示)。
到了大学,定义几乎没变,只是对于条件或许更严格、更专业化而已。如下:
至此,大家也许会有疑问,本文题目一开始就提出了两个概念,可导 vs 可微,可微又是什么呢?
可微可以说是从是另一个方面说明函数变化率的概念,分析步骤差不多,如下:
函数自变量
发生了一个小小的波动
,那么函数值的变化
是否相比与自变量的波动
成线性呢?即
是否成立,跟上面差不多,换成了乘积形式,但是对于数学这却是两种完全不同的形式,这里由于变化微小,所以同样地考虑极限的定义,而且那些微小的不影响函数主要线性部分的因素不应该被忽略,所以会写成
那么可微的准确定义来了
是这样的,可微呢,可积这一套我们都是学习西方的,是英文翻译过来的。学到后面,你会发现,其实数学上的东西,线性的一般是最简单的,一般都很好研究,但是自然界或者实际中,很多东西往往都是非线性的,所以我们需要对它在极其微小处进行微元线性处理(物理上很多东西都是这样搞出来的),这也就是我们为啥定义微分要取主要线性部分,你再想想现实中,地球是球体,但是你生活的那一小点就是平面啊,也就类似进行了线性化处理。
所以基本从推导形式上就可以看出,对于一元函数这两个定义等价。接下来我们严格推理一下
必要性:
充分性:
好的,综上所述,我们基本完成了对于一元函数可微与可导的总结概述。
如果大家想进一步了解我们一元导数的进阶版 Frechet 导数,可以阅读我下面的文章:
如果大家觉得对你有帮助的话,可以关注、收藏、点赞一波。您的支持是对小编继续创作的最大动力。如果大家对这个专栏比较感兴趣的话,还可以关注我的专栏,专门介绍大学数学的学习思想、方法等,全是干货。
下期预告——一元函数的积分(这次小编一定不会拖更,尽情期待!!!)
Edward Chou
【官方双语】微积分的本质 - 01 -【官方双语】微积分的本质 - 02 - 导数的悖论【官方双语】微积分的本质 - 03 - 用几何来求导【官方双语】微积分的本质 - 04 - 直观理解链式法则和乘积法则【官方双语】微积分的本质 - 05 - 指数函数求导
谢邀.
同济的教材总感觉怪怪的, 你可以看这几个视频来图文并茂的理解这 3 个概念之间的关系. 后面还有几集, 讲解的很清楚的.
我猜你这个阶段在下个学期应该会面对线性代数, 而这个 UP 也有跟线代相关的视频. 都挺好的.
(๑•̀ㅂ•́) ✧加油
高数变简单
为这个问题我专门做了个视频讲座,之前好多人看了都还点赞,相信你看后也能拨云见日!
顺便毛遂自荐自己写的高等数学专栏高等数学 - 随笔分类 - iMath - 博客园,很多文章都是受国外优秀英文教材的启示而写的。
我打算把高等数学里那些自己已经弄得的难点写出来方便后来者,我尽量把那些知识点得轻松好懂、不再迷惑。另外也可以关注微信公众号:高数变简单
ph hu
先说从几何上来说这个
微积分在历史上是基于两个问题发展而来的:
1)平面曲线的切线问题 (衍生出来的速率问题啊等等)→ 单元微分
2)平面曲线围成的面积问题 (求路程,求做功等等)→ 定积分
需要注意的是这两个问题在历史上是独立发展的,知道微积分基本定理出来之前,没有人会把微分跟积分联系在一起。
1)平面曲线的切线问题
i 导数
现在假设有一条曲线 S,我们要求出它的任意点上的切线。对此我们先将这条曲线解析化,而且为了方便处理,该曲线的函数是一一对应且
平滑没断点
。取该函数上一点
,为求该点上的切线,很自然的就用上了斜率公式:
问题就出现了,我们到底该减掉什么东西 (?),才能满足这个斜率公式?对此我们不妨再取一个点
,并作出两点割线的斜率:
,
从图上来看,
随着 不断的逼近 ,或者说
(of course, y depends on x)
趋势于 0
,
割线将与切线重合。
从数学上来说,就是对于所以大于 0 的数
,总存在一个数
,使得当
满足不等式
, 也就是
极限
:
我们把上述操作称为点
求导,那么进一步的,对于任意
可导函数
, 其导数就被定义为函数
,
ii 微分
好了,现在我们已经从导数求出点
的切线,虽然
, 但是它们毕竟还不是 0,所以我们的下一问题就是
是什么?
根据 Fig 2. 来看,
比
大那么一点点(因为后者是由前者
的),或者说
其中
是一个比
还小的量,我们称之为
,也就是说,
,且由于
, 于是在忽略
后,
我们在把
取为
,我们就得到
的微分
进一步的,对于任何函数的微分:
其实在一元微积分中,微分和导数是
完全等价
的,
可导必可微(反之也成立)
,更进一步来说,导数其实是
微分之间的比值
,所以导数又叫微商,更重要的是,根据微分与导数的关系,我们可以自由移动
,这在微分方程上是相当重要的一个逻辑问题。那么微分有啥用呢?
局部近似用的!
想一想为什么在 x 特别小的时候
,
(先别考虑
)?
2)平面曲线围成的面积问题
现在同样是一条曲线 S,我们要求出该曲线与横轴一个确定的区间所围成的曲线
先假设该区间为
,我们知道如果取
为高,那么长方形的面积
终会小于该曲线的实际面积,反正如果取
为高,那么长方形的面积
又终会大于曲线的实际面积。
也就说真是
实际面积应该在这两者之间
,
我们将 称之为下积分,将 称之为上积分
现在我们在区间里面取个中点
,这样我们就相当于两个区间
, 重复上述操作,我们将得到一个更大的
和一个更小的
也就说随着区间分割量的增大,上积分将越来小,下积分将越来越大,最终两者都会无限趋近于一个值,这个值就是实际的面积
用分析学的语言就是,将
分割成
份区间
定义
为每个区间里面最大函数值 (区间的上确界),
为每个区间里面最小的函数值(区间的下确界)也就是
和
我们有上积分
以及下积分
当且仅当 的分割数能达到上积分等于它的最小值,下积分等于它的最大值
则函数可积,且其积分值为
记为
上述称之为达布积分分割法
更精确点,比如说我们取上积分,我们发现可以上面这段话 “区间分割量的增大,上积分将越来小,最终趋近于一个值” 可以用极限的语言来描写
对于任意的
, 总存在一个
, 对于分割,只要它的子区间的最大值小于
,总有
, 那么该函数可积,且积分值为
当然这种描述对于任何分割方式和取面积方式都是成立的,所以可以写成
上面就是黎曼积分的表达式。
直到现在为止,微分和积分都是没有一毛钱关系的。
3)
刘浩浩
导数叫做微商,是微分除以一个对应的极小的变化量,积分呢就是把所有微分求和。最简单的来说就这么个关系
Macimee
简单点说,在一元函数下,微分运算和积分运算是互逆的,也就是说:
当
为
高阶无穷小时,
和微分的关系,可以近似表示为:
所以,微分、导数、积分这三者的关系,可以近似表示为:
布洛芬缓释胶囊
在一元函数下
这是
微分
这是
差别不过就在于
的位置,所以这时候的导数又有种叫法叫微商。
多元函数就不是了。
关于导数的定义,有一个简单的办法就是套用瞬时速度的概念。这是在书上看来的,我觉得很方便理解导数的概念。在这里写下来当作回顾好了。
还记不记得高中时候的物理公式
。先回忆一下,后面就用到它。
先找出 “瞬时”
我们想求某一时刻的瞬时速度,必然需要这个时刻的值。
瞬时究竟是多短的时间?这是个很抽象的概念,没法直接像 1 分钟,1 秒钟这样把它表达出来。
但这点小问题就能难住我们吗,之前学的极限的思想正好就能拿来用。
先取两个时间点 u 和 t。
让 u 趋近于 t
这时
瞬时速度 v
就是在这个很小的时间段下的速度
但是光写个极限是不行的,我们需要算出来。
这时候就得用开头的公式了。
把位移表示出来:
因为某一时刻的位移是特定的,所以这可以构成一个函数的关系(一个 x 值对应一个 y 值),
f(u) 和 f(t) 就分别表示 u 时刻与 t 时刻的位移,f(u)-f(t) 就是时间 u 到 t 走过的位移。
_时间:_u-t
套公式:
平均速度
把极限的思想加进去来求瞬时速度:
这时候做个小替换,既然 u 和 t 有个差,就把它表示出来 u=t+x。当 u 趋近于 t 时,x 也在不断变小,于是
前面的瞬时速度表达式就变成了
是不是和导数的定义很像。
再回想一下高中学的,速度描述了啥?快慢。
同样的,导数(速度)描述了函数(时间和位移的关系)的变化剧烈程度(快慢)。
严谨一点,就成了:一个函数(时间和位移的关系)在某一点(瞬时)的导数(瞬时速度)描述了这个函数在这个点的变化率(快慢)。
李三畏
三者之间有联系,以 f(x) 及其不定积分为例:
1)导数,即函数的变化率,记为 f’(x),即当Δx→0 时 f’(x)=limΔy/Δx.
2)微分,即函数的主要变化,记为 dy,即 dy=AΔx,也即微分等于Δx 的 A 倍,A 的大小仅取决于 x 而不取决于Δx.(若需考察函数的全部变化,则用Δy= AΔx + o(Δx),o(Δx) 为比Δx 更快地趋近于 0 的一个变量,故而 o(Δx) 可忽略不计,此时Δy≈AΔx,也即微分 dy≈Δy).
3)积分,即微分的逆运算,也即已知一个未知函数 F 的导数为 f(x) 时求 F,记为∫f(x)dx,即∫f(x)dx={F+C, C∈R}. 符号 f(x)dx 应作为整体使用,不能理解为∫f(x)*dx.
格物致知
个人理解,仅供参阅
总结: ①微分与积分是相反的一对运算;