从微积分到集合论(1630-1910)(历史简介)——第3章——数学分析的出现及其基础性进展(1780-1880)(I.Grattan-Guinness)

第 3 章   数学分析的出现及其基础性进展

(The Emergence of Mathematical Analysis and its Foundational Progress,1780-1880)

Grattan-Guinness

目录

3.1  数学分析及其与代数和几何的关系(Mathematical analysis and its relationship to algebra and geometry)

3.2  教育的助推和国别分析学比较(Educational stimuli and national comparisons)

3.3  振动弦问题(The vibrating string problem)

3.4  18 世纪晚期关于微积分基础的观点(Late-18th-century views on the foundations of the calculus)

3.5  Fourier级数对数学分析的影响(The impact of Fourier series on mathematical analysis)

3.6  Cauchy的分析:极限、无穷小量和连续性(Cauchy's analysis : limits, infinitesimals and continuity)

3.7  关于Cauchy的微积分(On Cauchy's differential calculus)

3.8  Cauchy分析:级数的收敛性(Cauchy's analysis : convergence of series)

3.9  Fourier级数的一般收敛性问题(The general convergence problem of Fourier series)

3.10  函数级数研究的一些进展 (Some advances in the study of series of functions)

3.11  Riemann和Weierstrass(对微积分)的影响 (The impact of Riemann and Weierstrass)

3.12  一致性的重要性 (The importance of the property of uniformity)(译注:一致收敛,一致连续)

3.13  后Dirichlet函数理论 (The post-Dirichletian theory of functions)

3.14  证明方法和微积分的完善 (Refinements to proof-methods and to the differential calculus)

3.15  统一与划分是进步的双重助力 (Unification and demarcation as twin aids to progress)


3.1  数学分析及其与代数和几何的关系(Mathematical analysis and its relationship to algebra and geometry)

在本书中,我们假设读者理解其主题的本质,但不了解其历史发展。我将在开篇利用这一事实,以通常在大学本科阶段数学授课的形式描述数学分析(与更现代的处理方法相对,后者用于更高层次的教学和研究,但本文未提及)。通过这样直接明确“目标”,我希望读者更容易理解实现这一目标的相当复杂的步骤。

这类数学分析教科书通常以一章开篇,内容涉及实数线(数轴)的结构(包括非比数(irrational)的定义)、极限的定义和基本性质,以及不等式的算术。有时,它们也包含拓扑概念,例如邻域、聚点(accumulation points)、开集和闭集以及覆盖定理;但由于这些概念的历史主要属于本书的后续章节,因此我在此不再赘述。之后,教科书会继续讨论函数连续性的定义,以及函数(单变量和多变量)的基本定理。本书会广泛讨论微积分,首先介绍导数作为差商的极限,然后介绍中值(均值)定理、带余项的Taylor级数等等。积分被解释为面积,并定义为分割和(partition-sums)序列的极限值。接下来是对均值定理、与微分的逆关系以及许多其他结果的阐释。此外,还可以有一节关于无穷级数收敛性的内容:其定义、收敛的必要条件和充分条件,以及一些收敛性检验方法。一个重要的改进是关于函数级数(而非常数级数):定义了一致收敛,并讨论了其对验证分析过程的影响。此外,还可以讨论 Fourier级数,这是函数级数的一个特别重要的例子;计算了它们的系数,描述了它们表示函数的方式,并建立了它们的收敛性检验方法。此外,还经常引入Fourier积分,并证明其逆定理。

这种数学分析的一个显著特点是它明显地独立于代数和几何。尽管代数公式和几何图形会被运用,但它们对于该学科的严谨性或合理性而言并非至关重要。这可以在极限理论以及主要基于不等式运算对(小)量进行处理的证明方法中找到。数学分析的另一个特点是,其基础极限理论将原本略显不同的数学分支统一起来

在本章中,我将概述这一独立而统一的理论在19世纪的诞生,从18世纪后期的初步探索开始,一直延续到1880年左右。我还涵盖了一些后来的发展,第四章和第五章中关于积分和集合论的论述对这些发展进行了相当的补充;但自1860年左右以来,数学分析的发展是如此的多面和复杂,由于篇幅原因,我仅指出了这些发展所基于的主要思想。按照序言的提到的介绍顺序,下一节将讨论该学科的动机及其在不同国家的发展。

3.2  教育的助推和国别分析学比较(Educational stimuli and national comparisons)

    在第二章中,我们看到微分方程及其解成为微积分的一个非常重要的应用。这一特点在19世纪也得以保留,尤其是在带边界条件的偏微分方程应用日益增多的情况下。数学教育是数学分析发展的另一个推动力,尽管形式不同。从1696a年巴黎高等师范学院l’Hôpital的教科书早期开始,微积分就以教科书的形式进行讲授,并且微积分与教育的密切联系一直持续到该学科扩展到数学分析。在第0.1节中,我提到1795年巴黎高等理工学院(Ecole Poly technical)的成立是科学教育史上的一件大事。分析学在那里(以及巴黎高等师范学院)的数学教学中得到了很好的体现,Laplace和Lagrange教授了重要的课程。他们的助手中有一位名叫Riche de Prony的优秀数学家,他对科学的主要贡献在于工程学。以下是他1799年在巴黎综合理工学院“纯分析与应用分析(pure and applied analysis)”讲座课程导言中的一段引言,其中指出,代数、级数和微积分是该课程的组成部分(1799a,第215-216页):

    “数学分析分为两部分一部分我们称之为确定性分析(analyse déterminée),它考虑未知但不变量与题目中给定的其他量之间的关系:它们之间的关系通过方程式建立;另一部分会向你讲解入学考试中未要求的理论的各个方面。

    这些研究将我们引向了级数学说,从许多角度来看,它与第一部分密切相关,但与第二部分(我们称之为“不确定分析(analyse indéterminée)”)的关系更为密切以至于从某种角度来看,它可以被看作是从一个部分到另一个部分的过渡

    第二部分考虑了问题给出的量与通用共法则约束的无限值的其他量之间的关系……

    纯分析课程将以微积分学作为结课,没有这些,就不可能成功地将数学应用于自然现象。”

然而,我之前提到的对这一主题(subject-matter)的综合(synthesis),并非归功于Lagrange,Laplace或de Prony。这主要归功于Augustin-Louis Cauchy,他同样在巴黎综合理工学院的讲座中有所贡献。他的《分析课程》(Cours d'analyse)(1821a)就是基于他在那里的讲座;该课程的第一卷(也是唯一一卷)出版的副标题是“代数分析(Algebraic analysis)”,并在导言中对该主题进行了如下描述:

“……我依次论述了实函数和虚函数、收敛或发散级数、方程的解法以及比率分式(rational fractions)的分解等各个方面。在论述函数连续性时,我必须阐明无穷小量的主要性质,这些性质正是无穷小量微积分的基础……

至于方法,我力求赋予它们几何学所需的所有严谨性,从而避免诉诸代数普遍性的论证。这类论证,虽然通常被接受,尤其是在从收敛级数到发散级数,以及从实数到虚数表达式的过程中,但在我看来,它们仅仅被视为归纳法,有时适合于探求真理,而与数学科学所推崇的精确性相去甚远。”

本书涵盖了极限、连续函数理论以及级数。(书中还包含一些其他主题,我就不赘述了。) 微积分部分则留到他1823年的《简历》中,其中写道(1823a,导言):

“本书应皇家理工学院教学委员会的要求而作,提供了我在该校讲授的无穷小量微积分课程的概要……我所采用的方法在几个方面与同类著作中阐述的方法有所不同。我的主要目标是将严谨性(我在《分析课程》中将其定为法则)与直接考虑无穷小量而产生的简单性相协调。”

这些教科书以及Cauchy的其他教科书奠定了数学分析的风格。它们也延续了Lagrange和Laplace开创的、至今仍延续的传统:杰出的法国数学家们在巴黎以《课程》(Cours)或《理论》(Traites)的形式呈现他们的教学成果。Cauchy的教科书质量极高,以至于几十年来,他的后继者们只对其主题进行了修改和扩展。

与此同时,数学的主导地位正从法国转移到德国许多经典的法语教材被翻译成德语(尤其是由C.H.Schnuse翻译),而数学分析的下一个重大进展则来自Karl Weierstrass,这既体现在他自己的著作中,也体现在他19世纪60年代初在柏林听他讲课的学生的著作中。正是由于这个学派,而不是Cauchy时期,数学分析才开始形成现代教科书开篇所阐述的形式。

英国人在这方面表现如何?2.2节指出,他们直到19世纪初才固执地坚持Newton流数方法。Robert Woodhouse 的著作或许标志着一种转变的开始,但即使是他的《解析计算原理》(Principles of analytical calculation)(1803a)也表明他们对数学分析中的基础问题认识有限。Leibniz微积分的转变伴随着爱尔兰数学家观点的转变,尤其是19世纪10年代由三位后来成为重要科学家的本科生在剑桥创立的“分析学会(Analytical Society)(参见Dubbey 1963a)。他们最有益的贡献之一是于1816年出版了Sylvestre-Francois Lacroix 所著微积分教科书的英译本。与de Prony一样,Lacroix也是一位相当优秀的数学家,他擅长编写广为使用的教科书。在有限的范围内,他提出了一套极限理论,但即使如此,对他的译者来说也难以理解。译者在序言(Lacroix 1816a, iii-iv)中写道:

“Lacroix的著作,其译本现已公之于众,……可视为其巨著《微积分学论文》(Differential and Integral Calculus:[Treatise])的删节版,尽管在论证基本原理时,他用D'Alembert的极限法取代了前者采用的最正确、最自然的Lagrange方法……注释的前十二篇由Peacock先生撰写,主要目的是使学生能够运用Lagrange原理,并采用作者那些不涉及极限理论的表述和例子。”

换言之,分析学会想要将分析提升到法国人试图摆脱的境界!直到19世纪40年代初,大陆分析学派才在英国产生重大影响。当时,William Thomson(后来成为Kelvin勋爵,但当时还是个青少年)开始研究 Fourier级数和积分。即使在那时,英国人的兴趣也主要集中在数学物理的应用上,而这些应用取得了非常辉煌的成就(参见Burkhardt 1908a,第13章和14章各处),而不是基础研究这些研究更多地集中在微分算子的演算及其运算定律上(参见Koppelman 1972a)。直到本世纪初,G. H. HardyW. H. Young的研究才将基础研究完全引入英国的教育和研究领域

最后,在本节中,需要对意大利进行一些评论。与英国一样,意大利数学家倾向于追随法国和德国取得的成果。他们直到19世纪70年代后期才开始崭露头角,当时Ulisse DiniGiuseppe Peano撰写了重要的教科书Peano领导了一群意大利数学家他们通过引入新的数理逻辑技术,参与了Weierstrass分析的阐释。我们将在本书的本章及后续章节中看到Peano及其学派工作的证据。

3.3  振动弦问题(The vibrating string problem)

读完这些预备章节后,现在是时候重拾2.7节中留下的Euler微积分的线索了。我们在那里看到,尽管Leibniz微积分的基础尚不完全清晰,但他对Leibniz 微积分进行了相当大的改进和扩展微积分中要使用的函数的性质是基础难题之​​这个问题在振动弦的分析中非常突出。简要总结一下18世纪中期一场相当广泛的讨论,甚至可以说是一场论战(更多详情,请参阅Truesdell 1960b,第3部分或Grattan-Guinness 1970a,第1章),表示运动的偏微分方程一致视为是“波动方程”

(3.3.1)        \displaystyle \frac{\partial^{2}y}{\partial{x}^{2}}=\frac{1}{c^{2}}\frac{\partial^{2}y}{\partial{t}^{2}}   ,

其中 y 是一个均匀弦在 x 轴上相距 π 的两个点处在时间 t 时刻这个点 x 的横向位移。这个微分方程的解是

(3.3.2)        y = f (x + ct) + g(x - ct)  ,

其中,fg 由初始条件确定。但 (3.3.2) 式中允许的函数范围存在争议;Euler坚持允许使用带角函数来表示弦(或者更确切地说,是该事件的数学理想化),但d'Alembert反驳说,二阶微分在这样的点处不存在,因此 (3.3.1) 式不适用于此。然而,Euler坚持认为,在 (3.3.2) 式中,对于 fg 可以允许使用“完全任意”的函数;它们不必由代数表达式或力学定律来定义。

    随后,Daniel Bernoulli 于1753a年加入了讨论,他基于弦振动谐波分量的叠加背景论证道,弦在任何给定时刻都表现出正弦振动的组合,因此其形状不是由(3.3.2)给出,而是确定于

(3.3.3)                 \displaystyle f (x) = \sum_{r=1}^{\infty}a_{r}\sin{rx}  。

Bernoulli并没有包含t的项,因此降低了其论证的有效性。由于只使用了正弦项,他也限制了其解的通用性,并且没有提供计算(3.3.3)式中系数的数学方法。

    1759年,Lagrange在其职业生涯的初期,对这个问题进行了全新的分析,捍卫了公式(3.3.2)及Euler对其的诠释,但采用了不同的方法。由于篇幅过长,本文不便赘述(其中一处公式Bernoulli公式(3.3.3)表面上相似),但它大量运用了级数运算。

    此后,讨论更多地转向了立场的重申和论战,尽管也考虑了一些有趣的额外因素。整个讨论具有重要的历史意义,因为它是构建和求解表示物理问题的偏微分方程的一个重要的“验证案例”。让我提一下几个方面。首先,波动方程(3.3.1)没有争议,但它的推导方式不同。d'Alembert和Euler最初的推导是通过分析弦的无穷小分片的运动得到的;但Lagrange(Euler也曾一度采用)使用了“n体模型”方法,其中弦解释为n个相等且等距的质量,由无重量的绳索连接,确定每个质量的运动,并将n取无穷大。其次,函数解(3.3.2)是通过不同的方法得到的;d'Alembert最初的推导涉及将独立变量 xt 到 (x - ct) 和 (x + ct) 的变换,但后来他也考虑了变量分离。第三,(3.3.2) 中的函数在代数或几何意义上的可定义性引起了激烈的争议,没有人对如此定义的函数的合理普遍性提供清晰的解释。最后,从解中得出了各种物理结果。

3.4  18 世纪晚期关于微积分基础的观点(Late-18th-century views on the foundations of the calculus)

    回到微积分的基础,我再次回顾Lagrange的工作。在他于1759a撰写第一篇关于振动弦问题的论文之前,他曾对Berkeley关于误差补偿的思想印象深刻(参见2.11节),但从1772a起,他断言每个函数都可以展开成一个 Taylor 级数

(3.4.1)          f (x + i) = a_{0} + a_{1}i + \frac{1}{2!} a_{2} {i}^2 + ...  ,

且其微分系数(他称为“导数函数”)定义为展开式 (3.4.1) 中的系数 a_{0} ,   a_{1} ,  a_{2} , ...  。(该级数载于 Taylor 1715a,第 21-23 页;MacLaurin 于 1742a 如此命名,Newton,Leibniz等人也知晓它。) 他还说,这些系数可以通过“摆脱对无穷小,零量,极限和流数的所有考虑,而归结为有限量的代数分析”的方法来计算。这段引文出自他的主要分析教科书《函数论》(Theorie des fonctions analytiques)的标题,表明他认为这些系数可以通过正统的代数方法获得。1813 年第二版的开篇充满了他特有的乐观主义:

“我们将任何以任何方式代入这些量的计算表达式称为一元或多元函数……最早的分析家们使用函数一词泛指一个量的幂。从那时起,该词的含义被扩展为任何以任何方式由另一个量形成的量……当我们通过添加一个不确定量来为函数的变量赋予任何增量时,如果该函数是代数函数,我们可以按照代数的一般规则将其展开为该不确定量的幂。展开式的第一项将是所提出的函数,我们将其称为原函数(primitive function);后续项将由同一变量的不同函数乘以不确定量的连续幂构成。这些新函数唯一地依赖于它们派生自的原函数,可以称为派生函数(derived junctions)(译注:或导出函数或导函数,简称“导数”)……在本著作中,我们将看到,通常称为超越函数或无穷小函数的分析本质上只是对原函数和导函数的分析而微分和积分计算严格来说只是对这些相同函数的计算(译注:即微分是对原函数的计算,积分是对导函数的计算)。

Lagrange证明了微积分的基本定理但只能通过代数方法得到简单函数的“导数”。尽管他对幂级数的重视影响深远(参见 Yushkevich 1959a),并且他提出的导数这一术语以及“ f^{'}(x) " ," f^{''}(x) " 等符号也被广泛采用但似乎很少有重要的数学家采纳他的观点(参见 Dickstein 1899a 和 Yushkevich 1974a,并注意到上文 3.2 节中分析学会是他的支持者)。也许Lagrange本人并不完全满意,因为在他担任柏林科学院数学系主任期间的1784 年提出了一个有奖问题,呼吁“对数学中所谓的‘无穷(infinite)’提出一个清晰而精确的理论”

“众所周知,高等几何经常使用无穷大和无穷小……因此,学院希望解释为什么这么多正确的定理都是从一个矛盾的假设中推导出来的,同时……一个真正的数学原理可以恰当地取代无穷大原理……”(注:英国皇家科学、艺术和纯文学学院新回忆录(1784 年:出版于 1786 年),第12-13 页 )(Nouveaux memoires de V Acade'mie Roy ale des Sciences Arts et Belles-Lettres, (1784 : publ. 1786), 12-13,) 。

1786 年,该奖项授予了Simon L’huilier,他对极限及其对微积分的影响进行了深入而又艰辛的研究。他首先以d'Alembert风格定义极限(见上面的 2.12 节),即一个变量可以与之相差任意小的值,并证明了乘积和除法定理:

(3.4.2)       

 \displaystyle \lim_{n \rightarrow \infty}{(p_{n}/q_{n})}=\lim_{n \rightarrow \infty}{(p_{n})}/\lim_{n \rightarrow \infty}{(q_{n})}  , 

\displaystyle \lim_{n \rightarrow \infty}{(p_{n}q_{n})}=\left ( {\lim_{n \rightarrow \infty}{(p_{n})}} \right ) \left ({\lim_{n \rightarrow \infty}{(q_{n})}} \right ) 。

(假设极限存在:第 18-24 页、第 204-206 页)。他还介绍了符号“lim”,在他论文的修订版中,他提到了一个显而易见但迄今为止似乎未被注意到的事实,即趋向于极限的过程不必是单调的(1795a,第 17-21 页)。

    L’huilier 在 1786 年对微积分的处理非常有趣,因为他以现代风格定义了导数:dy/dx 是差商的极限 dy/dx 应读作单一符号而不是比率(第 24,44 页)。讽刺的是,他将其称为“差分比率”这导致了定义和术语的相当混乱的冲突。(英国几十年后的数学家们也采取了类似的方法;例如,Whewell (1838a, 第110页) 和 De Morgan (1842a, 第58, 50 页) 都这样定义‘微分系数’,并将‘dy/dx’ 视为一个整数符号。) L’huilier 还将积分定义为微分比的倒数,并称之为“积分比”

总而言之,L’huilier的大部分演讲都过于浮夸,这大大抵消了他的极限理论的清晰度,而且他的作品似乎并没有产生应有的影响力。当时更广为人知的是法国数学家和工程师拉Lazare Carnot(物理学家Sadi Carnot的父亲)的专著。奇怪的是,这篇文章的第一个版本也提交给了 1786 年柏林奖(参见 Yushkevich 1971a),但由于 L’huilier 赢得了那场比赛,所以它直到很晚才发表(参见 Carnot 1785a)。修订和扩充后的《反思一》(Reflections_{1} ) (1797 年),尤其是《反思二》( Reflections_{2} ) (1813 年) 非常受欢迎; Yushkevich 1971b 对这三者进行了比较。

Carnot考察了各种已知的微积分创立方法,包括Berkeley的误差补偿学说和Euler关于零点计算的观点(分别参见2.11节和2.7节)。他支持误差补偿,但他最有价值的讨论涉及无穷小量、微分和高阶微分的定义和使用。以下摘自他的《反思二》:“我把任何被认为是连续减小的量称为无穷小量,只要它能被减小到我们想要的任意小值,而我们不必因此而改变那些我们寻求其关系的[其他量]”(第14条)。我们理解,‘微分’是指一个变量所属的系统处于两个或多个连续状态时,其两个连续值之间的差,其中一个状态被视为恒定,而其他状态被视为同时且连续地趋向于第一个状态,直到与第一个状态的差值达到我们所希望的最小值”(第46条)。“我们不必考虑变量系统处于两个连续状态,而是可以依次考虑它处于两个、三个、四个或更多个连续状态,每个状态之间的差值都无穷小”(第68条)。高阶微分的定义类似,以dx的连续状态表示。

这些(以及其他)表述似乎涉及将量取为极限值;然而,在《反思二》中,Carnot似乎没有给出极限的正式定义,尽管在之前的版本中,“极限不过是一个指定的量,一个辅助量应该无限地逼近它,以至于它与该量的差值可以随心所欲地小,并且它的最终比率是一个相等的比率”(《反思一》第17条)。在这方面,Carnot的著作与L’huilier的著作一样成就断断续续,其进展不足以标志着根本性的改进

现在我来谈谈另一个有奖问题。1787年,Euler去世后,但无疑受到了他担任圣彼得堡科学院院长期间数学工作的影响,圣彼得堡科学院提出了一个关于函数的问题:

“如果通过对三元或多元[微分]方程进行积分而得到的任意函数表示任意曲线或曲面,无论是代数函数还是超越函数,无论是机械的、不连续的还是由手的随意运动产生的;或者如果这些函数仅由代数或超越方程表示的连续曲线组成?”(注:石油科学研究院新学报,5(1787 年:出版 1789 年),第 4 章。 第1,4-5 页。)( Nova acta Academiae Scientiarum Petropolitanae, 5 (1787 : publ. 1789), pt. 1, 4-5.)

这个问题的措辞充分体现了当时函数论的混乱状态;它充斥着来自各种来源的术语——力学,几何学,代数,以及当时仍有些不连贯的被称为“分析”的学科。问题提供的选择也很有趣:我们是否必须沉溺于这片混乱的海洋,还是可以退回到“用代数或超越方程表示的连续曲线”的安全地带?该奖项由Louis Arbogast获得,他支持Lagrange的微积分基础(参见他的1789a),并在他1791a的论文中以一种非常有趣的方式接受了这一暗示。我们在第一章和第二章中已经看到,微积分倾向于处理连续对象,曲线,值,函数,如果可能的话,也包括微分。Arbogast通过区分两种可能破坏“安全”连续性的方式,扩展了“安全”连续性的范围(1791a, 9-10):

1. 函数可以改变形式,也就是说,函数依赖于变量的规律可以突然改变。在这种情况下,由几段不同曲线的集合构成的曲线就是这种情况。假设曲线从AB是抛物线的一部分,从BC是椭圆的一部分,从CD是圆的一部分;连续性将在点BC处中断……

我们将把由几段曲线连接而成的曲线称为不连续曲线也把那些用手自由移动描绘的曲线称为不连续曲线,这些曲线在运动的任何部分都不受任何规律的约束;前提是曲线的所有部分都连接在一起,没有中断……我们所说的不连续函数,是指表示这种曲线的函数……

2. 当曲线的不同部分不连接在一起时,连续性定律再次被打破……

我们将这种类型的曲线称为不连续曲线因为它们的各个部分并不连接或者说不相邻,我们将与这种性质的曲线相对应的函数称为不连续函数。”

Arbogast在他的论文结尾认为,“一般来说,所有任意函数……都不受连续性定律或邻接性定律的约束”(1791a, 第96 页)。

我们必须注意这里的术语。曲线之所以“不连续”,是因为它们由不同的定律(或函数)定义,或者根本没有定律,但根据现代观点,它们是连续的,因为它们确实连接在一起。我们对不连续函数(即带有跳跃的函数)的概念被称为“不连续的”,而对于Arbogast来说,连续性被拓展到包括连续性、连通性——人们推测,也包括连接跳跃的垂直线。

这些定义的几何特征及其原因显而易见。代数函数论已变得异常复杂(参见 Yushkevich 1976a):一个表达式可以包含其路径上的一个角甚至尖点(例如,考虑绕原点的 x^{2/3} ),两个表达式的交点可以具有相同的切线(例如,x^{2}  表示正 x ,x^{3}  表示负 x ),等等。这种向几何学的转变是迈向数学分析的重要中间一步,我们也将在下一位人物——Joseph Fourier——的著作中看到这一点。

3.5  Fourier级数对数学分析的影响(The impact of Fourier series on mathematical analysis)

与de Prony(见上文3.2节)一样,Fourier在理工学院早期协助Lagrange和Laplace,但此后他不得不投身于各种公共事务。他曾作为平民参加了1798年至1801年的埃及战役,并于1802年至1815年担任意大利边境伊泽尔省的省长。

正是在这后期,他发展了本章中我们感兴趣的数学。1807年12月,他首次以一篇关于热传导的大型专著的形式向法国科学院(当时称为法国科学院)提交了他的研究成果。他的部分成果的合法性引发了争议,最终双方妥协,将热传导领域的一项有奖竞赛定于1811年举行。1812年,他凭借早期成果的扩展版赢得了奖项,但由于没有出版的希望,他开始撰写第三版,最终以书籍的形式出版,名为《热的解析理论》(Theorie analytique de la chaleur,1822a)。1811年的论文不久后发表,但1807年的专著仍保留着手稿。该书的一个版本收录于Grattan-Guinness和Ravetz 1972a的著作中。

他的工作主要关注他对物理现象新领域的数学化但我专注于数学分析的成果。表示热传导的方程根据物体形状以及是否考虑外部热传导而呈现不同的形式,但基本上,一个一维物体的一个点 x 在时刻 t 时的温度 y 所满足的“热传导方程”具有如下形式:

(3.5.1)    \displaystyle \frac{\partial^{2}y}{\partial {x^{2}}}=\frac{\partial{y}}{\partial {t}}  。

通过分离变量求解所得方程,然后再插入初始条件,即当 t = 0 时 y = f (x) ,他获得了 “Fourier 级数”

(3.5.2)    \displaystyle f (x) = a_{0} + \sum_{r=1}^{\infty}(a_{r}\cos{(rx)})+b_{r}\sin{(rx)}) \quad ( x\in[0,2\pi] )  。

Fourier 现在着手求热解传导方程的通解。对于某些物体和初始条件,(3.5.2) 中只出现正弦项(“Fourier正弦级数”,类似于Bernoulli在 (3.3.3) 中关于振动弦问题所提出的那种),而在其他配置中只出现余弦项和常数 a_{0} 。在这些情况下,x 的区间长度为 π 。

    Fourier  通过计算(3.5.2)中的系数(在这个问题上)超越了Bernoulli :

(3.5.3)  

 a_{0} = \frac{1}{2\pi} \int_{0}^{2\pi}f(u)du  ,

a_{r} = \frac{1}{\pi} \int_{0}^{2\pi}f(u)\cos(ru)du ,

a_{r} = \frac{1}{\pi} \int_{0}^{2\pi}f(u)\sin(ru)du  。

他的计算方法之一是逐项积分;但这并非他的创新之举,因为 Euler 1777a年就已经用这种方法得到了余弦系数。Fourier似乎独立地发现了(3.5.3),而且他在该级数最重要的方面——函数的表示方式——无疑超越了Euler 。

    微分方程完备解的主要问题在于确定它们的通解,或者说缺乏通解。Euler对Bernoulli三角级数(3.3.3)的反对意见之一是,其正弦函数的周期性和奇数性会阻碍通解函数的表示:“该方程[(3.3.3)]中包含的所有曲线,即使将项数增加到无穷大,也都具有某些特征,使它们区别于所有其他曲线”(Euler,1755a,第9条)。但波动方程(3.3.1)的解只需在x的有限区间内表示函数,因此这种批评是不正确的;但从历史上看,将其视为一个小小的失误是不明智的,因为它是一个重要的概念点,它深深地源于Euler为发展以代数为导向的微积分学。

    在这种以代数表达式及其运算为基础的演算中,函数通常会在其整个(有限或无限)可定义范围内使用。正如我们在3.4节中看到的,不连续函数可以由“连续”部分组成;但Bernoulli (3.3.3)或Fourier (3.5.2) 的解释还要求只需要f 在有限区间上(连续或不连续)的部分因此,要么(3.4.2)中的 “ = ”被限制在该区间内要么将f重新定义为在实数轴其余部分上周期性重复的函数。Euler承认f 的几何表示方式(1755a,第36条),但正如我们所见,他否认函数可以用三角级数表示。我确信他的疑虑与周期性和普遍性问题有关,而不完全与系数的计算有关;因为如上所述,他确实在1777a年的另一篇文章中计算了余弦系数,但并未将这一新发现与振动弦问题联系起来。直到Fourier在其1807年的专著中才完全阐明了这种表示方式。Fourier级数与其(通常是非周期性的)定义函数在定义区间之外有所不同;它通常也与函数的正弦和余弦级数不同,并且它们彼此之间也有所不同。

现在,诸如此类的想法与微积分的代数概念相去甚远:事实上,就像Arbogast在上一节中对不连续性与不连续性的区分一样,它们需要几何学的改变。据我所知,对它们最清晰的解释出现在Fourier 1807年的专著中。图 3.5.1 沿袭了他最初绘制的 y=\frac{1}{2}{x}  在 [0, π] 上的正弦和余弦级数(及其沿实数轴的延伸)的示意图,其中定义函数在第一种情况下也以虚线表示。图 3.5.2 则展示了他在 [0, π] 上的正弦级数以及在 [0, 2π] 上的完整级数表示,这些函数在部分定义区间为常数,在其余区间为零——Euler曾否认过这类函数可以用三角级数表示(Grattan-Guinness 和Ravetz 1972a, 第221, 226, 230, 271页)。现代教科书很少如此细致地解释Fourier级数的可表示性学生们常常觉得这个问题难以理解。我个人怀疑,造成他们理解困难的原因在于学校里教授和学习的是准18 世纪的微积分;它引导学生在大学里以Euler 的思维方式去研究Fourier级数

------------------------------图 3.5.1------------------------------------

------------------------------图 3.5.2------------------------------------ 

图 3.5.1 和 3.5.2 展示了Fourier的其他概念。与Arbogast一样,他将跳跃线与垂直线联系起来(他在图表的口头描述中也提到了这一点),大概是出于几何学的原因即级数的部分和(partial sums)是连续的因此极限曲线也应该是连续的——这意味着必要时的连续性。他还主张将他公式(3.5.3)中系数的积分解释为面积(必要时也可以解释为Leibniz-Euler意义上的和),而不是微分系数的倒数(Grattan-Guinness 和 Ravetz 1972a, 第213-215页)。我认为这里的影响并非来自Arbogast,而是Gaspard Monge,Fourier深受Monge的影响,并将他的几何数学风格运用到他的微分方程研究中(同上,第133-134 页)。

    关于Fourier级数的另一个基本问题是它们的收敛性。Fourier对各个级数给出了严格的证明(同上,第161,168,219),但在1807年,他并没有提供任何普遍的证明。然而,这一缺陷似乎并未成为随后争议的根源。可表示性问题似乎更为重要,值得注意的是,Fourier在其著作的后期出版版本中删除了他1807年清晰的表示图

    这场争论的参与者是谁?据目前所知,主要的批评者是Lagrange,他曾在自己关于振动弦问题的著作中支持Euler对Bernoulli三角解的批评,并且似乎以某种形式向Fourier复述了这些批评(同上,第169-172页)。他得到了Siméon-Denis Poisson和Jean-Baptiste Biot的支持,他们是Fourier那一代的巴黎专业科学家,也对热传导感兴趣,并预见到了竞争的临近。但Fourier也有支持者,包括Monge,Lacroix,尤其是Laplace,他是唯一一位地位与Lagrange相当的巴黎数学家

    Lagrange和Laplace的性格差异令人瞩目。Lagrange习惯于在其职业生涯早期就决定应该如何研究某个数学分支,并在其余生中坚持自己的观点;他对幂级数在分析中的运用只是其中一个例子。因此,他是一位数学政治家,事实上,到了19世纪,他已成为数学界的泰斗。相比之下,Laplace则务实且易受影响,无论在数学领域还是在公共生活中都是如此(尽管他坚持不懈地倡导Newton在物理学和天文学中的原理),他的行为举止更像一位数学政治家。因此,当Fourier级数在数学中意外地重新出现时,他被这种新的处理方式所吸引,并着手解决Fourier在其1807年的专著中未解决的一个问题。

    对三角级数的周期性存在一个合理的批评:它只能表示有限区间内的函数。Fourier无法求得无限区间的替代解,但在1809年,Laplace给出了一个线索,他给出了热传导方程(3.5.1)在无限x值范围内的积分解:

(3.5.4)     \displaystyle y = \frac{1}{\sqrt{\pi}} \int_{-\infty}^{\infty}f(x+2u\sqrt{t})\exp{(-u^{2})}du  。

Fourier随后寻求自己的积分解,经过极其不严格的微分运算,他求得了Fourier积分公式,其形式为

(3.5.5)     \displaystyle f(x) = \frac{1}{\sqrt{\pi}} \int_{-\infty}^{\infty}\int_{0}^{\infty} f(u)\cos{\bigg (q(u-x)\bigg )}dudq  。

他对这类解法的讨论构成了他1811年获奖论文的附加章节,并在他的著作(1822a 第342-385页)中得到了实质性的分析。这不仅对数学物理的发展具有重要意义也是数学分析时代的标志因为它涉及一种当时日益突出的函数由积分表示定义的函数。这类函数也为后来的一位重要人物——Augustin Louis Cauchy——的出现提供了早期的启发

3.6  Cauchy的分析:极限、无穷小量和连续性(Cauchy's analysis : limits, infinitesimals and continuity)

    Cauchy对数学分析的兴趣始于19世纪10年代初,当时他于1814a年撰写了一篇重要论文,开创了他的复变函数“留数积分(residue calculus)”。Adrien Marie Legendre是这篇提交给法国科学院(Académie des Science)的论文的审稿人之一,他与Cauchy就积分

(3.6.1)        \displaystyle F(a) = \int_{0}^{\infty}\frac{x\cos{(ax)}}{\sin(bx)}\frac{dx}{1+x^{2}}  

的求值问题发生了一场有趣的争论。(详情请参阅 Grattan-Guinness 1970a,第2章)。这个问题与此相关,因为与Fourier逆变换公式(3.5.5)类似它涉及一个由积分表示定义的函数在随后的几年里,Cauchy求得了各种微分方程的积分解并在1817a年自己发现了Fourier积分公式(3.5.5)。但他对实变量分析基础的深思熟虑直到19世纪20年代才出现,当时他出版了《分析教程》(Cours d'analyse)(1821a)和其他基于他在巴黎理工学院(Ecole Poly technique)教学的教科书。在本节和接下来的两节中,我将讨论这些贡献,除了他对积分的处理之外,关于积分的讨论将在下一章积分部分的4.3节中找到。

    在第 3.2 节中,我引用了Cauchy的《分析教程》,从中我们可以看到数学分析(按照现在这个术语所理解的意义)是如何实现的。他比之前的任何人都更详细地解释了极限理论,并基于以下极限定义对其进行表述:“当依次赋予某一特定变量的值无限地趋近于一个固定值,以至于最终与该值的差异尽可能小时,这个固定值就被称为所有其他值的极限”(1821a, 第4页;著作,第19页)。(注:引用Cauchy的《课程》时必须按页码编号,我给出了原版和Cauchy著作中的页码。为了简洁起见,我省略了提及该著作的相关卷,其是第3 卷第 2 序列) 此定义的用途之一是对无穷小的以下定义:“对于一个变量,当它的数值无限减小以致于收敛于极限零时,我们称其为一个无穷小量”(1821a, 第26页;著作,第37页)。

这两个定义对Cauchy的分析提出了一些重要的问题。如今,“变量”一词用符号来表示变量 x 是一个符号它无差别地指向一组值中的任一个但不指向一个变量数量因为不存在这样的对象但这种做法仅在数学基础研究中引入,如下文第 6 章所述。早期的数学文献对这个问题的阐述往往不够清晰,Cauchy对无穷小量的定义似乎就是一个例子(正如Bolzano在其 1851a,第 12 条中指出的那样);确实似乎存在一个变量,其数值趋向于零。这与Weierstrass学派(有时甚至是更早)以来所持的观点形成了对比,Weierstrass学派认为无穷小量是一个极限为零的变量,谈论无穷小量并不预设无穷小值的存在。Cauchy的定义中的短语“尽可能少”和“无限减少以致于收敛到极限零”留下了一个问题,即是否真的存在变量可以通向的无穷小值(关于这一点,请比较 5.13 节)。换言之,这些句子未能明确说明其值序列可以通向其极限的自变量的类型。(Cauchy可能给出了这些公式来涵盖实数的极限  \displaystyle \bigg (\lim_{x \rightarrow a}{f(x)} \bigg)    和整数的极限  \displaystyle \bigg ( \lim_{n \rightarrow b}{S_{n}} \bigg )     。 )  此事非同小可,因为这些后来的观点与Cauchy的概念(基本上与 2.2 节中的Newton的概念)具有相同的“动态”特征,即以零为极限值的值来表征无穷小量。相比之下,按 Leibniz和Euler 的“静态”无穷小类型,dx 是一个变量,即一个固定的值,如果是一个不确定的值它可能取决于 x 和其他变量,以及它们的微分(译注:不确定的值又怎么固定,此处原文似乎表述不清)。

我们要注意的下一个基本定义是函数 f(x) 的连续性:“如果在给定的极限之间,变量的无穷小增加总是导致函数本身的无穷小增加,则函数  f (x)  在给定的极限之间关于 x 保持连续”(1821a, 第34-35页;著作,第43页)。撇开“无穷小”的可能含义不谈,其他特征也很有趣。在提到“介于已知极限之间的”(所有)x 时,该定义似乎遵循了全局定义连续性的传统,并且他给出的连续函数的例子都是代数表达式;但定义条件是局部的,描述 f (x) 围绕 x 的行为,Cauchy在他的文章中单独描述了这种情况。再次,谈论“函数的增加”而不是按其值的变化(无论如何)体现了专注于单调递增函数(或等效地,未能取增量的正值)和将函数与其值关联的习惯(仍然存在!)。然而,Cauchy在上述引文之前提到了绝对值(对他而言是 “数值”)。与他的许多 18 世纪前辈不同,他很清楚地认为函数必须是单值的(1821a, 第34页;著作,第43页)。

    这些定义以及Cauchy分析的所有方面的最后一个特点是它们不依赖于几何考虑。通过使用极限理论作为基本性质定义的来源,以及不等式算术作为证明的主要手段,Cauchy能够使数学分析从几何和代数中独立出来。《教程》和关于微积分的总结(Résumé)的一个显著特点是没有使用任何图表,甚至没有用于说明目的。

3.7  关于Cauchy的微积分(On Cauchy's differential calculus)

    Cauchy在其1823a年的《总结》(Résumé)中首次详细讨论了他的微积分学,该书记录了他在巴黎理工学院教授微积分的经历。引言巧妙地批判了当时已去世十年的Lagrange,认为Lagrange相信Taylor级数是微积分的基础也遭遇了同样的命运。他提到了将Taylor级数的收敛性视为理所当然的危险,但他拒绝 Lagrange 观点的主要原因可以在第38讲中找到(最早也出现在他的1822a年的论文中);他指出,函数  \exp(-1/x^{2})  及其所有导数在 x = 0 时都为零,因此它在那里没有 Taylor 展开式。正如所料,Cauchy根据他在《课程》中提出的极限导向思想构建了一个系统;但他所创立的体系与现代处理方法完全不同。令 f (x) 连续且 i 无穷小;然后根据连续性的定义 ( f (x + ) - f (x)) 也是无穷小,如果它们的比率趋向于一个极限,则这个极限就是 Lagrange 导数 f^{'}(x)  :

(3.7.1)     \displaystyle f^{'}(x) \quad \overset{=}{\text{Df}} \quad \lim_{x \rightarrow 0} {\left \{ (f(x+i)-f(x))/i \right \} }    (1823a,讲座3 )。

他还定义了 f (x) 的“微分” df (x) 为

(3.7.2)   \displaystyle df(x) \quad \overset{=}{\text{Df}} \quad \lim_{\alpha \rightarrow 0} {\left \{ (f(x+\alpha {h})-f(x))/\alpha \right \} }  ,

其中,α 为无穷小量但 h 是有限量。(注:这一讨论与 Grattan-Guinness 1970a, 第58-60页中的讨论略有不同,遗憾的是印刷错误破坏了这一点:df (x) 的定义表达式中的极限是对 h 而不是 a 取的。Cauchy对微分的定义是由默默无闻的葡萄牙数学家 J. A. da Cunha 所预见的;参见Yushkevich  1973a。)  为是一种现今仍旧在使用和传授的微分类型(见 A.Taylor,1974a),但它明显不同于一般意义上的 Leibniz 微积分。因为它可以取有限值以及“无穷小”值。Cauchy 给出了示例:在( 3.7.1) 中设

(3.7.3)        i = \alpha {h}  ,

再根据 (3.7.2) 得到

(3.7.4)        df (x) = hf^{'}(x)  。

f (x) = 的特殊情况下,(3.7.4) 成为

(3.7.5)        dx = h ,

因此,这个微分取有限值 h (1823a,讲座4)。

    这种“新的”极限风格和过去的风格的奇妙混合,使得 Cauchy 微积分的形式出人意料(见 Robinson 1966a,第259-276页)。例如,将 (3.7.5) 代入 (3.7.4) 可得

(3.7.6)    df (x)/ dx = f^{'}(x)  ,

这是一个定理,并不是 df (x)/ dx  或 f^{'}(x)  的定义:它称导数 f^{'}(x) 等于微分 df (x) dx 的比率。因此,我们有由 (3.7.1) 定义的导数作为差商之极限,但我们没有 Lhuilier 或现代意义上的“ dy/dx ”(其中 y = (x))作为整体符号。高阶导数由Cauchy以相同的方式处理;例如,在第 12 讲中,根据 (3.7.2),二阶导数 f^{''}(x)  定义为 f^{'}(x)  的导数,二阶微分 ddy  由 f^{''}(x)(dx)^{2}  给出,而  d^{2}y/dx^{2}  是 ddy  与 (dx)^{2}  的比率 。

我现在将描述一些与Cauchy微积分相关的定理。一个直接的问题是连续函数是否可微。对我们所有人来说答案无疑是否定的,因为具有角的函数是连续的但在那里不可微。但在 18 世纪和19 世纪初不严格的系统下,连续性和可微性的性质还没有得到如此明确的定义,无穷小量可能允许将一个角解释为一个无限紧密(但可微)的环。例如,Lagrange相信Taylor级数中函数具有可展开性(见上面的 3.4 节),显然必然得出连续函数具有可微性,因为 f (x + i ) 关于 i 的幂级数展开式(3.4.1)必然是连续的(除非函数在 x 处出现无穷大,这时将涉及 i  的负幂),并且导数 f^{'}(x)  肯定可以计算出来。Andre Marie Ampère因其在电磁学方面的工作而被人们铭记,他是一位敏锐的分析评论家,并试图通过一种论证来改进这种推理方式,尽管这种论证非常模糊,但却树立了一种新的思维方式。为了方便起见,我将使用符号“DQ(pq)”来表示 ( f (q)- f (p))/(q - p) 对 (p, q) 的差商。Ampère假设 DQ(x , x + ) 的值不是无穷大或零,除非在区间[a, k]的“特定孤点”。然后他取了区间 [a, ] 的一个均匀的分割 \{x_{r} \}  ,并断言对于由分割定义的某个区间  (x_{j},x_{j+1})  有 DQ(a) 小于 DQ(x_{j},x_{j+1})  ,而对于另一个区间  (x_{m} , x_{m+1})  有 DQ(a) 大于 DQ(x_{m} , x_{m+1})   。这引导他得出结论,随着 x 在 [a, k] 中移动,  DQ(x_{j} , x_{j+1}) 从一个小于 DQ(ak) 的值转换到一个大于它的值。他还决定,DQ(x , x + ) 不能 “无限地增加或者减小”,而是,若 

(3.7.7)    f^{'}(x) + I = ( f (x + i) - f(x) )/i   ,

Ii 同时趋近地 0 (见 Ampère ,1806a )。

    Cauchy在自己对微积分均值定理的证明中运用了Ampère的方法。例如,他将Ampère 的不等式应用细化为如下引理:令  a_{1} ,... , a_{n}  和  \alpha_{1} ,..., \alpha_{n}  为两个实数集,后者共享相同的符号, 令 a_{r}/\alpha_{r}  的最小值和最大值分别为 mM 。则在 mM  之间存在一个 h 使得

(3.7.8)            \sum_{r=1}^{n}a_{r} = h\sum_{r=1}^{n}\alpha_{r}  

(1821a,第 16-17页,第 447-449页;著作,第 28-29,368 页)。他按如下方式将其应用于均值定理:令 f (x) 在 [x_{0},X]  上连续,并用点 x_{0} , x_{1} ,... , x_{n} ( = X )  分割这个区间为子区间。然后根据 (3.7.8) 得到

(3.7.9)        \displaystyle \frac{f(X)-f(x_{0})}{X-x_{0}}=\frac{\sum_{r=1}^{n}(f(x_{r})-f(x_{r-1}))}{\sum_{r=1}^{n}(x_{r}-x_{r-1})}=h  ,

其中,h  介于 DQ(x_{r} , x_{r-1})  的最小值和最大值之间,1 ≤ r (Cauchy 1823a,讲座 7 ) 。现在,当细分区间很小( < δ )的时候,对于每一个r , DQ(x_{r} , x_{r-1}) “总是”位于 f^{'}(x)  的一个很小的 ε 内。因此,h 在这个区间上也位于 f^{'}(x)  的最大最小值之间。此外,若  f^{'}(x) 在这个区间上是连续的, 则通过援引中值定理(intermediate),在《课程》中得到“证明”,但不可避免地缺乏严谨性(1821a,第43-44页,第460-462页;《著作》,第50-51页,第 378-380 页) 。在那个区间中的至少一个x 值在 (3.7.9)中一定可以取得一个 h 值。因此,正如预期,

(3.7.11)       f (X ) - f (x_{0}) = ( X - x_{0} ) f^{'}(x_{0} + \theta(X - x_{0})) (0 < \theta < 1)  。

总结(Résumé)末尾插入的“补充(Addition)”中,Cauchy以大致类似的方式证明了他的广义中值定理:

(3.7.11)    \displaystyle \frac{f(x)-f(x_{0})}{F(x)-F(x_{0})}=\frac{f^{'}(x_{0}+\theta(X-x_{0}))}{F^{'}(x_{0}+\theta(X-x_{0}))}  。

Cauchy定理的普遍性的局限性主要在于,他的证明(有意识地) 假设  f^{'}(x)   必须是连续的,并且(无意识地)假设若 (3.7.9)中的差商“总是”在 f^{'}(x_{r}) 的 ε 范围内,则它们在 [x_{r-1},x_{r}]  上一致收敛于导数,这本身实际上假设了要证明的定理(见 Flett 1974a,第 68 页 )。( Wererstrass 对定理的修订见下述 2.14 节所述,而一致收敛见 3.12 节所分析。) 严谨性的局限性是由于在“证明”诸如中间值定理之类的存在性定理时缺乏实线结构所有这些批评也以某种形式适用于Ampère的推理而其因不明确的极限理论而进一步受到削弱

关于 Cauchy 微积分的证明和定理,以及他在后来的论文和书籍中给出的结果和表达,还有很多可以说的。但上面的讨论应该传达出他的风格。我将以一些关于微积分发展过程中积累的令人困惑的各种术语和符号的评论来结束本节。

在现代方法中(同样见于 L’huilier 的方法中),函数 y = f (x) 的导数值定义为差商 ( f ( x + δx ) - f (x) )/(δx) 随着 δ ⟶ 0 的极限值表示为  f^{'}(x)  (若心里想的是 f (x) ) ,或用整个符号dy/dx”(若指的是 y)表示单独的dydx是不存在的在不定积分 \int{f(x)dx} 中,“dx作为集合符号 “ \int{dx} " 的一部分出现 Cauchy 的系统中  f^{'}(x)  是 f (x) 的导数值 (译注:实际上在提到导数值时,应该指具体某一点的导数值)但有时候(在Lagrange之后)也称为 f (x) 导数”。在 (3.7.2) 之后dy dx  确实存在。(注:它们甚至存在于 “\int{f(x)dx} "  中 ,因为当时Cauchy 将积分解释为是和 \sum{f(x)\Delta{x}}  随着 Δx “变得无穷小”时的极限值,而符号 “∫” “并不指任意更长的乘积之后……而是指这种类型的一个和的极限值”,dx 仍旧是一个微分且可以用(3.7.5)替换以产生“ \int{f(x)h} "  作为积分的另一种表达式(1823a ,讲座 21)。我不知道他指的是什么意思。)  由 Lagrange本人提出的导数 f^{'}(x) ,据称不是通过取极限或使用无穷小量求得的,而是对 Euler 微分系数理论 

(3.7.12)   dx = pdt ,dp = qdt 

的发展(见 2.7 节)。对于Euler 和 Leibniz 来说,像 dx 这样的微分在某种意义上确实存在,即作为 x 上的无穷小但非零的增量 dx dy/dx 不是单符号导数而是微分 dy dx 的比值(译注:在考虑微分的时候,这又表示比值而不是导数符号,但在考虑导数的时候它又作为整体表示导数而不能表示比值,这样确实容易引起混淆),d^{2}y/(dx)^{2} 是 ddy 与 (dx)^{2} 的比值,如此等等。这同样适用于 Cauchy 及其微分类型对于所有这些作者来说,“微分方程”的字面意思是与微分相关的方程。

这些符号的定义和解释种类繁多,很难解释,甚至很难从历史上追溯。当考虑多变量函数时,情况变得更加复杂,包括它们的偏导数,偏微分,全微分以及函数的函数微分(有关所引入符号的概述,请参阅 Cajori 1929a,第196-241页)。附加定义和符号出现在变分法和微分算子演算中,其中dy/dx' 表示 y 上的 d/dx 运算(参见 Burkhardt 1908a,第 13 和 14 章,以及 Koppelman 1972a)。直到 19 世纪末,人们仍频繁使用 “dy/dx' 来表示偏导数和常导数(或微分的比率),这也导致了更多的复杂性。(注:一个例子是Fourier,我已在 Grattan-Guinness 1975b 中指出了正确阅读他的(Euler)微积分的重要性。符号及其相关定义对微积分发展的影响的研究很少。例如,Truesdell 1960b 很好地描述了从Galileo到 Lagrange 的理性力学的进步,使所有这些符号现代化,并谈到“导数”,尽管历史上没有任何人以这种现代意义使用过导数。我们在第 1 章和第 2 章中看到了在(代数)微积分的发展中使用符号作为自由变量以及未知常数的重要性。教科书很少能很好地解释这种区别,学生们常常对此感到困惑。简而言之:在 y = f (x) 中,x 是自由变量( y 也是);在 0 = f (x) 中,x 是未知常数,取 f (x) 的零点(如果有)作为其值;按属性 \phi{x} \quad \overset{=}{Df} \quad f(x) = 0  ,x 是命题函数 𝜙 的一个自由变量(有关此思想的更多信息,请参见第 6.7 节),但相对于数学函数 f 而言仍然是一个未知常数。) 此外,对微积分应用感兴趣的数学家倾向于使用他们年轻时学到的微积分,而不是最 “现代”的概念。例如,Euler 风格的微积分在整个 19 世纪的数学物理学中都有使用

因此,随着微积分严谨程度的提高,微积分的理论与实践之间出现了分裂:基础主义者有一套规则,而实践者有另一套规则。这种情况一直持续到今天,给学生们带来了相当多的不幸和不必要的困惑。他们常常在微积分课上学习到无穷小的微分是不存在的但在数学物理课上却不断地使用它们虽然 Euler微积分并不严格,但它应该被教授为分析物理和几何现象的有力工具,它对该主题后来的概念、术语和符号留下了相当大的印记。但就目前情况来看,教科书上的处理并不令人满意。一些人基本上遵循 Cauchy 的做法用 “f^{'}”  表示导数并用他的一些等价符号定义微分(3.7.2)而其他人则用单个符号dy/dx表示导数并完全省略微分并且两种处理方式都没有警告读者另一种处理方式的存在。此外,这两种处理方式都将限制放在了首位,而没有解释为什么首先需要从这个非常困难的概念中获得严谨性和普遍性的标准,或者哪些不太严格的方法正在被取代。

3.8  Cauchy分析:级数的收敛性(Cauchy's analysis : convergence of series)

    现在我来谈谈Cauchy对级数收敛的看法,这是他的数学分析中一个非常重要的方面,因为它第一次在极限的共同基础上将级数与微积分完全统一起来。有必要对Cauchy著作的史前史做一些评论。

人们很容易低估 18 世纪对收敛的处理。在那些日子里(以及更早的时候),一些简单级数的收敛性已获证,并且级数作为其项的有序求和的基本解释也被接受。然而除此之外,还有许多重要的不清楚之处。如果级数的第 n 项或第 n 个余项随着 n 的增加趋向于零则称此级数“收敛(convergence)”如果级数取无穷大,或进行有限或无限振荡则称级数“发散(divergence)”。这两个词有时会用于同一级数。例如,现代文献中偶尔会提到“d’Alembert比率检验”,这对d’Alembert来说非常幸运;因为他考虑了 (1+\mu)^{m} 的级数展开式的连续项比率,他称,当 m = -2 和 μ= 99/100 时,此级数直到第 99 项都是发散的,但是在那之后是收敛的,因为这个比率直到这个项都是大于1而在那项之后小于 1 ( d’Alembert 1768a ,第 171,176页)——这几乎不是我们现在使用的收敛验证。

但更重要的困难涉及求和级数(尤其是幂级数)的非正统方法的发展对于幂级数,其“和”可以定义为相应部分和序列的极限值(如果存在)。遗憾的是,求和的独创性(ingenuity)并没有与对所得结果的解释的相应反射相匹配——级数的和仅相对于所涉及的求和方法定义,因此同一个级数相对于不同的方法可能有不同的和(或根本没有和)。Euler在设计求和法方面尤其有天赋(参见 Hofmann 1959a),并给我们留下了大量关于可和性(summability)和“发散(convergent)”级数的成果,这类研究一直持续到 19 世纪(参见 Burkhardt 1910a);但直到 19 世纪末,解释这些现象所需的理论才开始出现(参见 Tucciarone 1973a)。

在这种情况下,Cauchy要求在研究无穷级数之前先分析它们的收敛性,这是可以理解的。Lacroix,Fourier 和Gauss 等人已经倾向于这种观点(见 Grattan-Guinness 1970a, 171),Cauchy对收敛的定义及其后续的探索达到了新的细节层面。他在《分析教程》的导言中写道:“发散级数没有和”,这番话或许既考虑到了他的学生,也考虑到了他的同行(尽管像他们一样,他似乎也将有限和无限振荡归入了“发散”的范畴)。在书的正文中,他解释说“如果对于不断增加的 n 值,[第n 个部分] 和(sum) s_{n} 无限地接近某个极限 s,则称该级数收敛,而所讨论的极限称为该级数的和。在另一方面,如果和 s_{n} 不趋近于任何固定的极限,而 n 无限增加,则该级数将会发散,并且不再可和”(1821a,第123页;著作,第114页)。一页之后,他提出了一个非凡的定理:一个级数要收敛,“对于无穷大的 n 值,其必有且仅需和

s_{n} , s_{n+1} , s_{n+2} , \& c ...  

不同于 s 即可,因此根据无穷小量,此和介于它们之间”。

    这个结果的重要性在于,用“因此它们之间”这些词表达的条件并没有提到级数的总和,这在实践中甚至可能无法猜测。该条件的充分性的严格证明是困难的,因为它断言极限的存在,因此需要了解实线的结构。Cauchy并没有真正尝试证明。(注:这一条件和尝试性的证明也可在 Bolzano 1817a 中找到,它们是与Cauchy的 《分析教程》 的几个相似之处中的两个。其他包括极限的首要性,函数连续性和收敛性的定义,中值定理以及区间分割证明(因此称为“Bolzano-Weierstrass 定理”,在下述 3.14 节提到),有些则非常接近,需要采用复杂的 Weierstrassian 分析(参见下文 3.12 和 3.13 节)才能将它们区分开来。)

    Cauchy研究的一个重要的收敛例子是Taylor级数。已经有人尝试建立余项的表达式(见 Pringsheim 1900a),但Cauchy对 Lagrange 级数信念的拒绝,使得研究其收敛性变得尤为重要。他利用分部积分法求得了余项的积分形式(只要每一个导数都是连续的):

(3.8.1)      

 \begin{array}{rlc}f (x + h) - f (x) &\!=\int_{0}^{h}f^{'}(x+h-z)dz \\ \\ &\!=hf^{'}(x)+\frac{1}{2!}h^{2}f^{''}(x)+...+\frac{1}{(n-1)!}h^{(n-1)}f^{(n-1)}(x) \\ \\& \quad +\int_{0}^{h}\frac{1}{(n-1)!}z^{n-1}f^{(n)}(x+h-z)dz \end{array}  ,

通过援引 (3.7.10) 所述的这种均值定理,他将 (3.8.1) 的这种积分余项转化为微分形式

(3.8.2)     f^{(n)}(x+\theta{h})\int_{0}^{h}\frac{1}{(n-1)!}z^{n}dz  或    \frac{1}{n!}h^{n}(x+\theta{h}) \quad (0 < \theta < 1)  。

(Cauchy 1823a,讲座 36 )。

    回顾一下Cauchy的均值定理,也让我们想起了Ampère,他在 1806a 年在上一节中提到过。作为他试图改进 Lagrange微积分基础的一部分,他在那里寻找 Taylor级数的余项,并在 1826a 年回到这个主题并提出了类似的论点,值得描述为当时的一种替代方法。他的推理是针对多变量函数而给出的,但为了方便起见,我给出了单变量形式。他援引自己之前的论文声称

(3.8.3)      P(\alpha) \quad \overset{=}{Df} \quad \{ f (x + h) - f (x + {\alpha}h)\}/(1 - \alpha) 

通常既非零与非无穷。将 (3.8.3) 重新写成

(3.8.4)     f (x + h) = f (x + {\alpha}h) + (1 - {\alpha})P({\alpha})  ,

并针对 α  进行连续微分,他得到

(3.8.5)    

 \displaystyle 0 = \frac{df(x+{\alpha}h)}{d\alpha} + (1 - \alpha)P^{'}(\alpha) - P(\alpha) \\ \\

…………………………………………

(3.8.6)     \displaystyle 0 = \frac{1}{n} \frac{d^{n}f(x+{\alpha}h)}{d{\alpha}^{n}} + \frac{(1 - \alpha)}{n}P^{n}(\alpha) - P^{(n-1)}(\alpha) \\ \\   。

(3.8.5) 中的 P(α) 替换 (3.8.4) 中的 P(α) ,然后用(3.8.5) 中的 P^{'}(\alpha)  替换 (3.8.4) 中的 P^{'}(\alpha) (当 n = 2 时),当 n = 3 时为替换项为 P^{''}(\alpha)  ,如此等等,他求得 

(3.8.7)     

\begin{array}{rlc} f (x + h) = f (x + {\alpha}h) &\displaystyle +(1-\alpha)\frac{df(x+{\alpha}h)}{d\alpha}+\frac{(1-\alpha)^{2}}{2!}\frac{d^{2}f(x+{\alpha}h)}{d{\alpha}^{2}} \\ \\ &+...+\displaystyle \frac{(1-\alpha)^{n}}{n!} p^{(n+1)}(\alpha) \end{array} ,

其最后一项给出了基于(3.8.3)和以微分形式表示的余项。

    我回到对Cauchy的介绍,回顾他开创的收敛检验法如今,这些检验法常常被呈现为一串毫无关联、虽然枯燥但却也有用的结果但在19世纪20年代,检验法之间的逻辑关系是其发展的动力之一检验法是无穷级数收敛或发散的充分条件其应用受到限制因为它仅限于某些类型的级数并且(通常)要求第n项(或许还有其他项)的函数收敛到一个极限,且该极限不等于1,且n会增加。如果已知检验法无法确定特定级数的行为,则需要新的检验法,而某些检验法可能对特定类型的级数推出其他检验法。所有这些都是在从 《分析教程》中的第一个证明开始的二十五年的发展过程中得到很好理解的(参见 Grattan-Guinness 1970a,附录中的详细描述)。这些证明与现代证明大致相似(包括允许绝对收敛和条件收敛之间的区别),不同之处在于,按照Cauchy的说法,一个序列的上限由适当项的函数的诸如“最大值的极限”之类的短语模糊地定义。

    Cauchy 在他的《分析教程》中证明了这些验证方法,适用于相同项和混合项的级数(根据 n \rightarrow \infty 时  \sqrt[n]{|u_{n}|} 的行为 )比率|u_{n+1}/u_{n}| )法, 凝聚法(condensation)( \sum_{r=1}^{\infty}u_{r}  和 \sum_{r=0}^{\infty}u_{r}2^{r}u_{2^{r}-1} 同收敛和同发散 ) ,对数法 (  \log{(u_{n})}/\log{(1/n)}   ) ,乘积法 (若 \sum_{r=0}^{\infty}u_{r}  和 \sum_{r=0}^{\infty}v_{r}  绝对收敛,则  \sum_{r=0}^{\infty}\sum_{i=1}^{\infty}u_{i}v_{r-i}  收敛于它们的乘积),以及交替法 u_{r} 按绝对值递减至零或按符号递减)。后续验证包括 Abel (若 \sum_{r=0}^{\infty}u_{r} 收敛且 v_{n}  有界,则 \sum_{r=0}^{\infty}u_{r}v_{r} 也收敛),Cauchy积分法(若 u(x)单调递减至零,则 \int_{0}^{\infty}u(x)dx  和 \sum_{r=0}^{\infty}u_{r} 同收敛或同发散 ) ,Raabe 法 n|(u_{n}/u_{n+1})-1|    ) , 以及各种形式的对比验证法。然后,出现了许多迭代验证法,可以计算并逐一验证一系列表达式。作为检验法动机的一个例子,Cauchy引入了他的积分验证法来处理某些级数,而他的根验证法对这些级数无效。

在这些后来的结果中,Abel检验尤为引人关注,因为它出现在1826年的一篇重要论文中,该论文探讨了二项式级数的收敛性和其他性质。作为其基础工作的一部分,他证明了遵循Cauchy原理的结果,这类原理现在称为“Abel极限定理”。对无穷级数进行相当不严谨的处理的一个显著特点是,假设在极限之前成立的,在极限处也成立,从而将变量的极限值插入级数中。但现在,Abel读过Cauchy的《分析教程》后,有了更清晰的认识。

    Abel如下表述他的第一个定理(1826a,定理 4):

    “若级数

[(3.3.8)]      f ({\alpha}) = v_{0} + v_{1}{\alpha} + v_{2} {\alpha}^{2} +... + v_{m} {\alpha}^{m} + ... 

对于 α 的某个 δ 是收敛的,则其对于每一个小于 δ 的值也是收敛的,对于总是递降的 β值,函数 f (α - β ) 无限地接近极限 f (α) (假设 α 小于或等于 δ )。”

    他的证明非常草率,因为他没有遵循Cauchy惯常的谨慎取表达式的正值,因此他对不等式的处理不够严谨(参见Grattan-Guinness 1970a, 第82-84页),但他的结果引起了人们对一种迄今为止不加批判地使用的技术的关注。在他论文的定理5中,他将该定理推广到 v_{m} 是变量x的连续函数的情况,并在脚注中对Cauchy《分析教程》中的一个定理提出了重要的批评。 

Cauchy 定理已经指出(1821a,第 131-132页,著作,第 120 页):

“当 [\quad\sum_{r=0}^{\infty}u_{r}\quad ] 是同一个变量 x 的函数,且关于这个变量在使级数收敛的特定值附近连续,则该级数的和 s 也是 x 在该特定值附近的连续函数。”

Abel 在他的脚注中指出,在 [0 , π ] 上的 \frac{1}{2}{x} 的正弦级数会是这个定理的一个反例(counter-example),因为“对于 x 的所有值 (2m + 1)π  m是一个整数”。现在我们回顾一下3.4节,Fourier的表示中没有跳跃,而是用垂直线连接它们;如果这些线可以解释为无限陡峭,那么这个级数和定理就可以相一致了。然而,当时几乎没有人提出这样的论证;(注:这种可能性似乎存在于非标准分析的“新”无穷小量中(参见Cleave 1971a)。我在此不便赘述这一点,因为这个高度复杂的理论实际上与数学分析的历史毫无关联(参见Bos 1974a, 81-86),尽管它的教学可能性非常有趣(参见Keisler 1976a)。 ) 如果坚持Abel 对Fourier级数在 x = (2m + 1)π 时不连续的解释,那么Cauchy定理(尤其是其证明)就需要检验。

Cauchy在证明中声称,第 个部分和 s_{n} 是连续的,因此根据他对连续性的定义(见上文3.6节),当x获得较小的增量 α 时, s_{n} 也会获得较小的增量。由于级数收敛,当较大时,余项 r_{n}  较小,并且由于α 引起的 r_{n} 的增量与 r_{n} “同时变得不显著”。因此,s也随α小幅增加,因此是连续的,正如后文所证明的那样(1821a,第131页 ;著作,第120页)。 

引用的“同时变得不显著”这句话至关重要。这是什么意思呢?我们必须牢记:(1)  s_{n} (x + \alpha) 关于 α 的微小性——由于函数  s_{n}(x) 关于 x 连续,这是一个局部性质,尽管 x 可以是区间上的任意一点(参见上文 3.6 节);(2) Cauchy断言了关于 r_{n}(x) 的 r_{n}(x + \alpha) - r_{n}(x)  的微小性(smallness);以及 (3) r_{n}(x) 关于任意大 n 的微小性。这些微小性之间有何关系?α 是独立于 r_{n}(x) (从而也独立于 n 的大小)还是依赖于  r_{n}(x) ? 定义 s_{n}(x) 连续性的区间是否也起着作用?这些问题的答案有多种组合,正如我们将在 3.12 节中看到的,每一种组合都定义了一种不同的一致收敛模式。这里只需说明,其中涉及的技术细节相当多,而Cauchy定理,如同他的一般分析一样,在本质上对这些技术细节含糊不清。值得注意的是,他在证明中使用了符号 "s_{n} " ,"r_{n}和 "s"  ,却没有符号化它们对 的函数依赖关系

由此,我们发现了Cauchy分析中的一个重大难题,与前面描述的诸多成就和改进相比,这是一个挫折。现在我们将看到它如何解决当时的一个重大问题:Fourier级数的收敛性。

3.9  Fourier级数的一般收敛性问题(The general convergence problem of Fourier series)

    这个问题对当时的数学分析来说是一个激动人心的挑战,这不仅是因为Fourier分析在应用数学中的重要性,还因为它们的收敛性涉及到函数、极限、收敛和积分的混合。我在3.5节中提到,Fourier在其1807年的专著中证明了特定级数的收敛性,但并未得到普遍的证明。在本节中,我将简要总结早期的普遍证明(更多详情,请参阅Grattan-Guinness 1970a,第5章)。

    第一个证明由 Poisson于1820年发表,他运用自己处理幂级数的技巧来解决这个问题。多年来,他以各种形式提出了他的方法,但基本上没有改变,我将在他1823a年发表的版本中描述。他采用了以下公式

(3.9.1)    \displaystyle \frac{1-p^{2}}{1-2p\cos{(x-\alpha)}+p^{2}}=1+2\sum_{r=1}^{\infty}p^{r}\cos{(r(x-\alpha))} \quad (|p|<1) ,

通过乘以 f (α) 并对上式在 α 的 [-π ,+ π ] 上积分,得到

(3.9.2)    \displaystyle \int_{-\pi}^{\pi}f(\alpha)\frac{1-p^{2}}{1-2p\cos{(x-\alpha)}+p^{2}}d\alpha=\int_{-\pi}^{\pi}f(\alpha)\left \{ 1+2\sum_{r=1}^{\infty}p^{r}\cos{(r(x-\alpha))} \right \}d\alpha 。

然后,我们令 p 趋近于 1 。当 α = x 时 ,(3.9.2) 的左边被积函数取不确定形式 \frac{0}{0} 。但在对自己进行了一些不太严格的操纵之后,他得到

(3.9.3)   \displaystyle 2{\pi}f(x) =\int_{-\pi}^{\pi}f(\alpha)\left \{ 1+2\sum_{r=1}^{\infty}p^{r}\cos{(r(x-\alpha))} \right \}d\alpha  ,

当  \cos{(r(x-\alpha))} 被展开且项被重新排布之后,其成为所要求的 f (x) 在 [-π ,+ π] 上的全(full) Fourier 级数:

(3.9.4)     

\begin{array}{rlc}\displaystyle f(x)&\displaystyle=\frac{1}{2{\pi}}\int_{-\pi}^{\pi}f(\alpha)d{\alpha} \\ \\ &+\displaystyle\frac{1}{\pi}\sum_{r=1}^{\infty}\left \{ \cos{(rx)}\int_{-\pi}^{\pi}f(\alpha)\cos{(r\alpha)d\alpha}+\sin{(rx)}\int_{-\pi}^{\pi}f(\alpha)\sin{(r\alpha)d\alpha} \right \} \end{array} 。

一些操作仅仅是忽略不方便的无穷小幂(1 - p)并保留有用的幂,这些过程大多可以更严格地重新进行。但也存在两个更严重的困难。一是允许p 取其极限值1,即使在1826年Abel 极限定理之后,Poisson仍然保留了这个过程。另一点是似乎没有对f (x)施加任何限制;(3.9.4) 似乎对任何函数f (x) 都有效。这两点严重削弱了 Poisson 的论证,尽管他确实允许通过其他方式对级数求和,并且(3.9.2)左边的“ Poisson 积分”对于实变量和复变量分析都具有相当大的意义

Cauchy于 1826 年发表了一个尝试性的证明,运用了他在复变函数微积分中的以下定理,该定理至今仍经常采用以下形式: 将 i=\sqrt{-1}  代入实变函数积分中:设 f (t) 为实变量 t 的有限值函数,b 为正实数。则

(3.9.5)

\displaystyle \int_{0}^{a}\exp{({\pm}ibt)}f(t)dt={\mp}i\int_{0}^{\infty} \left \{ \exp{({\pm}iab)}\left [ f(a {\pm} iu)-f({\pm}iu) \right ]\right\} \times \\ \\ \\ \exp{(-bi)}du  。

Cauchy 利用这个定将将 Fourier 级数 (3.9.4) 的每一项从 (3.9.5) 的左边变换到其右边,然后将该级数处理为  \frac{1}{2}({\pi}-x)  在 [-π ,+ π ] 上的(收敛) Fourier 级数之倍数但他的证明涉及对一个级数逐项积分并重新排列项的顺序(因此假设待证明的函数是收敛的),它并没有证明该级数实际上和为f (x) ,而且,与 Poisson 的证明一样,它似乎对“任何”函数f (x) 都有效。Cauchy 可能对他的证明并不满意,因为他在1827年提出了另一个证明,该证明也基于他的复变函数微积分;这个证明似乎做出了一些收敛假设,并且其适用的函数类型非常有限。

Cauchy的第一个证明中还有另一个错误,我现在才提到它,因为它有助于促成第一个收敛性证明,而这个证明能够公正地解决这个问题。Cauchy假设,若随着 n \rightarrow \infty 有 (u_{n} - v_{n}) \rightarrow 0 且若 \sum_{r=0}^{\infty}u_{r}  是收敛的,则 \sum_{r=0}^{\infty}v_{r} 也是收敛的。然而他错了,虽然 (-1)^{n} n^{-1/2} 和 (\quad n^{-1} + (-1)^{n} n^{-1/2}\quad ) 满足  u_{n} 和  v_{n}  满足所要求的属性,但第一个生成一个收敛级数,而另一个则产生一个发散级数。年轻的德国数学家Peter Lejeune Dirichlet 在 1829a 年的论文中指出了这一点,他在论文中介绍了自己对这个问题的处理方法。

与许多同龄的年轻科学家一样,Dirichlet早期职业生涯的一部分在当时的世界科学之都巴黎度过他与 Fourier 关系密切,并在Fourier书中一个粗略证明的基础上,发展了自己的证明。利用三角恒等式

(3.9.6)        \displaystyle \sum_{r=-n}^{n}\cos{(ru)} = \cos{(ru)} + \sin{(ru)}\frac{\sin{(u)}}{1-\cos{(u)}}   ,

Fourier 已经将他的完整级数 (3.9.4)的第 n 项部分和 (即前 2n + 1 项)转化成了

(3.9.7)   

\begin{array}{lcr}\displaystyle \frac{1}{2{\pi}}\int_{-\pi}^{\pi}f(\alpha)\cos{(n(x-\alpha))}d{\alpha}\displaystyle \\\\\displaystyle +\frac{1}{2{\pi}}\int_{-\pi}^{\pi}f(\alpha)\sin{(n(x-\alpha))}\frac{\sin{(x-\alpha)}}{1-\cos{(x-\alpha)}}d{\alpha} \end{array}  。

然后他将 (3.9.7) 中的每一个积分解释为一个面积,这时 \cos{(n(x-\alpha))} 和 \sin{(n(x-\alpha))} 的振荡表明每一个积分都可以分解为大小相等、符号相反的面积,因此值为零。然而在第二个积分式中,当 α = x 时 ,这个分数 {\sin{(x-\alpha)}}/[{1-\cos{(x-\alpha)}}]  成为 0/0 的形式,因此需要特殊处理。就像在 Poisson的案例中一样,不严格地使用无穷小量“表明”那里的值为 f (x),从而建立了收敛(1822a,第 423 条)。 

Fourier的严谨标准与Poisson大致相同,他与Poisson(以及Cauchy)一样,相信他对“任意”函数 f (x) 的证明都是有效的。但他给 Dirichlet理解收敛问题并提供解决方案提供了线索寻找 f (x) 的充分条件从而证明收敛,并从三角恒等式出发。在 1829 年的论文中,Dirichlet 摒弃了(3.9.6) 而选择了恒等式

(3.9.8)        \displaystyle \sum_{r=-n}^{n}\cos{(rn)}=\frac{\sin((n+\frac{1}{2})u)}{\sin{(\frac{1}{2}u})}   。

因此,结果不同于Fourier的 (3.9.7) , 他求得

(3.9.9)     \displaystyle s_{n}(x)=\frac{1}{\pi}\int_{-\pi}^{\pi}f(\alpha)\frac{\sin((n+\frac{1}{2})(x-\alpha))}{2\sin(\frac{1}{2}(x-\alpha))}d\alpha  ,

这就是现在广为人知的 “Dirichlet积分” 形式

(3.9.10)            \displaystyle \int_{0}^{h}f(u)\frac{\sin(mu)}{\sin(u)}du \quad (0<h \leq \frac{\pi}{2} )  。

Dirichlet (3.9.10) 的处理是几何的, 就像 Fourier 的处理一样,只不过是按 Cauchy 分析的风格完成的。它是下述直观论证的一个严格版本。\sin(mu)  的振荡表明,(0,h)可以分割成一族子区间 (0 , π/m),(π/m , 2π/m),… ,在其每一个子区间上 \sin(mu)  是单调的。若 f (x) 单调递降,则 (3.9.10) 式中的积分应该分解成一系列符号交替变化、幅值递减的区域,因此(根据交替级数验证法)当 n \rightarrow \infty 时收敛。当 u = 0 时,但在 (3.9.10) 中代入  mu = v 表明其趋近于

(3.9.11)       \displaystyle f(0)\int_{0}^{\infty}\frac{\sin{v}}{v}dv    \displaystyle \frac{\pi}{2}f(0)   。

因此,根据 (3.9.10) 和 (3.9.11) ,有

(3.9.12)       \displaystyle \lim_{m \rightarrow \infty}\int_{0}^{h}f(u)\frac{\sin{(mu)}}{\sin(u)}du=\frac{\pi}{2}f(0)  。

为了建立 Fourier级数收敛的条件,Dirichlet证明了该结果的一些简单推论。如果 f (x) 单调增加到零或为常数,则 (3.9.12) 成立,因此如果 f (x) 在区间内改变符号(因为,我们将 (3.9.12) 应用于函数 (c + f (x)) 和 c,其中 c 足够大以使 (c + f (x)) 在 (0, h) 上为正,然后减去结果)。如果 0 < g < h,则 (3.9.12) 在区间 (0, g) 上也成立,因此通过减法,Dirichlet 积分在 (g , h) 上为零。最后,如果 f (x) 在 g 和/或 h 处不连续,则我们在证明中使用 f (g + O) 和 f (h - O) 代替 f (g) 和 f (h)。(在 1829a 版的 1837a 版中,他实际上引入了这些符号来表示 f (x) 在 x 处的左右极限值。)

    为了应用这些结果到 (3.9.9) ,Dirichlet 假设在  α 的区间  [-π , π ] 中,f (α) 仅在有限个点 d_{1} , d_{2} ,..., d_{s}  处不连续或取转值(turning values)(译注:大概指的是拐点) ,并且他将  (-π , π ) 分割成子区间 (-{\pi} , d_{1}) ,(d_{1} , d_{2}) ,...,( d_{N} , x) ,( x, d_{N+1}) ,..., ( d_{s} , {\pi} )  。(他实际上指定了闭子区间。)  现在 (3.9.2) 中 u 的区间 ( 0  ,h ) 对应 (3.9.2) 中 α 的 (-π , π ) 的子区间 ( x, d_{N+1})  。 因此,当 n \rightarrow \infty  时 ,( x, d_{N+1}) 对 s_{n}(x)  的值贡献了  \frac{1}{\pi} ( \frac{\pi}{2} f (x+0))  —— 即  \frac{1}{2}f(x+0)  ,根据 (3.9.12) 到 u 的 ( g ,h ) 上的展开式 ,(-π , π ) 的其它子空间对  s_{n}(x)  的贡献为 0 。因此,在上述 f (x) 的充分条件下,其 Fourier 级数收敛于  \frac{1}{2} ( f (x-0)+ f (x+0))  。在后来的论文中,Dirichlet 扩展了 f (x)  的条件,使其包含有限个无穷大,使得不定积分保持连续(1837b,补充)。

我详细讨论了这个证明,不仅因为它的重要性,也是为了表达当代“进行”数学分析所面临的困难。它是数学分析史上最重要的证明之一,因为它既展示了如何进行数学分析,也阐明了一项重要任务:试图获得Fourier 级数收敛的更普遍的充分条件。这显然意味着要考虑在有限区间内具有无穷个转值(turning value)、断点和/或无穷值的函数,我们将会看到这类研究在数学分析的后期发展中相当突出地出现。Dirichlet在1829年发表的论文结尾处作了一句极具预见性的评论,他定义了一个不满足他条件的函数

    “当变量取比率值时(有理值)(rational value)时,f (x) 等于一个确定的常数 c ;当变量为非比值(无理值)(irrational value)时,f (x) 等于另一个常数 d如此定义的函数对于 x 的每一个值都有有限且确定的值,但不能将其代入[Fourier]级数中因为在这种情况下,该级数中的各种积分都失去了意义。”(译注:即这样定义的函数为 Dirichlet 函数。 )

    在他1837a年发表的论文中,他提出了一个非常普遍的函数概念,认为它不依赖于任何解析表达式(关于这一观点,可参见《Lacroix论文》(Lacroix Treatise_{1} )第一卷(1797),第一节),并明确认为这个函数(实际上是比率数的特征函数)就是这种普遍性的一个例子这些思想构成了本书下一章——19世纪积分史——的重要组成部分

Dirichlet在1829年发表的论文中还承诺要证明Fourier级数的“其他一些非常显著的性质”,并讨论“无穷小分析的基本原理”,但遗憾的是,他似乎从未完全公开这些原理,甚至在他的讲座中也没有。如今,人们最为深刻地记得的是他的作品数论;但他对数学分析的贡献是巨大的是继 Cauchy 以来最伟大的贡献者当然也比 Abel 的贡献更重要,Abel的名字通常与 Cauchy 的名字并列。我将以他对 Abel 极限定理的证明来结束本节,我在第3.8节中已经提到过这个证明。Dirichlet 理解这个定理的必要性,但他可能对Abel模糊的证明感到不满,因为他在Abel去世后的1862年发表的论文中重新表述了这个定理,并对其进行了如下重新证明。令

(3.9.13)          \displaystyle f (h) = \sum_{r=0}^{\infty}v_{r}h^{r} \quad (0 \leq h < 1)  ,

并令

(3.9.14)        \displaystyle A = \sum_{r=0}^{\infty}v_{r}  。

则此定理断言    \displaystyle A =f (1 - 0)(= \lim_{h \rightarrow1^{-}}f(h)\quad)    。

Dirichlet 首先证明,若 s_{n}  是 A  的第 n 项部分和,则根据 (3.9.13) 中项的有效得排,可得到

(3.9.15)       \displaystyle f (h) = (1 - h) \sum_{r=0}^{\infty}s_{r}h^{r}  。

对于一个固定的 n ,对于所有的 rn  ,对于某个有限的 K 有 0 < |s_{r}| < K ,使得

(3.9.16)    \displaystyle \left | (1 - h) \sum_{r=0}^{\infty}s_{r}h^{r} \right |< (1 - h) \sum_{r=0}^{n-1}Kh^{r}<(1-h)nK  。

另外,按照Cauchy 的(3.7.8)风格的均值论证,有

(3.9.17)     \displaystyle (1 - h) \sum_{r=n}^{\infty}s_{r}h^{r}=(1 - h) P_{n}\sum_{r=n}^{\infty}h^{r}=P_{n}h^{n} 。

其中,P_{n}  介于  s_{n} , s_{n+1} ,...  的最大值和最小值之间。现在,他将 (3.9.5) 中的级数拆分成其部分和与余项,并令在整个等式上 h ⟶ 0 ,因此 f (h) f (1 - 0);根据 (3.9.16) ,这个部分和 ⟶ 0 ,而根据 (3.9.15),这个余项 \rightarrow P_{n}  。现在,在这三个表达式中均令 n \rightarrow \infty  ,则唯一受影响的是 P_{n}  ,通过定义和  (3.9.14) ,将 A 视为  P_{n}  的极限值,其结果正如所证。

Dirichlet在此处理二重极限时非常谨慎,就像他研究Fourier级数的收敛时一样(其中 x( 对于某个 a 值 ),然后 n \rightarrow \infty ) 。正是在这个领域即多重极限的处理上,Cauchy的分析不够严谨下一节将描述一些在 Dirichlet 所预言的方向上取得的磕磕绊绊的进展。

3.10  函数级数研究的一些进展 (Some advances in the study of series of functions)

    Dirichlet关于Fourier级数收敛的条件,加剧了与Cauchy在《分析教程》中关于连续函数的收敛级数之和函数(sum-function)的连续性定理(见上文3.8节)的明显冲突,因为它们包含了所表示函数可能不连续(在有限个点处)。Cauchy似乎对此并不感冒,因为他在1833年出版的《分析总结》(Résumé analytiques)(1833a, 第46页)中逐字逐句地重复了他的定理;但Dirichlet 的学生Phillip Seidel在他的1848a年著作中继续探讨了这个问题。

    与Cauchy不同,Seidel在这个问题中确实对参数变量进行了符号化(尽管我不会使用他的符号),他通过提出以下区别来解决这个问题:对于级数  \sum_{r=0}^{\infty}u_{r}(x)  ,若存在一个 n_{0}  ,即使得

(3.10.1)        |r_{n}(x + h)| < \epsilon  

成立的最小 n   ,其中, n \ge n_{0}  而 (x + h) 位于x 的领域内,随着 ε 趋近于零,二者(x + h )分别趋向于无穷远或不趋向于无穷远,则上述级数“任意慢收敛”或“非任意慢收敛”。 现在考虑等式

(3.10.2)     s(x + h)-s(x) = {s_{n}(x + h) - s_{n}(x)} + {r_{n}(x + h) - r_{n}(x)}  。

很小,则根据 s_{n}(x)  的连续性, \{s_{n}(x + h) - s_{n}(x)\}  也将是很小的;而 r_{n}(x + h)  和 r_{n}(x) 对于任意大的 n 也将变得很小。所有这些也适用于Cauchy的证明(见上述第 3.8 节),但现在Seidel使用了他的新定义(3.10.1)。令递增量 h^{'} 在 x 上从 h 递减到 0 (含0) ,并观察对 (3.10.1) 中的 n_{0}  的影响。若 n_{0} 仅在一个有限大的值处满足上式 ,则收敛不是任意慢的。\{r_{n}(x + h) - r_{n}(x)\} 保持小状,因此,根据 (3.10.2) ,和函数是连续的,与 Cauchy 定理中的一样。然而,若 n_{0}  趋向于无穷远,则收敛是任意慢的并且 Cauchy 定理对此不成立。

我简化了Seidel费力的推理;为了语言清晰起见,他比Cauchy的“同时无意义(insensible at the same time)”略胜一筹。事实上,在一个重要的方面,他标志着标准的倒退,因为要求h趋近于零,破坏了Cauchy数学分析的极限规避特性。在Cauchy数学分析中,我们取变量的小而非零的增量,并通过不等式运算来探索它们的函数依赖关系。这同样适用于G. G. Stocks对一个类似定理的证明,该定理几乎同时提出,但显然是独立的,他定义了无穷级数的“无限慢收敛”和“非无限慢收敛”的性质。他的定义与 Seidel 的定义(3.10.1)的唯一区别在于,他假设不等式仅当 n=n_{0} 时成立,而不一定对任意大的 n 值都成立(Stokes 1849a,第 39 条)。

提到Stokes,表明一位​​英国数学家终于对数学分析的基础有了重要见解。不到一年,另一位英国数学家也做出了有益的贡献,其影响甚至超过了Stokes,但似乎并未达到应有的程度。在上面3.5节中,我指出 Fourier 用垂直线将函数中的不连续点连接起来表示不连续性。1848年,Henry Wilbraham考虑了Fourier 关于级数

(3.10.3)   \cos{(x)}-\frac{1}{3}\cos{(3x)} + \frac{1}{5}\cos{(5x)} - ...   

收敛性的证明,其在(-π/2 , π/2)上收敛于 π/4 ,在(π/2 , 3π/2)上收敛于 -π/4 (Fourier 1822a,第179条;虽然它只有余弦项,但就其表示方式而言,它实际上是一个正弦级数,这一点可以通过将原点改为 x = -π/2 ,即代入 2y = 2x + π 看出)。Fourier 求得表达式 n 项后的余项为

(3.10.4)       \displaystyle \int_{0}^{x}\frac{\sin{(2nv)}}{2\cos{(v)}}dv   ,

Wilbraham 质疑当 n 趋向无穷大时该项的行为。他得到 2n 的(3.10.4) 而不是 n 项,然后使用代换 4nv = 2nπ  - u 以获得余项

(3.10.5)       \displaystyle r_{2n}(x) = -\int_{2n{\pi} - 4nx}^{2n{\pi}}\frac{\sin{(u)}}{8n\sin{(u/4n)}}du  。

他注意到,当 u/(4n) 任意小时,被积函数取值任意大,因此,北分母变更为 8n(u/(4n)) 或 2u 。他还装积分上限变更为 \infty (但积分下限不变!),因此得到

(3.10.6)      \displaystyle r_{2n}(x) = -\int_{2n{\pi} - 4nx}^{\infty}\frac{\sin{(u)}}{2u}du  。

x 远离 π/2 时,(3.10.6) 是零;当 x = π/2 时,上式为 -π/2 ;但当它接近 π/2  到 1/n 以内的某个量级时,它会按 \sin{(u)}  控制的方式振荡。

   遗憾的是,这一结果被忽视了半个世纪,后来才被重新发现并被错误地命名为“Gibbs现象”(见 Carslaw 1925a )。Wilbraham的结果与后来的结果(J.W.Gibbs等人的结果)之间存在差异;Wilbraham致力于阐明级数的行为而他的后继者则认识到级数(根据 Dirichlet条件,级数在此点有一个跳跃)与其作为极限曲线的几何解释(Wilbraham改进了Fourier的几何推理)之间的区别。此外,Gibbs 没有讨论接近垂直线的振荡,而是讨论了极限情况(见图 3.10.1)。就双极限而言,表达式 (3.10.5) 同时是 nx 的函数;而 Dirichlet条件与重复极限  \displaystyle \lim_{n \rightarrow \infty}\lim_{x \rightarrow a}{\{r_{n}(x)\}}  的行为有关,Wilbraham 关注的是逆重复极限   \displaystyle \lim_{x \rightarrow a}\lim_{n \rightarrow \infty}{\{r_{n}(x)\}}  。

-----------------------------------图 3.10.1--------------------------------

或许是19世纪40年代后期人们对Fourier级数的兴趣促使Cauchy 重新审视了收敛函数级数之和函数(sum function)的“课程”定理。在此期间,他撰写了一些关于分析的新论文,这些论文可能受到他对微分方程存在性定理的研究的启发(参见Dobrovolski 1971a),他的追随者Abbe Moigno也遵循 Cauchy 的原理出版了关于微积分(以及其他数学分支)的教科书(参见Moigno 1840-1844a);但他的体系并未发生根本性的修改。然而,在 1815a 的一篇论文中Cauchy 最终承认,\frac{1}{2}(\pi-x)  在 [0 , π] 上的 Fourier 正弦级数是其旧定理的一个反例(counter-example)。他重述了他的定理和收敛的必要充分条件,以包括我们现在所认识到区间上的一致收敛性。|r_{n}(x)| “总是”小的——即,对于区间中的任意x ,它总是小的。因此,在 (3.10.2) 中s(x) 的连续性是通过现在熟悉的推理来建立的这比 Seidel 的推理要清晰得多也比Cauchy三十年前在《分析教程》中所称的“同时无意义(insensible at the same time)”推理要清晰得多(比较上面的 3.8 节); \{r_{n}(x + h) - r_{n}(x)\}  确定随着 的变小而变小,因此 (3.10.2) 的左边也会变小,正如所求。  

因此,我们发现Cauchy对数学分析又做出了一项贡献。但这并非一项根本性的突破,因为在他的论文中,他并没有探讨其新定义的进一步后续结果,甚至没有探讨他体系中其他将一致收敛视为理所当然的地方。要论及这样的进步,我们必须将目光从法国转向德国,因为此时数学关注的中心已经转移到了德国。

3.11  RiemannWeierstrass(对微积分)的影响 (The impact of Riemann and Weierstrass)

在上一节描述的研究中,我们开始看到现代教科书所习以为常的那种严谨性开始出现。然而,它最终的达成是一个极其复杂的故事可能需要一本书才能将其讲述清楚,因此我需要指出本章将传达多少内容以及如何处理它。

本节我将描述主要人物工作的历史背景,并在本章的其余部分详细讨论他们及其追随者对函数级数收敛、函数理论的扩展以及微积分的完善所做的贡献。由于篇幅原因,我只讨论了最重要的定义和技巧,并没有描述本章前面讨论过的每个定理的重新推导。然而,为了弥补篇幅,我偶尔会超出1880年的上限,因为一些后来的发展可以用方便的语境简洁地表达出来。

继Dirichlet建立 Fourier级数条件之后,对Fourier级数最重要的贡献是Bernhard Riemann于1854年发表的关于三角级数的《第二博士学位论文》(Habilitations-schrift)(second doctorate)。他从未完成这篇论文,但在1866年Riemann去世后,他的朋友 Dedekind 意识到了它的重要性,并于1868年发表了它。为了强调其写作日期,我将引用为Riemann 1854a。

Riemann的论文分为三个部分:三角级数的历史,积分的分析(在第 4.3 节中讨论)以及对函数及其级数表示的各种评论。他曾与Dirichlet亲自讨论过级数,并解决了Dirichlet遗留的一些问题。例如,他报告说Dirichlet之所以研究Fourier级数,部分原因是他发现可以通过重新排序其项来改变条件收敛级数的和(比较狄利克雷 1837c),并且他通过证明级数可以重新排序以收敛到任何值来推广了这一结果(1854a,第5条)。

Riemann还构造了具有无穷多个断点或振荡的函数,并研究了它们的积分以及用Fourier数表示的可能性。但他似乎觉得扩展Dirichlet收敛的充分条件太难了,所以他从另一个角度研究这个问题,寻求收敛的必要条件,并分析当 n ⟶ ∞ 时级数的第 n 项趋向于 0 的情况。为此,他考虑了通过两次逐项正式积分三角级数得到的函数 F(x):

(3.11.1)   \displaystyle F(x) = C + C^{'}x + \frac{1}{2} a_{0} x^{2} - \sum_{r=1}^{\infty}{\left \{[a_{r}\cos{(rx)}+b_{r}\sin{(rx)]}/r^{2} \right \}}  ,

且对于三角级数的收敛性(1854a,第 8-12条),基于极限

(3.11.2)

\displaystyle \lim_{\alpha \rightarrow 0,\beta \rightarrow 0}{ \left \{ F(x+\alpha+\beta)-F(x+\alpha-\beta)-F(x-\alpha+\beta)+F(x-\alpha-\beta))/(4{\alpha}{\beta}) \right \}} 

的行为证明了这个定理。在此过程中,他不仅证明了所谓的“局部化定理(localisation theorem)”,即级数在某一点的收敛性仅取决于该点邻域内函数的行为(第 9 条,其中采用了更为一般的形式),而且还提出了许多新问题。他认为两个在有限点数处不同的函数具有同一个级数,这引出了一些问题:是否允许存在无穷多个这样的点,如何理解级数对函数不收敛的例外点的明显不敏感性,当 n \rightarrow \infty  时第 n 项收敛于 0 是否意味着 a_{n} 和 b_{n}  收敛于 0,以及每个三角级数是否都是 Fourier 级数(即,是否总有一个可积函数作为收敛三角级数的和)所有这些问题以及其他一些问题(包括扩展Dirichlet条件)都是持续存在的难题;有些问题甚至在今天还没有完全解决。它们使Riemann 的论文成为数学分析史上最具开创性的论文之一

但是解决这些问题的技术又怎么样呢?这些技术提出的基本问题又如何呢?这里的主要人物是Karl Weierstrass。Weierstrass的职业生涯分为截然不同但几乎相同的两个部分。在他生命的前四十年里,他在担任默默无闻的教学职位的同时形成并塑造了他的数学技能(参见Mittag-Leffler 1923a);但当他在19世纪50年代中期开始发表大量论文时,他迅速赢得了科学界的认可。他的后半生在柏林大学度过,在那里他通过从 19 世纪 50 年代末到 19 世纪 80 年代末的教学产生了巨大的影响(参见 Biermann 1966a)。正是他和他的学生们为我们奠定了现在讲授的数学分析

    因此,19 世纪最后三分之一的数学分析史在很大程度上是数学家将 Weierstrass的技术应用于Riemann问题的历史。然而,撰写这段历史却面临着巨大的困难(Pringsheim 1899a,Hawkins 1970a 和 Medvedev 1975a 和 1976a 是重要来源),部分原因是所涉及发展的复杂性尤其是由于Weierstrass没有发表他的讲座并且似乎甚至不鼓励做笔记。 “新词(new word)”不仅通过书信和教学传播,还通过研究论文和出版的报道传播(其中 Pincherle 1880a是一个重要的早期例子,而 Dugac 1973a 是最近历史调查)。因此,对于19 世纪晚期数学来说,这多少有些不寻常,我们可以考虑一些未发表的材料,并相信它们的内容正在通过上述方式传播给数学家群体。

    尽管Weierstrass可能认为自己对数学分析基础的贡献建立在 Cauchy 的成就之上,但他似乎在阅读Cauchy的任何著作之前就已经开始了他的重建工作,并且有时批评Cauchy在实数和复数分析中的方法。在他所有的分析工作中,尤其是在分析椭圆函数和微分方程中,他广泛地使用了实数和复数变量的级数,尤其是幂级数,以至于他似乎认为它们为数学分析提供了某种基础(参见 Jourdain 1906-1909a)。从这个一般意义上讲,他延续了Lagrange的观点,但当然,他对收敛问题和极限的存在性提出了更为复杂的处理方法。让我通过回顾他默默无闻的岁月并追溯他对收敛理论的贡献的起源来说明其中的一些观点。

3.12  一致性的重要性 (The importance of the property of uniformity)(译注:一致收敛,一致连续)

    (译注:从以下内容来看,作者并没有直接指出一致性的重要性,而是回顾了数学家探索论证级数一致性收敛的方法和函数一致性连续的曲折过程。其中重点介绍了数学家论证级数一致收敛的过程,并指出两个定义一致收敛的区别。)

Weierstrass可能从他的老师 Christoph Gudermann 的研究中了解到椭圆函数(参见 Manning 1975a,第363-364 页 )。椭圆函数 (elliptic functions)理论涉及无穷级数,因此是收敛性在其中极为重要的一个数学分析之分支(参见 Brill 和 Noether 1894a)。Gudermann感兴趣的是比较一个级数对于其参数变量取不同值时的收敛速度,他曾提到,像无穷级数一样,无限积也具有整体上相同的收敛速度[einen im Ganzen gleichen Grad der Convergenz](译注:此句为德语)”(1838a,第251-252页)。此语境表明他正在使用我们现在所认识的一致收敛(均匀收敛)形式;对于自变量的所有(或几乎所有)值,第 n 个部分和(或乘积)与其极限值的距离都相同。然而,似乎令人怀疑的是,他是否看到了他的思想在数学分析中的潜力,甚至他的读者是否理解了它,因为他没有给出正式的定义,也没有在他的著作中再次提及它。但它很可能出现在他在Münster与他的学生Weierstrass的讨论中,因为在 1841 年关于幂级数的手稿中,Weierstrass非正式地谈到了它们的“一致收敛(uniform convergence)”——他的短语(“Gleichmassig Convergenz”),现在是我们的短语(1841a,第68-69页)。

    Weierstrass在柏林的讲座中详细讨论了一致收敛,并在1880a年的一篇关于函数幂级数可定义的论文中,阐述了不同收敛模式之间的一些关系。首先,他定义了区域内的一致收敛如下(1880a,第1条):

“对于一个由任意多个变量的函数组成的无穷级数 \sum_{v=0}^{\infty}f_{v}  ,若存在一个任意小的正数 δ ,可以指定一个整数 m ,使得对于每一个 ≥m n值以及每一个属于区域 B 的变量的值集 ,和式 \sum_{v=n}^{\infty}f_{v} 的绝对值都小于 δ ,则此级数在其收敛区域的给定部分(B)一致收敛。”

然后,他定义了点邻域内一致收敛的不同性质:

    “此外,假设对于这个区域内的一个指定的点 a ,令 ρ 为一个正值,使得对应于条件

|x - a| \leq \rho  

x 值,这个级数一致收敛,则我称这个级数在点 a 的领域内一致收敛。”

    显然,如果该级数在某个区域内收敛,那么它在a的邻域内也收敛;但逆向结果就不那么明显了,Weierstrass给出了如下有趣的证明:

“量 ρ 有一个上限;令其为 R,满足 | x a | < Rx 的值集(与所考虑的级数有关)可以称为a 的领域(vicinity),而 R 称为其半测度(half measure)。假设在该点附近任意一点,则显然该级数在该点附近也一致收敛。由此可知,级数在其邻域内一致收敛的点集,在变量 x 的平面[Ebene]中可以用一个简单的曲面[Flache]表示,但该曲面可以分为多个彼此独立的部分。”(译注:200多年前的英语真的语法不完善,书面语很不规范。)

    最后一句表明,Weierstrass可能还考虑了另一种一致收敛模式;即在那个区间上,当 x 属于收敛区域的任意一个部分时, 有

(3.12.1)             |\sum_{v=0}^{\infty}f_{v}| < \delta   。

在这些文章中,Weierstrass 还提供了一个一致收敛的检验方法,现在称为“Weierstrass M 检验方法”

Weierstrass的证明包含一个默认的假设,该假设如今称为Heine-Borel定理”即如果一个有界闭集可以被无限个开集覆盖,那么它也可以被这些开集的有限子集覆盖。该定理由Emile Borel于1895年证明(见下文4.6节),并命名为此(由Arthur Schonflies于1900a年命名,第119页),因为Eduard Heine在其1872a年证明中也默认地假设了该定理:对于一个函数f (x),如果其在有限区间上连续且为有限值,那么在该区间上也一致连续。 (由于Heine定理和Borel定理之间的相似性只是表面上的,因此这个名称容易引起误解。) Heine定理值得研究,因为它是Weierstrass方法在印刷品中出现的一个典型早期例子。他对一致连续性的定义如下(1872a, 184):

“对于一个函数 f (x),其从 x = ax = b,若对于任意已知量ε ,无论它多么小,都存在一个量 \eta_{0} ,使得对于任意小于 \eta_{0} 的任意正值 ηf (x ± η )- f (x) 都总是小于 ε ,则称些函数一致连续。无论赋予 x 什么值,只要 xx ± η 属于从 ab 的区域,相同的 \eta_{0} 就一定实现所需的[属性]。”

请注意,Heine使用符号来帮助阐明增量对变量的函数依赖性,这与Cauchy在上文3.6节中对连续性的纯粹文字定义形成对比。然而,Heine未能明确 (f (x ± η )- f (x))的正值——这是当时的另一个特点

Heine 继续他的证明,他 用点 x_{1} ,... ,x_{n-1} 分割区间 [a ,] ,使得对于一个已知 ε ,可能存在 x_{r} 的一个无穷值,使得

(3.12.2)

但若如此,则它们在 [a , b] 中有一个极限值 X 。(注:Heine通过非比数(irrational)的定义和连续函数中值定理的证明证明了这一步骤的合理性;但我省略了它们,因为它们与Cantor的非比数定义和Wererstrass对该定理的证明非常接近(分别见下文5.2节和3.14节)。我使用了 0.5 节中列出的一些符号。然而,我并没有给出这些定义的完整符号形式。例如,(3.12.5) 的这种版本如下:

(∀ε)(∃N)( ∀x)( ∀N){ ε > 0 . & .nN . & .x∈[a , b]. ⟶ .|r_{n}(x)|< \epsilon  } 。

该定义的“封闭”形式(其中所有变量均已量化)与 (3.12.5) 的“严谨性(schematic)”特征(其中一些变量是自由的)之间的区别,对于所使用的形式语言而言非常重要;但在任何数学分支中的定义或公理中,通常都不会观察到这一点。)  因此,仅存在 x_{r} 的一个有限数(这是“Heine-Borel”的步骤),因此根据一致收敛的定义和 (3.12.2) ,这个定理得证(Heine 1872a,第 188 页)。

    现在,我将对涉及一致性的属性定义的表述发表一些评论。对于一个级数  \sum_{r=1}^{\infty}u_{r}(x)  ,若对于区间 [a , b] 的所有 x ,若当 n 足够大时, |r_{n}(x)| 无限小,则称其在此区间上一致收敛。使用符号,这个定义可以记为:

(3.12.5)       ε > 0 ; ∃N {if  x∈[a , b] and nN  ,则 |r_{n}(x)|< \epsilon }  。

正如我们所见,CauchyWererstrass分别定义了这种收敛模式,而 Seidel则 为此付出了艰辛的努力。

    若对于一个点 x_{0} ,存在其一个领域  [x_{0} - \delta, x_{0} + \delta]  ,使其在此领域内在 (3.12.5) 的意义上是一致收敛的,则此级数在此点 x_{0} 的一个领域内是一致收敛的。正如我们所见,Wererstrass 提出了这个模式的概念应区别于在点 x_{0} 处的收敛。其根据以下条件定义:

(3.12.6)  ε > 0 ;∃ δN {if  x \in [x_{0} - \delta, x_{0} + \delta]  and nN  ,则 |r_{n}(x)|< \epsilon }  。

这种收敛模式与其前面的收敛模式的区别在于,现在的 δ 依赖于 ε ,因此随着 (ε 的减少) 而递降,因此给出在 x_{0} 处一致收敛,而前述定义的 δ ε 的大小无关 。

此外,还有一类并行的收敛模式,称为“准一致收敛(quasi-uniform convergence)”,其中 |r_{n}(x)| 对于所有 nN  值都很小的条件,被替换为对于无穷多个 n 值都很小。作为示例,我将在 x_{0} 附近建立准一致收敛,因为Stokes的“非无限慢”收敛(参见上文 3.10 节)与它密切相关:

(3.12.7)  δ [ε , N > 0 ; ∃ n_{0} { if  n=n_{0} > N and x \in [x_{0} - \delta, x_{0} + \delta] 则 |r_{n}(x)|< \epsilon }  ] 。

每一种模式都有其缺点(非一致和准非一致收敛),也存在更复杂的模式,例如按区间的一致收敛,我在本节前面提到过,这可能属于Weierstrass的权限范围。

    我不会描述这些模式的引入历史,其中许多模式是在1880年之后才出现的(参见Hardy 1918a)。我的主要目的是指出这些新区别所带来的数学分析的根本性变革它们的重要性在现代教科书中往往没有得到很好的体现因为它们被当作对一些零散定理的细微改进;但在一些较早的教科书中,这一点得到了很好的阐述(例如,参见Carslaw 1930a和Knopp 1951a),并且Weierstrass在其教学中也强调了这一点(根据Stolz 1881a,256)。它们重要性的一个方面是需要大量的符号

    谈到函数级数的收敛性,我将简要回顾 Fourier级数的收敛性,以及一篇预示了Riemann-Weierstrass时期并对其产生一定影响的论文。Rudolph Lipschitz在其1864a的博士论文中——写于Riemann预计论文起草之后、发表之前——着手将 Dirichlet条件推广到无穷多个振荡和/或不连续点。在思考它们如何沿实数轴分布时,他发展了一些测度和点集理论的原始思想(比较4.5节和5.5节)。他要求不连续点位于一个有限的区间并集内,这些区间的总长度任意小,并且对f (x) 的积分的贡献也任意小。然而,后一个规定引出了扩展条件的问题,因此他决定“搁置这些情况的研究”。但在振荡问题上,他取得了更大的成功。作为最一般的情况,他将区间划分为子区间,每一个子区间内要么有无穷多个振荡落在子子区间内而只有限个振荡落在子子区间外要么无穷多个振荡均落在每一个子子区间内(用现代术语来说当它们在子区间上稠密(dense)”)。通过一个复杂的论证,他紧密遵循了Dirichlet的证明方法(见上文3.9节),证明了若要Fourier级数收敛 则 f (x) 在这个区间上需满足α阶“Lipschitz条件”:

(3.12.8)       | f (x + h) - f (x) | < Bh^{\alpha} \quad ( h , B , \alpha> 0 )  。

在本世纪余下的时间里,人们发展出了Fourier级数收敛的更一般条件,包括它们一致收敛的可能性(参见 Paplauskas 1966a)。一位就这些问题以及整个Weierstrass分析领域(尽管并非总是达到所需的严谨标准)撰写了大量著作的Weierstrass学派学者是 Paul du Bois Reymond。例如,在他 1876a 的著作中,他将 Riemann的二阶差分公式(3.11.2)应用于Fourier级数和积分,并在附录中驳斥了Dirichlet和Riemann的一个猜想,即每一个连续函数都有一个收敛的Fourier级数。在他 1874a 的著作中,他讨论了在考虑函数跨越跳跃的不连续性或邻接性(他没有使用这个术语)时,重复极限和二重极限之间的区别;事实上,如果他处理 Dirichlet 部分和公式(3.9.8)时没有那么粗心,他就会得到我们在上文3.10节中看到Wilbraham所考察的“Gibbs现象”。他以及其他许多人在Fourier分析方面的工作,涉及到积分的更一般定义(将在第四章讨论),以及除逐项加法之外的其他求和形式。但我将把这些发展放在一边,转而讨论Riemann-Weierstrass分析风格的另一个重要方面可定义函数类的扩展

3.13  Dirichlet函数理论 (The post-Dirichletian theory of functions)

Riemann在其关于三角级数的论文中接受了Dirichlet非常普遍的函数概念(见上文3.9节),并寻求这样一些函数的例子即这些函数不仅具有无穷多个不连续点或转值(turning values),而且也具有可定义的积分和/或收敛的三角级数。其中一个例子在4.3节中描述。

Weierstrass学派着手构建定义了具有无限振荡且在有限区间内不连续的函数的解析表达式,并研究了其对数学分析的影响。Hermann Hankel在其1870a的论文中引入了这类函数的分类。他考虑了函数 𝜙(y),这些函数在y [-1, +1] 上具有收敛的 Taylor 级数但 y = 0 时除外此时左右极限值分别为 -1 +1 。他将这样的点称为“奇点(singularity)”(译注:“奇点”是给定的数学对象在此点上未定义的点,或者数学对象在该点上不再以某种特定方式良好定义的点,例如,不具有可分析性的点),并指出,对于f (x) 中无穷多个x值,都可能出现这样的奇点,其中

(3.13.1)     \displaystyle f(x) = \sum_{r=1}^{\infty}\phi(\sin(r{\pi}x)) r^{-s} \quad (s > 3)  。

他根据函数所表现出的“奇点凝聚性(condensation)”对函数进行了分类(Hankel 1870a,第 4 条)。

    对于连续函数,Hankel 区分了递减振幅和恒定振幅,给出 x\sin{(1/x)}  和 \sin{(x)} 围绕 x = 0 作为每一个分别的例子(第 3 条;他在这里提到了 Lipschitz 的工作)。对于“线性不连续函数”,他考虑了区间内点的集合[Schaar],在这些点上出现“某种性质”(例如不连续或振荡),并将函数分为三类:一类函数的点“在区间[Strecke]中无法指定任何子区间,无论该区间多么小,至少有一个点不位于该集合中”;一类函数的点“在区间中任意两个接近的点之间,总能找到一个子区间,其中没有该集合中的点”;以及“完全线性不连续函数”,其“跳跃超过某个有限幅值的点填满了整个区间”(第7条)。

Lipschitz一样,点集理论也初露锋芒,我们将在第五章中看到它在Cantor的指导下逐渐发展。Hankel的论文大部分篇幅都集中在与他的函数类型相关的定理及其例子上。尤其令人感兴趣的是非比数(irrationals)的完全不连续特征函数他给出了它的解析定义

(3.13.2)      \displaystyle f(x) = \sum_{r=1}^{\infty}{r^{-s}}\bigg /\sum_{r=1}^{\infty}{r^{-s}}\left ( {\phi}\sin{(r{\pi}x)}\right )^{-2}  ,

其中,𝜙(y) 是 1 在 y 的 [0 , π ] 上的 Fourier 级数,与Dirichlet的明显信念相反,他认为这个函数不能这样表示(参见上文3.9节)。这个函数的更简单的表达形式在接下来的二十年里发现了(有关一些参考资料,请参阅 Pringsheim 1899a, 第41页),其中我们今天最熟悉的是

(3.13.3)       \displaystyle \lim_{m \rightarrow \infty}\lim_{n \rightarrow \infty}{\left \{ \cos{(m!{\pi}x)^{2n}} \right \} }  。

Gaston Darboux在1875a年发表的一篇关于Weierstrass分析和Riemann问题各个方面的长篇论文中进一步研究了此类例子。他的论文对于将新的日耳曼思想引入法国数学家的关注具有重要意义,我们将在4.4节再次讨论它。他扩展(并批评)了Hankel对(3.13.2)式的处理。除其他外,他还指出,若

(3.13.4)      \phi (y) = y^{2}\sin(1/y)  

且  \sum_{r=1}^{\infty}a_{r}  是绝对收敛的,则

(3.13.5)     \displaystyle f (x) = \sum_{r=1}^{\infty}{\pi}a_{r}\phi^{'} (\sin{(r{\pi}x)})\cos{(r{\pi}x)}   

是一致收敛的,即使其项是不连续函数,并取

(3.13.6)     \displaystyle F(x) = \sum_{r=1}^{\infty}r^{-1}a_{r}{\phi}(\sin{(r{\pi}x)})  

作为其不定积分(即不确定的积分)。他总结道:“这样,我们得到了一个连续函数,其导数对于 x 的所有可通约(commensurable)[比率(rational)]值都是不连续的,但对于 x^{'} 的所有值都存在。”(第 109 页)。在考虑了这个问题以及他在论文中构造的其他函数示例之后,他可以理解地指出:“似乎很难指出一个普遍的特征,可以识别函数 f (x) 是否具有原函数(primitive function),也就是说,它是否是另一个函数的导数[函数]”(第 111 页)。请注意上文 3.4 节中定义的 Lagrange 术语的持久性(durability);它至今仍在法国数学中沿用。

    对于这样的函数,我们可以看到连续性与可微性之间的问题以一种鲜明的形式出现是否存在一个处处不可微的连续函数?Weierstrass在1872a的手稿中给出了肯定的答案,并举了如下例子

(3.13.7)     \displaystyle \sum_{r=0}^{\infty}b^{r}\cos{(a^{r}{\pi}x)})\quad ( 2ab > 2 + 3{\pi} )  ,

其中a为奇数,且0 < b < 1。他将其发表于1880a第6期,但该论文最初发表于du Bois Reymond 1875a年第29-31页。关于此类函数的广泛讨论不仅体现在印刷品中,也体现在通信中(参见Hawkins 1970a年第44-50页),并在随后的几十年里发明了大量连续但不可微的函数(参见Boas 1969a)。Weierstrass在1885a证明了他的“逼近定理(approximation theorem)(任何连续函数都可以在有限区间内用一系列多项式一致地(即均匀地)逼近,也可以用一系列正弦和余弦的有限和来近似)这为其幂级数的信念提供了一个重要结果

    法国数学家René Baire提出了一些重要的改进,尤其是在他1899年的著作中(参见Dugas 1940年著作,第64-71页)。他定义了上半连续性下半连续性的性质,这与连续函数在其自变量闭区间上何时达到其值的上下界有关。他还引入了一种函数分类,其中最低类是连续函数,而较高类中的每一个函数被定义为紧邻较低类的函数收敛序列的极限函数。这种分类促使Baire的同事Henri Lebesgue在1905年对函数的解析可表示性的范围进行了深入研究。

3.14  证明方法和微积分的完善 (Refinements to proof-methods and to the differential calculus)

在关于Weierstrass分析的最后一节中,我将概述一些微积分的完善。在前言中,我将简要评论Weierstrass力求在所有数学分析领域应用的严谨标准。

我在上文3.6节中提到,Cauchy对极限的文字表述并没有明确说明所涉及变量之间的函数关系。Weierstrass 推广了用ε, δ定义形式来表达这种关系的做法(早期的例子,见Dugac 1973a, 第119页)。Augustus de Morgan 在其1835a 154-155页中预见了这种定义形式但他并没有在其关于分析的著作中对其进行发展

作为其方案(programme)的一部分,Weierstrass引入了非比数(irrational numbers)的定义。(注:由于定义复杂,我在此不再赘述,但可以参考Weierstrass的学生在 Pincherle 1880a,Dugac 1973a(手稿版)及其他文献中给出的说明。下文第 5.2 节和第 6.2 节介绍了Cantor和Dedekind的较为简单的理论,它们也是出于同样的目的而引入的。有关这些定义的概述,请参阅 Pringsheim 1898a。)  该定义的一个动机是确保可以完全省去无穷小量,尽管一些Weierstrass学派的人肯定了实际无穷小量的形式(参见Vivanti 1891a)。更重要的是,需要避免他的前辈们对诸如介值(intermediate)定理之类的关于极限存在性的定理进行乞题式的证明(question begging proofs)(译注:指以需要证明的命题作为证明的前提,即用一个问题来支持结论,结论的理由是问题自身(A推出A),这样的错误称为乞题错误‌)。在此类定理的证明中,一个重要的引理是“Bolzano-Weiserstrass定理”该定理断言一个无限有界集(实数集)至少包含一个极限点”。据听过他讲课的人说,Weiserstrass在证明过程中采用了逐次分割集合并最终求得所需点的方法(参见 Pincherle 1880a,第 237页),他们之所以给该定理起这个名字,是因为Bolzano在其 1817a 年的介值定理(intermediate theorem)证明中(不严谨地)使用了这种方法。同样的证明方法也被用来证明诸如连续函数在有限区间上达到其上下界之类的定理(参见 Dugac 1973a, 第11, 120 页 )。

Weiserstrass也在微积分中有效地运用了这些定理。以下引理具有典型性:若 f (x) 和  f^{'}(x)  在闭区间 [a, b] 上连续且值有限,而  f^{'}(x) 始终为正,则 f (b) > f (a),且 f (b) 和 f (a) 分别是 f (x) 在该区间内所能取的最大值和最小值(因此 f (x) 在该区间内达到其边界;参见 Dugac 1973a, 第118-122页)。关键等式是

(3.14.1)       f (x_{0} + x) - f (x_{0}) = h\{f^{'}(x_{0}) + hh_{1} (h , x )\}  ,

其中,随着 h ⟶ 0 而  h_{1} \rightarrow 0  (从而正确地表达了“误差项(error term)”对 h 的函数依赖性)。K. H. A. Schwarz 在 1870 年写给他的同事Georg Ferdinand Ludwig Philipp Cantor的一封信中(译注:此处应该是笔误,打成“Weierstrassian Cantor”是何意?Weierstrass 学派的Cantor?不符合语境),用这些结果证明了:若 f (x)在闭区间 [a, b] 上连续且值有限,并且对于每一个 x  都有

(3.14.2)    \displaystyle \lim_{h \rightarrow 0}\{(f(x+h)-f(x))/h\}=0  ,

则   f^{'}(x)  存在且总是为0 ,因此 f (x)在其定义域上总是常数 。在他的证明中,Schwarz 考虑了函数

f (x) - f (a) - k (x a ) 和 f (x) - f (a) + k (x a ),

其中,k 是正数,并使用 Weierstrass 引理来证明,前面的函数为负且导数为 -k ,而后面的函数为正且导数为 +。因此

(3.14.3)     | f (b) - f (a)| = 2 k(b - a)  。

k 是任意的,因此可以取得如我们所愿地小;而 b 也是任意的。因此,由(3.14.3)可知所期望的结论。“上述证明似乎是完全严格的”,Schwarz自豪地写信给Cantor,“它是微积分的基础”(Meschkowski 1964a, 第89页)。

    通过这样的证明,我们可以对微积分介值定理进行更严格的处理。因为通过考虑连续函数 f 的导数 f^{'}  在 [a, b] 上的行为,我们可以利用Weierstrass对介值定理的证明来证明介值定理,而无需使用Cauchy关于导数总是连续的假设(比较上面的 3.7 节)。这种推理方式最早是由对介值定理做出杰出贡献的法国数学家Ossian Bonnet提出的发表在 Serret 1868a, 第17-23页中;DarbouxSchwarz是其中两位发展了推广的人。同样,Taylor级数的收敛性也进一步获得研究(包括单变量和多变量函数),并得到了余项的各种新表达式;它也相应应用于对函数最大值和最小值的更高级研究(参见 Voss 1899a, 第65-88页)。

微积分中还有更多结果可以描述;例如,微分的定义和偏导数理论。但我将以Weierstrass学派对一对四重奏——四个导数和四个极限——的处理来结束本节。我们引入Dini,他是第一个学习Weierstrass 新技巧的意大利人。他于1878年出版了一本关于分析基础的教科书,这本书非常出色,以至于Cantor试图组织一本德文译本(参见Grattan-Guinness 1974年第115-116页);最终,德文版(由其他人编写)于1892年出版。

    Dini接受了Weierstrass和 Riemann 提出的新函数类型,并意识到,由于它们的不可微性源于其连续振荡的特性因此将连续函数的导数定义为差商的极限值的基本思想需要改进。为此,他取区间 (a, x) 和 (x, b),并分别考虑了差商在每个区间上的行为。

令  l_{x}  和  L_{x}  分别为商在 (x > b) 上的最大下界和最小上界:

(3.14.4)     l_{x} \quad \overset{=}{Df} \quad {\inf {\{(f (x + h) - f (x ))/h |x + h\in[x,b) \}} }  。

(3.14.5)     L_{x} \quad \overset{=}{Df} \quad {\sup {\{(f (x + h) - f (x ))/h |x + h\in[x,b) \}} }  。

x 是定值, l_{x}  和  L_{x}  是 b 的函数。现在通过将 b 移向 x 从而减区间。h 的取值范围相应减小,因此商必然取一组较小的值。因此,当 b 趋近于 x 时, l_{x} 的值将增大(或保持不变),而 L_{x}  的值也将类似地减小。因此,当 b 接近 x 时,它们都会取一个极限值,我们现在通常称之为 f (x) 在 x 处的“右下导数”和“右上导数”,并分别记为“  D^{+}f(x)  ” 和 “ D_{+}f(x) ”。从 (3.14.4) 式可以看出,D^{+}f(x)  的正式定义是

(3.14.6)    \displaystyle D^{+}f(x) \quad \overset{=}{Df} \quad \lim_{b \rightarrow x^{+}}{​{\sup {\{(f (x + h) - f (x ))/h |x + h\in[x,b) \}} }}  。

(Dini 1878a,尤其是第 145 条)。

    我们可以简化这个公式,因为当 b 趋向于 x 时,差商的最小上界序列的极限,就是当 h 趋向于零时商的上限。因此,我们可以将 (3.14.6) 替换为

(3.14.7)    \displaystyle D^{+}f(x) \quad \overset{=}{Df} \quad \overline{\lim_{h \rightarrow 0^{+}}}{\{ (f(x+h)-f(x))/h \}}  。

类似地,我们根据这个差商的下极限来定义这个   D_{+}f(x)   ,以及定义 D^{-}f(x) 和 D_{-}f(x)  为差商  \{ (f (x) - f (x-h ))/{(-h)} \}  的上下极限(Dini ,同上) 。通过研究这些导数的存在或不存在以及研究它们相互相等或不等的关系,最终可以充分研究连续函数的可微性(参见 Hawkins 1970a,第45-54页)。

这种方法的一个显著特点是它既使用了最大下界和最小上界(上文 (3.14.4) 和 (3.14.5) 中的 “inf” 和 “sup”),也使用了下限和上限。我在上文 3.8 节中提到,Cauchy在他的收敛性检验证明中并没有非常清楚地定义上限,而且在Weierstrass的讲座之前,这些极限类型之间的区别并不总是能被清楚地理解。随着极限的引入,极限的研究得到了极大的推进(参见 Pringsheim 1898a);但相关文献并不容易阅读,部分原因是偶尔存在一些不清楚的地方,还因为术语上的困难(译注:本书中有的地方也有模糊之处)最大下界和最小上界通常称为上限和下限“ Schrank ”或“ Grenze ”(译注:这两词是德语单词),它们都可以翻译为“ 极限”或“界限”下限和上限被称为“Limes”或“Limite”,它们是专门的技术术语,在翻译中必须归于“limit”;du Bois Reymond 在其著作 1870a 第3条中引入了级数的“不确定极限”,这些概念我们现在称之为级数的下限和上限。此外,这些符号在作者中并不统一;例如,直到本世纪末,才引入了“lim inf”“  \underline{\lim}  ”,以及“lim sup”“ \overline{\lim} ”作为下限和上限的符号

另一位研究这些极限类型之间差异的数学家是我们的第二个意大利人Peano。在他职业生涯的早期,他于1884年出版了一本关于微积分基础的教科书,这本书的重要性与Dini的著作不相上下,并且后来也出版了德文版。这本书是他老师Angelo Genocchi讲义的版本,并以他自己的笔记作为序言,而笔记是本书最重要的部分。尤其值得注意的是,它关注多元分析,包括Taylor展开式、多元函数的一致连续性,以及一个混合偏导数不相等的函数的例子。

    Peano继续他对分析基础的兴趣,并撰写了几篇论文,尤其是1894a年的论文,探讨了不同类型的极限和多重极限理论(参见Cassina 1936a)。他还撰写了关于中值定理和导数定义的文章。但或许他最重要的贡献在于,他让人们注意到表达数学分析精妙之处所需的符号语言。在整个世纪中,我们看到符号在数学分析中的应用逐渐增多,Peano通过使用他在数理逻辑研究中引入的符号,将这种实践拓展到了新的高度。如果我们说“对于所有ε,都存在一个 δ ……”,那么我们应该将句子的这一部分以及后续的不等式符号化,Peano为分析符号化方法奠定了基础,我在本章(尤其是3.12节)中已经在使用。(注:如今,符号化有时会被滥用,以至于“ε”证明的目的变得模糊。证明通常取决于在后缀变量很大且实数变量的增量很小时,证明某个函数 F 的自变量、因变量和常数项的函数值很小。因此,我们寻求 F 的一个小阶——在 Landau 符号中为 O(ε)(有时为 o(ε))。但教科书上的证明有时会被操纵,以至于在最后一行只剩下一个裸露的“ε”。我曾经看到过一个“证明”,它早期读起来像这样:

(1)     “若 n > N ,则 |r_n(x)| < (7{\pi}^{2} \sqrt{\sigma})\epsilon/(2A + k^{3})  ”

这样,末尾就可以显示纯“ε”。这简直是数学教育中最糟糕的“变戏法”了;(1) 中围绕着“ε”的两个常数甚至直到几行之后才被定义!

    对数学分析教科书证明的另一个批评涉及不等式的表达。这些证明通常是这样的:

(2)    \mathcal{A} \leq \mathcal{B}_{1} \leq \mathcal{B}_2 \leq \mathcal{B}_3 ...  ,

证明中的每个表达式   \mathcal{B}_{i}  都与原始表达式 𝒜 相关,但 (2) 并未显示连续的 \mathcal{B}_{i}  彼此之间的关系。如果学生能够理解这些符号与连续表达式之间的关系,那么 (2) 将会被更具信息量的

(3)   \mathcal{A} \leq \mathcal{B}_{1} = \mathcal{B}_2 \leq \mathcal{B}_3 ...  ,

(比如)   。)

Peano在19世纪90年代创办的期刊(最初名为《数学评论》(Rivista di matematica),后几卷有所变更)和教科书(最初名为《数学公式》(Formulaire de mathematiques),后几版也曾更改)中,也对传播他本人及其周围数学家的成果做出了重要贡献。因此,我以Peano的著作作为数学分析发展历程的总结是恰当的,因为他及其追随者对积分、集合论和数学基础的贡献将在本书的其余三章中提及。但在继续之前,让我们先回顾一下目前已完成的三章。

3.15  统一与划分是进步的双重助力 (Unification and demarcation as twin aids to progress)

    我们如何衡量数学知识的进步?数学理论的适用范围和普遍性是一个标准,它可以应用于其定义和定理、特殊情况解的积累、同一类型问题逐渐复杂的版本所获得的结果等等。例如,我们在第二章中看到,Leibniz的微积分基于将变量x的值域划分为(常数或变量)量dx的增量,它比本世纪早期使用的各种方法能够解决更广泛的问题而微分和积分之间的逆关系极大地扩展了这些方法的应用范围。在本章中,我们看到,随着微积分成为基于极限的数学分析的一部分,其应用范围进一步拓宽。在接下来的章节中,我们将看到同样的扩展过程发生在积分的定义集合论引入的结果以及数学的基础研究中。

    但我们在这里关注的重点,正如在数学教育和鉴赏中一样,在于数学理论的基础和严谨性;并且在评估进展方面也体现出一些特殊之处。我不打算在这个困难而复杂的问题上长篇大论,但我将举例说明本章中出现的一些特点。

    从严谨性的角度来看,定理的可靠性取决于其证明的可靠性。因此,严格来说,即使在表述中使用相同的词语和符号,不同的证明也可能证明不同的定理。评估证明严谨性的一个重要组成部分是考察其定义,因为定义是假设链终止的地方;最终我们会得到一个定义,其定义表达式必然使用未定义的概念。因此,我们可以评估相互竞争的数学理论,看某些基本结果是否基于其他思想的更深层定义而证明为定理,或者它们是否必须假设。例如,Cauchy的微积分比Lagrange的微积分有更深的根基,因为Cauchy的Taylor级数是一个定理,而Lagrange的Taylor级数则必须视为理所当然。我特意使用了“根(root)”这个词,因为它的含义是向下挖掘新的基础而这正是我们理解基础的意义,正如Gottlob Frege在我引用的章节(见第0章开头)中指出的那样。

    定义还发挥着另一个重要作用;它们引入了新的区分(distinctions)。例如,上文3.12节中描述的一致和非一致收敛模式。那里的每个定义都引入了一个先前被忽视的区别,而早期的研究对此也缺乏逻辑。因此,Cauchy在《分析教程》中提出的“假(false)”定理由于缺乏这些区别而显得模糊不清,并且——将这一点与我之前关于定理会随着证明而改变的观点联系起来——他的定理在Seidel的, Stokes的以及他自己后来的著作中变成了不同的定理,因为每次都引入了不同的新区别,从而以不同的方式影响着旧的证明。

    因此,在基础研究中,我们可以看到,更大的普遍性源于更细微的区分——本节标题的“统一与划分”。我将从本书的前三章中列举几个例子,并留下提示,它们也出现在本书的后三章中。

    微积分技术最初只是一堆碎片化几何技术的杂糅(rag-bag),Leibniz(Newton)的微积分将其统一起来。然而,Leibniz微积分本身在高阶微分的定义以及使用它们的表达式依赖于变量值域的特定无穷小分划方面存在歧义。因此,它被Euler 版本的微积分所取代,该版本的微积分将一个或多个变量根据其均匀分划的标准指定为独立变量,而其他变量则被视为与这些变量函数相关。Cauchy倡导一种基于极限理论的新方法它将微积分、级数收敛和函数论统一起来,形成了数学分析。但在当时,它仅仅是一个单极限分析,而一些主要问题需要多重极限理论(或者更普遍地说,双变量方法),在此之前,它一直举步维艰。然而,Dirichlet关于Fourier级数的工作——当时最杰出的,但绝不是唯一的重极限问题——暗示了Weierstrass学派最终实现的重极限分析的未来方向,包括对级数收敛模式的处理、对实数线结构的关注、一些新的证明方法(尤其是存在性定理的证明方法)以及对数学符号的广泛运用。

    在强调单极限和多极限的区别时,我的确有意质疑数学分析中惯用的称谓。“分析的算术化”这一术语在上个世纪末广泛使用,因为定义和证明方法简化为实数及其不等式的算术。但该术语几乎没有凸显其新特点,因为它的应用强度与上个世纪微分运算相当。最近令人反感的“ε”一词被使用,指的是“(ε, δ)”式的定义框架这对于Cauchy的单极限分析来说相当令人满意,因为他有时正是用这些符号来表示与自变量和因变量的增量相关的小量——上面3.7节中描述的中值定理的证明就是一个例子。但除此之外,“ε”是一个毫无用处的术语因为它既包含了Cauchy单极限风格的 (ε, δ) 风格,也包含了 Weierstrass学派即将引入的多重极限分析风格的 (ε, δ, N, ...x ...) 风格,而Weierstrass学派正是以此为基础重新评价Cauchy时期的。(译注:不用此风格用什么风格呢?)

    但是,正如我们从教科书中所知,现在数学分析中仍然使用了更精细的区别。本书的其余部分将重点介绍这些区别。

内容来源:

<<From the Calculus to Set Theory, 1630-1910>>(An Introductory History),I.Grattan-Guinness 等。  

  

   

电子时钟设计是一个基于单片机的综合性电子项目,涵盖硬件设计、软件设计、模块代码编写以及运行展示等多个环节。以下是该项目的详细分析与知识点总结: 电子时钟设计是一项课程设计任务,目标是开发一个功能完善的电子时钟系统。该系统以单片机为核心控制器,具备时间显示、设置和控制等功能,旨在满足用户的日常使用需求。 硬件设计的核心是系统方案原理图,它明确了系统的整体架构以及各组件之间的连接关系。外设设计方面,键盘输入模块和数码管显示模块是关键部分。键盘输入模块的工作原理包括键盘扫描、按键识别以及状态机控制等环节;数码管显示模块的工作原理则涉及数码管的驱动、显示控制和状态机控制等内容。 软件设计的核心是项目软件系统总架构图,它详细介绍了系统的软件框架,涵盖单片机编程、键盘输入模块流程图与代码、数码管显示模块流程图与代码等方面。顺序图则展示了软件的运行流程,包括系统初始化、键盘输入处理、显示控制和状态机控制等环节。 模块代码是系统各模块功能的具体实现。例如,键盘输入模块的代码实现了键盘扫描、按键识别和状态机控制等功能;数码管显示模块的代码实现了数码管驱动、显示控制和状态机控制等功能。 运行展示是项目的最终成果呈现环节,展示了电子时钟的实际运行效果,包括时间的准确显示、便捷的设置操作以及稳定的控制功能等。 单片机原理:掌握单片机的架构、指令系统和编程方法。 Proteus仿真:熟悉Proteus仿真原理、仿真环境及仿真操作。 C语言编程:理解C语言的语法、数据类型、控制结构、函数和数组等基础知识。 电子时钟设计:了解电子时钟的工作原理、设计方法和实现技术。 硬件设计:掌握硬件设计的基本原理、方法和工具。 软件设计:熟悉软件设计的基本原理、方法和工具。 模块代码实现:掌握模块代码的设计、编程和调试技巧。 电子时钟设计项目融合了硬件与软件设计,通过模块代码实现功能,并通过运行展示呈现最终效果。掌握
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值