第 4 章 现代积分理论的起源
(The Origins of Modern Theories of Integration)
Thomas Hawkins
目录
4.2 Fourier分析与任意函数(Fourier analysis and arbitrary functions)
4.3 对Fourier问题的回应(Responses to Fourier)(1821-1854)
4.4 Riemann积分的缺陷(Defects of the Riemann integral)
4.5 关于积分的测度论公式(Towards a measure-theoretic formulation of the integral)
4.6 可数集之测度是多少?(What is the measure of a countable set ?)
4.1 引言(Introduction)
20世纪初,法国数学家 Henri Lebesgue创立了积分理论,并成为现代积分理论的典范。本章旨在追溯19世纪分析学的发展,这些发展为Lebesgue的研究提供了概念框架和动力。
出发点是函数概念的变化。在构建他的积分理论时,Lebesgue接受了实数函数的定义,即实数之间的任何对应关系 x ⟶ f (x),并意识到以这种方式定义的函数非常普遍,以至于积分的含义需要进一步研究,于是他试图将这种研究建立在积分作为面积的概念之上。
这些构成他著作起点的思考,并非源于他本人,而是起源于19世纪上半叶。在讨论这些思考的起源之前,回顾一下18世纪人们对函数和积分的理解方式将会有所帮助。
18世纪下半叶,函数概念成了数学分析的基础(参见2.7节和3.3-3.4节),函数和积分主要以代数形式来理解。函数f (x) 是某种等式,可能包含无穷多个项;而积分则是确定一个以f (x) 为导数的原函数F(x)的问题,或者更一般地说,是确定一个表示微分方程解的方程的问题。这种代数取向并不令人惊讶,因为18世纪的数学分析起源于Vietè和 Descartes 将古希腊人的几何分析转化为一种方程分析方法,而这种方法在Newton,Leibniz,Euler等人的推动下,已被证明是一种解决各种几何和力学问题的极其强大的工具。
积分是这种在本质上是代数式解决问题方案的一部分。积分与面积的确定相关,这一点自然而然地被理解。事实上,Leibniz符号 不断提醒我们,积分在几何学上可以理解为无穷小矩形 ydx 之和;有时,数学家会通过计算近似多边形的面积来估算积分的值。但面积的确定只不过是将一种更普遍适用、本质上是代数的运算应用于代数构想的函数而已。
将函数视为 x ⟶ f(x) 的对应关系,并将积分视为本质上的面积,这回归了一种更偏向几何学的观点。实际上,这种观点在 18 世纪已经在一定程度上存在,尤其体现在关于振动弦问题的争论中(参见 3.3 节)。回想一下,d'Alembert给出的波动方程解的形式,促使Euler得出结论:生成解的函数不必是“连续的”,即由单个方程给出。它们可以是“不规则的”或“绝对任意的”函数,Euler似乎指的是,在其定义域的不同区间,由不同的方程定义的函数,甚至根本不由方程给出,而是由平面上“随意描绘”的曲线给出的函数。他将这些函数称为“不连续函数”。尽管Euler愿意将这些更具几何构想的函数纳入分析的范畴,但其结果却未能重述分析的基础。人们已经迈出了更加几何化地研究函数的第一步,但这种方法直到Fourier在对分析基础更具批判性的态度兴起之时才得以取得成果。
4.2 Fourier分析与任意函数(Fourier analysis and arbitrary functions)
振动弦争论中的一个次要问题是(根据Euler的说法),那些产生解的任意函数,是否真的可以表示为一系列正弦函数。 Daniel Bernoulli基于物理考虑,认为它们必然如此,但似乎没有其他人赞同他的观点。对Euler和 Lagrange来说,断言一个完全任意的函数总是可以表示为有限区间内正弦函数的和,这似乎自相矛盾,因为这种表示似乎限制了它的任意性。然而,Fourier对固体热传导的研究,为他提供了一个强有力的数学理由,让他想要证明Bernoulli的主张是合理的。为了解决他的分析所导致的边界值问题,Fourier使用了如今已为人熟知的分离变量法。该方法的有效性取决于一个假设:在边界条件下出现的“任意”函数 f (x) 可以用三角级数(译注:即无穷多项三角函数之和)表示。特别是,若 f (x) 定义于区间 上,则对于所有此区间中的 x ,有
(4.2.1) 。
Fourier熟悉18世纪关于振动弦问题的文献,并且深知Bernoulli的立场并不受欢迎。Lagrange反对巴黎法国学院(Institut de Franc)接受他的(译注:指Fourier)第一篇回忆录(1807),在某种程度上是因为是否接受Bernoulli的立场。由于篇幅所限,Fourier无法详细讨论(4.2.1)式有效性的论证。以今天的标准来看,他的一些论证并不比他18世纪前辈的论证更有说服力。然而,他首次提出了如今被认为是问题核心的问题:(4.2.1)式中级数的部分和(partial sums)是否收敛于f (x)?他为肯定的答案提供了强有力的论据,尽管并非无可辩驳的论证。然而,从积分史的角度来看,他的一个 18 世纪的论点尤其重要。
Fourier 将 (4.2.1) 视为一个由未知系数 构成的无穷项等式(对注:没有
项,因为其为零)。他证明这此地未知的系数可通过下列方式“求解”。以求解
为例 。 根据 (4.2.1) 可“推导”出
(4.2.2) 。
因为涉及到的正弦和余弦积分均为零,因此,根据 (4.2.2) 得到
(4.2.3) 。
在这里,Fourier 想当然地认为,无穷和的积分是其项的积分之和——这一假设至今还没有人看到质疑的理由(译注:)。换言之,我们已经假设
(4.2.4) ,
其中,
(4.2.5) 。
应用这个假设,他按照相似的方式求得公式
(4.2.6) ,
。
这就是三角级数 (4.2.1) 的系数值,现在我们可以称 Fourier 所声称的收敛于 f (x) 的级数是 Fourier 级数。
Fourier 论证其Bernoulli型断言正确性的权威版本出现在他的著作《热传导分析理论》(Théorie analytique de la chaleur)(1822a) 中。该书出版时,Lagrange已不在人世,Fourier 是否说服了Lagrange也不得而知。然而,Fourier本人却完全相信,Euler提出的“不连续”或“任意”函数实际上也可以用三角级数表示。Euler的任意函数实际上比振动弦问题中出现的函数更为普遍。由于y = f (x) 表示t = 0 时弦的形状,因此它必须是完整的一段,而在热传导的物理背景下,这种限制并非必要;因此,Fourier 也考虑了图4.2.1所示的“任意函数”。(也许他加入垂直实线是为了传达一种连续性的感觉;比较第 3.5 节。)
---------------------------------图 4.2.1----------------------------------
Fourier 描述其“任意函数”的方式极其重要(1822a,第417条):
“一般来说,函数 f (x) 表示一系列任意值或纵坐标。横坐标 x 有无穷多个值,因此纵坐标 f (x) 也有相同个数(译注:假设x重复计数)。所有值都有实际的数值,或正或负,或为零。
我们假设这些纵坐标不遵循共同规律;它们以任何方式相互继承,并且每个纵坐标都视为一个单一的量。”
这些词语所隐含的函数概念,与18世纪“连续”函数的概念相去甚远。Fourier的描述类似于Euler对“不连续”函数的描述,尽管它更倾向于强调函数的任意性。如果从字面上理解,它隐含了现代函数的概念,即实数之间任何明确定义的对应关系 x ⟶ f (x)。
Fourier究竟想如何在字面解释他的描述尚不清楚。书中给出的任意函数示例均由有限个“连续”片段构成,其中 -l ≤ x ≤ l。他的言论表明,他认识到支配 f (x) 的一个或多个定律(即等式)与 (4.2.1) 的有效性无关,尽管这种无关性可能并非全部蕴含于其中。无论如何,他将这些蕴含的拓展留给了其他人。
通过大胆地探索“连续”函数的领域之外的东西,Fourier也不得不放弃 18 世纪的积分概念。表示式 (4.2.1) 中的系数由 (4.2.6) 给出,因此是定积分,这一事实要求重新考虑当 f (x) 为“任意”形式的函数时这些积分的含义。显然,谈论等式的反导数是不恰当的,甚至是不可能的,因此Fourier诉诸于一种更几何的解释:积分应视为面积。由于对于每一个 x 都存在一个纵坐标 f (x),这些纵坐标确定了平面上的一个区域,并且他从未怀疑过这个区域有一个确定的面积。他无意中提出了一个重要的数学问题:当 f 为任意形式的函数时,如何准确地将 定义为面积?我们现在来考虑一下Cauchy,Dirichlet 和 Riemann 三位数学家对此是如何回应的。
4.3 对Fourier问题的回应(Responses to Fourier)(1821-1854)
(译注:核心要点是不连续函数也可能可积,只要其满足一定的要件即可。)
对Fourier著作所提出的问题,最早做出回应的是Augustin Louis Cauchy。他是一位早熟的数学家,很快就在著名的巴黎综合理工学院获得了教授的显赫地位。在其著作《数学分析教程》(1821a)和《巴黎皇家综合理工学院关于无穷小计算的捐赠者简历》(Résumé des legons données a VEcole Royale Polytechnique sur le calcul infinitesimal)(1823a)中,Cauchy试图用与希腊几何学一样逻辑严谨的方法来发展微积分的基本命题,并且从不诉诸“源自代数普遍性的推理”(参见3.2节中的引文)。他的论文在多大程度上受到Fourier著作的影响尚不清楚;他拒绝采用形式化的代数方法来研究微积分的基础,还有其他原因。尽管如此,他的论文确实回应了Fourier暗中提出的那些问题;因为在努力避免代数的普遍性时,Cauchy引入了一种更具几何启发性的分析方法,无论有意还是无意,这种方法都回答了Fourier关于定积分含义的问题。
Cauchy重构分析的起点是连续函数的概念。正如我们在3.6节中看到的,他放弃了18世纪对连续性的刻画,转而采用一种更具解析性的特征:如果函数 f (x) 在a和b之间为单值且有限值,则如果f ( x + α) - f (α) 的绝对值随 α 的绝对值无限减小,则函数f (x)在a和b之间连续(1821a, 第34-35页, 著作, 第43页)。由于他的定义与f (x) 作为等式的表示方式无关,因此他的定义与Fourier将函数视为一系列纵坐标的概念相兼容。
在他的《总结》(Résumé)(1823a)中,Cauchy继续运用他的连续函数概念,提出了一种同样与Fourier观点相兼容的积分方法。他仅限于连续函数,Cauchy 如下定义积分 。考虑区间 [a , b] 的一个分割 P :
(4.3.1)
(译注:n + 1 个点构成 n 个区间分割),并考虑“Cauchy 和(sum)”
(4.3.1) 。
并利用 f 是连续的假设,Cauchy 能够证明,对于区间的任意两个分割,其相应的和 S 和 可以做到仅相差一个任意小的数量,假设两个分割的子区间长度
都足够小。(注:证明中使用的连续性指的是一致连续性(译注:按现在的分析)。Cauchy在其定义中究竟指的是哪种类型的连续性尚不明确,而且他很可能没有理解逐点连续性和一致连续性之间的区别;参见第 3.12 节。) 因此,“很显然, S 的最终值是一个常量……这个极限称为一个确定的积分(a definite integral) ”(Cauchy 1823a,讲座 21 ) 。
Cauchy实际上对Fourier的言论提出的问题给出了答案。他的定积分方案表明,其存在性并不取决于定义 f 的等式,且意味着 对 “任意函数”都具有一个有限值(假设这个函数在他所指的意义上是连续的)。事实上,他的定义和存在性证明可以很容易地扩展到 [a , b] 区间具有有限个间断点的有界函数的情况。在后来的一篇笔记(1849a)中,他宣称这类函数正是数学物理边界值问题中出现的那种任意函数。如果 Fourier 还活着,他或许会同意这一点;但Fourier在《热传导分析理论》(Théorie analytique de la chaleur)中的表述,如果从字面上理解,其所提出的问题比Cauchy的定义所解决的问题更为普遍:
可以定义为任意纵坐标 x ⟶ f (x) 的连续体(succession)吗?
Dirichlet给出了否定的答案。19世纪20年代,在Dirichlet还是一名学生时,德国的大学尚未成为数学研究中心。当时,他们拥有一位伟大的数学家——Gauss,但他却以相对难以接近而闻名。因此,Dirichlet决定前往巴黎继续他的数学学业。巴黎汇聚了众多杰出的数学家,例如Laplace, Legendre, Poisson ,Lacroix和Hachette,以及Cauchy和Fourier。Fourier关于热传导理论的著作,正是在Dirichlet抵达巴黎的那一年(1822年)出版的。他们一直待在巴黎直到1825年。他与Cauchy几乎没有直接接触;但他研读了Cauchy的分析著作,这些著作也出版于他在巴黎逗留期间,并接受了Cauchy的分析方法。Fourier更随和(accessible)(译注:大概指的是他和Fourier接触较多),因此Fourier关于热的研究工作所提出的数学问题成为了Dirichlet(1829a)开创性回忆录的主题,在书中,他运用Cauchy分析类型(参见3.9节)回答了Fourier的问题。
Dirichlet接受了Fourier 对任意函数特征的字面解释,并断言积分 不需要是一个确定的值。他提供了下述例子。对于一个函数 f (x) ,若 x 是比率数(rational) ),令 f (x) = c ,而若 x 是非比数(irrational) ) 则令 f (x) = d (d ≠ c)。因此,对于每一个x ,纵坐标 f (x) 是指定的; f 是一个“任意函数”。但是,在 Dirichlet 看来,积分
毫无意义。Dirichlet当时可能正在思考Cauchy的积分定义。不难看出,可以选择 [a , b] 的一个其所有
都任意地小的分割 P ,使得所有的
或 b 都是非比数(irrational)。则相应的 Cauchy 和 S 近似地等于 d(b - a)。在另一方面,存在另一个分割
,而所有
任意地小且
或 b 。
对于这样的一个分割,Cauchy 和 近似地等于 c(b - a)。因此,S 和
并不趋近于一个唯一的极限值:在 Cauchy 和的意义上
并不存在。
因此,为了确保任意函数能够积分,对它的性质进行一些限制似乎是必要的。然而,Dirichlet声称,为了 能够存在,f 无需连续,或者也无需拥有最多有限数量的间断点。在 [-π, π] 中,可以有无穷多个间断点;只需满足以下条件即可:“若 a 和 b 表示介于 -π 和 π (含)之间的任意两个量,则总可以在 a 和 b 之间放置其他充够接近的量 r 和 s,使得函数在从 r 到 s 的区间内保持连续”(1829a,第169页)。用现代术语来说,Dirichlet条件是:间断点集在任何地方都不稠密(dense)(译注:反过来也就是说,连续点集在任何地方都是稠密的,间断点集不影响函数的连续性,这里有点跳跃,突然引入了一个新的术语“稠密”)。
Dirichlet并没有试图证明他的断言,因为清晰的证明需要一些与无穷小分析基本原理相关的细节,这些细节将在另一篇说明中提出……。承诺的说明从未出现,他很可能发现自己无法完成论证。如果他是从Cauchy的积分定义的角度来思考,那么他的沉默是可以理解的,因为当函数满足Dirichlet条件时,Cauchy和不需要趋近于唯一的极限值。虽然没有定论,但Dirichlet的评论包含了一些大胆的想法:函数实际上是一系列纵坐标,因此在Cauchy和的意义上可以完全不连续;尽管如此,应该可以将定积分的定义扩展到有限区间内具有无数个间断点的某些函数。
正如我们在第 3.9 节中看到的,Dirichlet 1829a 的主要结果是,如果 f (x) 在 [π, π] 上有定义且有界,并且它具有有限个最大值和最小值,并且除了可能在有限个点处间断,在其它点都是连续的,则对所有 x ,f 的Fourier级数均收敛于
(4.3.3) ,
其中, 而
。 ( 对于 x = ±π ,(4.3.3) 需作特殊的解释。) 这一结果的证明拓展了Fourier定理中已有的思想,且并不直接依赖于 f (x) 连续性的假设;(加入连续性假设的条件)仅仅是为了确保定义Fourier系数的定积分 (4.2.6) 的含义。因此,Dirichlet对将积分扩展到更不连续函数的兴趣,与他希望验证Fourier关于将尽可能多的任意函数类表示为三角级数的主张息息相关。
Riemann着手研究 Dirichlet未解决的高度不连续任意函数的可积性问题,彼时他已于1851年在哥廷根大学获得博士学位。为了在哥廷根大学授课,Riemann必须撰写一篇教授资格论文以展现出更高的学术能力。Riemann选择函数三角级数可表示性问题作为他的研究课题;在准备论文(1854a)的过程中,他得到了当时在柏林大学担任教授的Dirichlet的鼓励和帮助。这篇论文于1854年提交给哥廷根大学教员。
Riemann显然选择了一个具有挑战性的问题,因为它超越了Dirichlet的结果:也就是说,它涉及到考虑更一般的“任意函数”。因此,他不得不思考何时才能定义此类函数的定积分。Riemann也接受了Cauchy给出的积分定义:对于一个定义于 [a, b] 且有界的 函数 f ,如果“Cauchy-Riemann”和(sum)
(4.3.4) 。
(其中, 而
) 随着
趋近于 0 而趋近于一个唯一的极限值,则此函数在此区间上是可积的。根据定义,这个极限值就等于
。(译注:很多书上只称为 Riemann 和,而不称Cauchy-Riemann 和 )
Riemann提出了积分存在的一个重要的充要条件,这将在下面的4.5节中讨论。他利用这个条件证明了Dirichlet猜想的可积性条件实际上并非必要条件:一个函数可以比Dirichlet想象的更不连续,但仍然可以积;它可以在任何区间内拥有无穷多个间断点,无论区间多么小!正如他所观察到的,“由于这些函数从未考虑过,因此最好从一个具体的例子开始”。他给出的这个非凡的例子,其重要性远超他自己的想象。
为了构造他的例子,Riemann 从一个定义如下的函数 ∅(x) 开始:∅(x) = x – n (其中,n是最接近 x 的整数),对 ,有 ∅(x) = 0 。∅ 的函数图像如图 4.3.1 所示。有趣且也许并非完全巧合的是,∅(x) 恰好是 f (x) = x 在区间
上的 Fourier 级数。根据 Dirichlet 定理,这个级数对于所有 x 都收敛,并且当
时 ,这个级数 ∅(x)之和与 (4.3.3) 一致 。
----------------------------------图 4.3.1------------------------------------
基于 ∅ , Riemann 定了一个新的函数 ,设
。 现在,
在点
处是不连续的,且他的思想是将这些函数加到一起以便求得一个高度不连续的函数。因此,这个函数 f 定义为
(4.3.5) 。
该级数一致收敛,尽管这个概念在1854年并不广为人知(参见3.12节),Riemann也从未提出过它。他确实利用了一致收敛的一个推论,即为了推导出 f 在 的所有这些不间断点处不连续,他利用了推论
(4.3.6) 。
即,若 x 是形如 p/(2q) 的比率数(rational number),其中,p是奇数且p和q 没有公约数(common divisor),则
(4.3.7) 。
因此,f 在所有形如 p/(2q) 的点 x 处都是不连续的,而在任意区间上有无穷多个这样的点 x ,但 f 是有界的,并且正如 Riemann 证明的那样它们是可积的(1854a,第6条)。
Riemann的论文首次发表于1868年,这时他已英年早逝。可以想象,他的观点具有空前的普遍性,他提出的可积函数的惊人例子给数学家们留下了深刻的印象。在du Bois Reymond(1883年,第274页)看来,Riemann已经将积分的概念拓展到了极致;他的可积条件似乎是所能想象到的最普遍的条件。(另见Weierstrass在《Mittag Leffler》(1923b,第196页的评论。) 上述空前的例子有力地展现了Riemann积分的普遍性。似乎不可能以任何更普遍的方式构想有界函数的可积性和积分,因为如果Cauchy-Riemann和(4.3.4)不能趋近于唯一的极限值,那么讨论由其纵坐标确定的面积似乎就没有多大意义。Cauchy和Riemann的方法基于一种可以追溯到 Archimedes的传统(译注:指的是微分割和逼近法)。
尽管上述对Riemann积分理论的态度在19世纪盛行,但后来人们有了各种发现,这些发现,以事后诸葛亮的眼光来看——也就是说,从Lebesgue著作的角度来看——可以视为揭示了Riemann理论的严重缺陷,这些缺陷表明,尽管表面上如此,Riemann的可积条件并不够普遍。下一节将概述发现的其中一些缺陷。
4.4 Riemann积分的缺陷(Defects of the Riemann integral)
Cauchy,Dirichlet和Riemann对积分学基础的讨论,只是19世纪人们对数学分析基础日益关注、研究方法也随之改变的一个方面。在另一方面,他们对那些视为理所当然的假设,或那些无法用与新分析方法相兼容的推理标准证明的假设,采取了更为批判的态度。Weierstrass关于连续无处可微函数的例子(见3.13节)就体现了这种批判态度。他的例子表明,人们普遍认为连续函数除了少数例外情况外,一般情况下是可微的,但这种观点并不能严格成立。我们将会看到,批判性分析方法也提供了一些函数的例子,这些例子表明,Riemann对可积性的定义并不像人们所希望的那样具有普遍性。
第一部综合了新分析方法成果的论文是Dini的《实变函数论基础》(Fondamenti per la teorica delle funzioni di variabili reali)(1878a)。Dini自然而然地在他的论文中突出地提到了Riemann的积分理论。Dini提出的成果之一是Gaston Darboux提出的以下定理(1875a, 第111-112页);若一个函数 f 有界,且在闭区间 [a, b] 上具有 Riemann 可积导数 ,则对于所有 x∈[a, b] ,有
(4.4.1) 。
Cauchy根据他的积分理论,建立了(4.4.1)的连续导数版本。Darboux的推广是Riemann观点的重大胜利,因为其推广结果表明,后者弱得多的可积条件也足以建立微积分的基本关系(4.4.1)。
然而,Dini却察觉到了Darboux定理中一个不那么令人信服的含义。他注意到,对于函数 f ,若在每一个区间中,不管这个区间如何小,都存在其导数 的点 t ,则要么 f (t) 是常量,要么
在 Riemann 积分的意义上不可积(译注:这一句话跳跃有点大,哪些非常量函数导数为0但按Riemann积分不可积?这一点没有举例非常不好理解,这也是为什么会出现 Lebesgue积分的原因)。Darboux定理表明,以上两点是唯一的选择。因为,若
拥有上述属性且有界,则对于每一个 x∈[a, b] ,有
: 在定义这个积分的 Cauchy-Riemann 和
(4.4.2)
的时候,可以选择 使得
;因此,这些和唯一地趋近于唯一极限的情况是,该极限为零。因此,根据 Darboux 定理,如果
可积 ,则
(4.4.3) 。
这意味着对于 x∈[ a, b ] ,有 f (x) = f (a) 。
Dini认为,非常有可能存在具有上述性质的非常量函数,使得 (在Riemann积分的意义上)不可积(1878a,第100条)。Vito Volterra在1881b年提供了一个证实迪Dini猜想的例子。他构造了一个非常量函数 f 的例子,该函数具有一个有界导数
,该导数在稠密的点集上为零。该例子表明,在Riemann积分理论的背景下,微分和积分的基本运算并非完全可逆;微分过程可能会产生有界函数
,这些函数
在 Riemann 积分的意义上不可积,因此(4.4.1) 对其毫无意义。(译注:即有些可以微分的函数,在 Riemann 积分的意义其是不可积的。)
Volterra 指出,他的例子 f 表明,至少在某些情况下,通过反微分法(anti-differentiation)进行积分的方法更具有普遍性,因为 f 具有反导数(anti-derivative),因此它在 [a, b] 上的积分可以表示为 f (b) - f (a)。他并非有意将自己的观察结果作为对Riemann积分方法的严肃批评,而是立即补充说,Riemann积分方法优于反导数方法,因为它至少提供了函数可积的充要条件。当时,Riemann理论是最令人满意的替代方案,而且,正如上一节末尾所述,更普遍的替代方案似乎是不可能的。
Dini预测的函数的其他例子在19世纪后期被发现。瑞典数学家T. Broden在1896年给出的例子尤其有趣,因为它使用了Riemann设计的“奇点凝聚(condensation of singularities)”(Hankel术语;参见3.13节)同样的技巧,用来说明他的可积条件的普遍性。Brodén的例子表明它不够普遍,尽管他本人并没有得出这个结论。Brodén 从函数 ( x∈[-1 ,1] )开始 。在 x = 0 处 ∅ 的图像一条垂直切线,因此,
。对于 x 的所有其它任一个值,
以有一个限值的形式存在。令
为一个稠密集,并定义
(4.4.4) 。
因此,对于所有 x∈[-1 ,1] 导数 存在,但对于
有
。在 [-1 ,1] 上定义 f 为
(4.4.5) 。
类比于Riemann函数的构造即可清楚其意义。此外,对于所有 x∈[-1 ,1] 还有
(4.4.6) ,
这意味着对于所有 x , , 从而使得 (4.4.6) 的右边无穷大。特别是当 n = 1, 2 , 3 ,… 时,
,因此 f 的图像在其图上的一组稠密集点处具有垂直切线。
不难看出,函数 f 是严格递增的,因为这个特生对于 ∅ 成立,从而对于所有 也成立。因此, 函数 f 拥有一个定义于
的连续的逆函数
。从 f 和 g 的图像的几何关系很容易看出,后者在密集的点集处具有水平切线。在分析上来描述,这个结果是
,其中 y = f (x) ,从而
(n = 1, 2 , 3 ,…) ,而
。此外,通过简单验证即可证明,对于 x∈[-1 ,1],
在远离 0 的地方是有界的,从而
也是有界的。由于
在一个稠密集
上消没且也是严格递增的(从而并非一个常量),因此,根据 Dini 观察结果,
一定不是可积的。(译注:此处介绍跳跃太大,没有过度直接跳到稠密集了,不好理解。)
上述例子是Brodén指出的一类相似函数的一个特例。它们对他的意义而言并非在于它们揭示了Riemann积分理论的局限性:他从未提及Dini的观察,或许也并未意识到这一点。对于他和其他设计出具有稠密分布水平切线性质的曲线例子的人来说,这些例子延续了Weierstrass关于连续但无处可微函数的例子所开创的趋势。Weierstrass的函数并非直观的;但Brodén等人的例子表明,即使是处处可微的函数也可能是不可直观的。它们进一步证实了Weierstrass的论点,即在建立数学分析的基本原理时,是不可依赖直觉的。
函数的导数是通过极限过程得到的,上述例子表明(对我们这些后Lebesgue时代的人来说),Riemann理论的上述缺陷源于Riemann意义上的可积性在求极限过程中不成立(译注:函数必须有界,极限是唯一的,对于完全不连续的函数没有办法按Riemann的方法进行区间的划分,也无法计算矩形的面积)。这一事实在19世纪也以另一种方式显现出来。我们在上文4.2节中看到,Fourier做出了一个普遍接受的假设,即若对于所有 ,
,则
(4.4.7)
或
。
事实上,Cauchy在其《总结》(Résumé)(1823a)第40课中,在假设 连续的条件下,已经给出了(4.4.7)式的证明,但由于他未能区分一致和非一致收敛及连续,因此该证明并不充分。在柏林的讲座中,Weierstrass证明,只要假设收敛是一致的,(4.4.7)式就是成立的(参见Heine 1810a,第353页)。
Darboux 在 1875a 证明了同样的结果,他还给出了一个简单的例子,说明当收敛性不一致时,(4.4.7) 不一定成立 (1875a 年,第77-84页)。他考虑了函数序列
(4.4.8) 。
对于每一个 x∈[0, 1] , ,从而
,但
(4.4.9) ,
因此, 。他通过指出
,证明了函数序列
在 [0, 1] 上并不一致收敛。事实上,这表明这个函数序列不是一致有界的。对于一个[a ,b] 上的函数序列,若存在一个正整数B,使得对于任意 x∈[a , b] 和任意 n 都有
,则称此函数序列是一致有界的。
Darboux撰写论文时,一致有界性的概念尚未引入,他显然未能意识到其潜在的重要性。他和当时的其他数学家对一致收敛重要性的发现印象深刻,以至于忽略了在更一般的条件下断言(4.4.7)的可能性。
这种疏忽是必然的,因为它掩盖了Riemann可积性在求极限过程中不成立的事实。也就是说,如果 在 [a > b] 上一致收敛于 f (x) 且
是Riemann可积的,则 f 也Riemann可积的,正如Darboux所证明的。但 Cesare Arzela (1885a) 和 W. F. Osgood (1897a) 发现,一致有界性是 (4.4.7) 成立的必要条件。例如,Arzela 证明,如果假设
和 f 均是 Riemann可积的,且
一致有界,则 (4.4.7) 成立。因此,给定一个收敛的,一致有界的可积函数序列
,(4.4.7) 成立的唯一进一步条件是极限函数是Riemann可积的。
Arzela没有给出不可积极限函数的例子,但 Rene Baire 在 1899a 年无意中提供了一个非常简单的例子。他考虑了定义于 [0, 1] 上的函数序列 ,其定义如下:如果 x 为比率数(rational number) p/q,且 p 和 q 没有共同因数 ( q ≤ n),则令
,对于所有其他 x∈[0, 1],则
。因此,除了在 [0, 1] 中的有限个点,每一个函数
都为零。因此,每一个函数序列都是可积的,并且
, 所以它们也是一致有界的。不难看出,对于所有x∈[0, 1],
存在,且若 x 是比率数(rational),f (x) = 1 ,而若 x 是非比数(irrational)则 f (x) = 0 ,因此,这个极限函数 f 是 Dirichlet提出的不可积函数的例子之一(参见上文 4.3 节),而且它确实在Riemann意义上不可积。(译注:因此在区间上极限不唯一,而是在 0 和 1之间切换,在 Riemann积分的意义上不可积。)
Lebesgue在推广Riemann积分时,证明了(4.4.7)对任何一致有界收敛的序列都成立;在Lebesgue积分的意义上,极限函数的可积性源于它本身就是一个极限函数。因此,就Lebesgue的发现而言,Riemann理论的普遍性被揭示为不够;但在这些发现之前,没有人认为,这样的极限函数不必是Riemann可积的,因为这样会严重阻碍Riemann的积分方法。例如,Baire在举例时并未提及积分理论。他举这个例子是为了证明 Dirichlet函数属于第二类 Lebesgue类——即,一个函数序列的极限其本身又是连续函数序列的极限(参见3.13节)。Riemann的积分理论看似是最普遍的理论,为何还要批评它在上述方面不够普遍呢?然而,到了19世纪末,Riemann的理论已经根据集合及其测度进行了重新表述。这一重新表述提供了新的视角,根据这个理念,进行非常自然的推广是可能的。
4.5 关于积分的测度论公式(Towards a measure-theoretic formulation of the integral)
首先,我将简要说明集合的测度与函数积分之间的联系。令 E 表示 [a ,b] 的一个子集。两个数 和
分别称为 E 的内容(inner content)和外容(inner content),并按如下方式定义:令
表示 [a ,b ] 的分为
的一个分割 P ,则
(4.5.1) ,
,
(其中, 表示
的长度。 ) 换言之,内容 E 可以这样获得,对于一个分割 P ,考虑那些完全包含于 E 中的分割构成的集合;而对于外容,考虑包含 E 点的所有区间构成的集合。显然
(4.5.2) ,
因此,
(4.5.3) 。
若 ,则集合 E 定义为在 Jordan 测度的意义上可测,在这种情况其容度(content)用 c(E) 表示。
这些概念由Camille Jordan于1892a 中提出,其原因将在下文讨论。他利用这些概念证明了Riemann可积性条件可以按如下形式重新表述。令 表示 [a ,b] 的分为脱离(不相交)可测集
的一个分割 P ( 脱离集表示为
,i ≠ j )。则与分割 P 对应的有界函数 f 的(广义(generalised))下 Riemann 和与上Riemann 和分别定义为
(4.5.4) 和
,
其中 , 和
分别表示数 f (x) 对于
的最大下确界(inf)和最小上确界(sup)。则下 Riemann积分和上Riemann 积分分别定义为
(4.5.4) 和
,
则当且仅当
(4.5.5)
时 f 是 Riemann可积的 。
Riemann可积性的上下积分刻画是在Riemann的《资格论文》(Habilitations-schrift)于1868年(Riemann去世后)出版后不久提出的,它源于Riemann本人提出的可积性的一个充要条件。然而,在Jordan之前,上述概念的发展并没有测度论的概念:上下Riemann和L(P ) 和U(P ) 仅仅是针对 [a ,b] 划分为子区间P 而定义的。通过证明更一般类型的分割P 在定义中是可得到的,Jordan无意中为推广Riemann积分理论提供了一种富有成效的思路。他对Riemann可积性的测度论刻画暗示着,推广他的集合测度理论将带来积分的推广。
假设可以定义一个更大的可测集类 M ,以及一个与 M 中的每一个子集 E 相关的数 m( E ) ,使得若 E 在 Jordan 测度的意义上可测,则就有 m( E ) = c(E) 。则Jordan 对Riemann可积性的刻画立即引出了以下的推广(generalisation)。根据上述 P的定义,L(P ) 和U(P ) 允许集合 在广义上可测——即,属于 M 。按这样导致的下界积分
和上界积分
则满足
(4.5.7) 。
因此,当
(4.5.8)
时f 可积,且这个公值视为 f 的积分。(4.5.7)表明每一个 Riemann 可积函数仍然是可积的,因此我们获得了 Riemann 积分的一个推广。当 M 是 [a ,b] 的 Lebesgue 可测子集类时,这个推广的可积函数类就是有界 Lebesgue 可测函数类。正是基于这样的考虑,Lebesgue提出了他的积分理论。(译注:这一步跨度有点大,直接就跳到Lebesgue 可测集的介绍了,中间似乎没有过度,不太好理解。)
既然测度论思想引入的历史意义已经清晰,我们必须思考它是如何以及为何发生的。Riemann的三角级数《资格论文》(Habilitations-schrift)于1868年出版时,没有人明确地讨论集合及其测度:这些概念尚未成为数学的一部分。但他为有界函数的可积性提供了以下充要条件:对于每一个 ε > 0 和 σ > 0 ,都存在一个 δ > 0 ,使得若 P 是任意一个分割 ,且对于所有的 i ,
,则
,其中,
表示所有满足
的
之集合。( Riemann 1854a ,第 5 条;如上,
和
分别表示 f (x) 对于
中的所有 x 的最小的上确界和最大的下确界。) 他引入这个条件以证明他的高度间断的函数 (4.3.5) 也是可积的例子。这个间断函数是跳跃式间断的,因为左右极限 f (x ±0) 在所有间隔点处都存在。此外,存在至多有限个这样的点 x∈[a ,b] ,即在这些点处跳跃的大小
在于一个已知的 σ 。使用 f 的这个属性 ,Riemann 证明了对于
足够小的所有的 P ,S(P , σ ) < ε 。
在1870a中,曾在哥廷根(Göttingen)师从Riemann的Hankel取得了一项重要进展(参见3.13节)。他试图设计一个可积性的充要条件,该条件能够直接应用于Riemann函数,这得益于上文提到的跳跃间断性。因此,他将注意力集中在集合上,即跳跃大于正数σ 的点x的集合。Hankel意识到,一般而言,函数在间断点x处不必具有单侧极限f (x ± 0),因此他引入了函数f 在x处跳跃的广义定义(1870a,第7条)。他的定义类似于更为熟悉的 f 在 x 处的振荡 的概念,其定义如下:对于 δ > 0 ,令
,且
,其中,M(δ) 和m(δ) 分别是成员 f (t) 对
最小上确界和最大下确界。则
。一个函数 f 当
时其在 x 处恰好是连续的。
Hankel将注意力集中在满足 的点 x∈[ a , b ] 的集合
上(当然,他的定义稍有不同于
)。此外,他清楚地认识到,有界 f 可积当且仅当对于每个 σ > 0,集合
可以被有限个总长度任意小的区间包围。这一事实的证明只需对Riemann的证明进行简单的推广即可,即函数 (4.3.5) 满足他的可积性准则。鉴于Hankel对可积性刻画的认识,我们很自然地认为,Hankel 的工作不仅开创了积分理论的集合论方法,也开创了测度论方法。在事后看来,这似乎是对标准的一个小的附加步骤,即对于 [a ,b] 上的一个函数 f ,当且仅当对于所有 σ > 0 有
时,此函数是一个 Riemann可积函数。但测度论概念和这个标准直到 19 世纪 80 年代才被引入。
因此,问题来了:为什么这种情况花了这么长时间才发生?历史问题通常没有简单、无可辩驳的答案;历史太复杂——也太有趣——以至于不可能有这样的答案。然而,历史学家可以分离出某些条件或因素来解释所讨论的历史现象。就测度论观点的缓慢引入而言,我认为,关于可忽略集(a negligible set)的测度论和拓扑刻画的混淆,发挥了重要的、或许是决定性的作用。
这种混淆在以下Hankel 认为已经证明的非常漂亮但错误的定理中显而易见:对于一个有界函数 f ,当且仅当对于每一个 σ > 0 集合 处处不稠密时,此函数可积 (1870a, 第 7 条)。也就是说,集合
必须具有Dirichlet 先前引入的属性:任意两点之间都存在一个不含
点的整个区间。Hankel将这样的集合称为“散度(scattered)”。他熟悉Dirichlet的 1829a,事实上他似乎已经证实了Dirichlet 的说法,即对于任何有界函数,只要其不连续点集 D 形成处处稠密集,就可以定义积分。也就是说,对于所有 σ > 0,
都是 D 的子集,因此,如果 D 处处不稠密,则集合
也是处处不稠密的。根据Hankel “定理” f 是可积的。
Hankel的“定理”仅有一半是对的。若 f 是可积的,则对于所有 σ > 0, ,这意味着 对于所有 σ > 0,
无处稠密。 ( 若
在某个区间 I 上是稠密的,则
。) 逆定理是不正确的。为了证明这一点,他认为他已经证明了一个无处稠密集可以被有限个总长度任意小的区间所包围。在他的证明被发现无效之前,他似乎已经获得了对应于可积函数的集合
的一个非常好的拓扑刻画(我们现在可以这样描述它) ——这个刻画直接证实了 Dirichlet 关于可积条件的推测。因此,只要人们没有意识到拓扑可忽略性(无处稠密)和测度论可忽略性(零外容)并不等价,就没有必要发展这些集合的测度论刻画。这种不等价性在一段时间内未被注意到的原因并不难找:在19世纪70年代,点集理论尚未研究出来(参见第五章)。涉及无限点集的推理,即使真的发生,也停留在非常幼稚、粗心的层面。包括 Hankel在内的任何人都没有完全理解诸如无处稠密集之类的形式定义的逻辑含义。
Cantor关于点集的第一篇出版物(1872a)实际上加剧了这种混乱。他对三角级数表示唯一性的研究,促使他考虑了具有后述属性的这样的集合E ,即第n个导出集(不妨设为 ) 对于某个整数 n 是有限的。集合
定义如下:第一个导出集(记为
) 是 E的极限点的集合,通常
(见 5.2 节) 。 使得
有限的这样的集合 E 的一个简单例子是形如
(4.5.9)
的所有数的集合,其中 表示正整数。在这种情况下
。按照Cantor后来的术语,我们将这类集合称为“第一物种(species)集合”。Cantor发现,某些适用于有限集的性质,通过归纳推理,可以推广到第一物种集合。这样,很容易看出,第一物种集合是无处稠密的,并且,它们可以封闭在有限个任意小的区间中。因此,对于这些集合,拓扑和测度论的可忽略性刻画都成立。一些对积分理论感兴趣的数学家倾向于认为,第一物种集合是唯一可能存在的无处稠密集。因此,无处稠密集(作为(qua)第一物种集合)在测度论上是可忽略的。
直到19世纪80年代初,人们才意识到,在测度论意义上可忽略的集合对于积分理论的特殊重要性。当时人们清楚地认识到,存在着不能被任意小的总长度区间封闭的无处稠密集。这一发现的影响是直接而决定性的。人们为这种可以封闭的特殊类型的无处稠密集引入了专门的名称;Cantor提出了一个问题,即寻找无处稠密集必须具备的条件,才能使容量(content)为零。此后不久,Cantor(1884a,第18条)和Stolz(1884a)分别迈出了显而易见的下一步,引入了集合(外)容的概念。因此,由于发现了具有正外容的无处稠密集,第一个测度理论终于在1884年诞生。数学家们终于开始用测度论的术语来思考问题了。
鉴于发现具有正外容的无处稠密集的历史重要性,我将简要说明它们是如何发现的。几位数学家似乎各自独立地发现了它们,(注:见Smith 1875a ;Volterra 1881a ;du Bois Reymond 1880a 和 1882a ,第 188-189页;以及 Cantor 1884a ,第18条)但它们各种构造背后的基本思想是相同的。在寻求构想最普遍的无处稠密集时,数学家们此前曾采用归纳法。首先,设一个有限集 是无处稠密的。若加入覆盖
的每一个元素的点序列,则导致的集合
仍然是无处稠密的。现在加入覆盖
的每一个元素的点序列,则导致的集合
仍然是无处稠密的,如此等等。通过这种方式,我们可以构想出越来越复杂的无处稠密集。然而,他们都是第一物种集,因为
是一个有限集。正外容的无处稠密集之结构背后的思想是贡献区间而不是点。即,若一个脱离(不相交)区间序列
可以稠密地分布于 [a ,b] ,即 [a ,b] 的每一个子区间都包含一个
,则
无处稠密。此外,若
,则
。
这种无处稠密集的发现实际上对积分理论的历史具有双重意义,因为这些集合也被Volterra用来构造有界导数的例子,这些导数函数不是Riemann可积的(见上文4.4节)。Volterra很可能从Dini关于此类导数存在的推测中获得了构造这些集合的灵感。尽管Dini无法构造出一个例子,但他推测非常量(但不可Riemann可积)函数f 存在,其性质为:在任何一对数r < s之间,都存在一个区间,在该区间f 保持不变,使得 。这些恒定区间在[a, b]中稠密分布。若它们视为开集并用
表示,则
无处稠密。此外,
。原因在于,若
对于所有的 x都存在且有界,则根据 Dini的微积分基本定理 (4.4.1) ,它不可能在 [a, b] 上(Riemann)可积。因此,
的断点点集 D 一定会使得
。(否则,根据 Hankel “定理”的正确部分 ,
就会是(Riemann)可积的。 ) 但 D ⊄ E ,因此
。
尽管Dini本人未能意识到这一点,但他的假设函数与测度上不可忽略的无处稠密集的存在密切相关。
测度论的观点最终在19世纪80年代中期成为Riemann积分理论的一部分,并在1892年由Camille Jordan正式表述。正如本节开头所述,Jordan引入了内容和外容之间的区别,以及可测集这一重要概念。他的研究动机是他对Riemann积分理论在二元或多元函数方面的发展方式感到不满。函数 f (x, y) 的积分通常定义在平面区域E上,该区域视为由一条曲线所界定(见图4.5.1)。
-------------------------------------图 4.5.1--------------------------------
为了定义下Riemann和,上Riemann和,或者说Cauchy-Riemann和,我们考虑将平面划分为由平行于坐标轴的直线构成的矩形。这种划分将 E 划分成多个部分,其中大部分是矩形。然而,与边界曲线相交的矩形也有例外。
因此,在定义诸如对应于分割的Cauchy-Riemann和时,会出现一定程度的模糊性或任意性。Cauchy-Riemann和可以定义为
(4.5.10) ,
其中,要么 (1) 和在所有位于 E 中的矩形 上进行计算,要么 (2) 和在所有位于只包括 E 的点的矩形
上进行计算。(不能使用非矩形边碎片(pieces),因为这些碎片的面积未定义。) 为了证明(justify)
基于(1)或(2)选择的定义,通常需要注意到接触边界的这部分的面积之和可以设置得任意小。Jordan本人在其《分析教程》(Cours d' analyse)(1883a)第一版中也曾以这种方式进行研究。然而,在1890a中,Peano证明,不能理所当然地假设,边界矩形可以通过构造一条经过正方形0 ≤ x ≤ 1, 0 ≤ y ≤ 1中每一个点的连续曲线来实现。
或许是Peano的空间填充曲线促使Jordan放弃了将E视为曲线界定域的惯例。相反,他在1892a 中提出的积分域E ,其处理方法与Riemann赋予被积函数的一般性相同。这意味着将E视为一个点集,即从Cantor集合论的一般立场来处理E 。E 以曲线为界的要求被E可测的要求所取代。 和
的定义(4.5.1),以及由此而来的可测性,直接扩展到平面上的点;划分区间只需划分矩形即可。) Jordan将E的边界定义为满足这样的条件的所有点p的集合,即使得每一个关于点集p的圆盘(circular disc)都包含E中的点和包含E以外的点。他证明了当且仅当E的边界具有零个外容的时候E可测。因此,E 的可测性正是关于积分域边界曲线的假设有效性所需要的。
在引入了可测集的概念之后,Jordan继续定义沿着本节开头勾勒的线条的可测 E 的积分 。由于 E 是任意可测集,因此自然而然地可以考虑将其划分为任意可测集
。Jordan 针对 n 元函数发展了Riemann 积分理论的公式。其形式源于 n = 2 的情况,但该方法适用于任何 n ,包括 n = 1 和 E = [a , b ] ,从而将推广积分的可能性与推广测度和可测性的可能性联系起来。
正是在这种测度论的环境中,胸怀大志的年轻法国数学家们学习了Riemann的积分理论,而约当Jordan则将这种方法融入了他的《分析教程》(Cours d' analyse) (1893a)第二版。此前,法国人对Cantor集合论在分析中的应用关注甚少。Jordan通过他的《分析教程》实际上对集合论分析方法给予了认可,而且由于他是法国杰出的、享有盛誉的数学家之一,他对这种方法的默许并非毫无意义。在第二版出版后的几年内,三位年轻的法国数学家——Emile Borel,René Baire和 Henry Lebesgue——对集合论分析方法进行了广泛的研究。
4.6 可数集之测度是多少?(What is the measure of a countable set ?)
Lebesgue非常贴切地将Jordan描述为一位“传统主义的创新者”(1926a, lxi)。Jordan对积分理论的重新表述无疑具有创新性;他将集合论方法应用于积分,比他的前辈们走得更远。然而,他继承了他们所确立的传统。他只是通过引入内容和可测性的概念,精炼了外容的概念。由此产生的测度理论与Riemann的积分方法完全兼容。事实上,内容、外容和可测性与下Riemann积分、上Riemann积分以及Riemann可积性完全类似。Jordan的积分方法,只有在人们认识到存在一种不同的、不那么传统的集合测度方法的可能性之后,才变得具有启发性。这种可能性是由Emile Borel发现的。Borel提出的集合测度的截然不同的方法源于他对这个问题的非正统回答:可数集的测度是什么?
这个问题最早是由Axel Harnack考虑的,他是参与发展和阐述 Riemann 积分理论及其相关外容理论的几位德国数学家之一。(德国数学家们简单地提到“容量(content)”,他们指的是约当所说的“外容”。) 在1885a中,Harnack观察到,如果在外容的定义中去掉对有限个覆盖区间的限制,就会产生一个显著的、自相矛盾的结果:每一个可数集 都会有零外容。原因在于,任给一个 ε > 0 ,每一个
都可以封闭于一个长度为
的区间
中 , 这些区间的总长度是
。因此,如果允许无限数量的这样的区间,则可数集总是可以包含于任意小的总长度的区间内。
对Harnack来说,这些观察结果的含义显而易见。它们揭示了在外容定义中,将覆盖区间限制在有限个数至关重要。可数集应该具有零容量的思想在他看来似乎自相矛盾,因为可数集可以是稠密的。例如,[0, 1] 中比率数集 E 是可数且稠密的。因为它是稠密的,所以 ,而不是 0 。由于 E 的普遍性,这似乎是 E 的适当测度。将稠密集视为无延拓的,如同可忽略测度一样,似乎是荒谬的。
Cantor引入了可数集的概念,他当然也认同Harnack的观点。他自己也引入了集合的外容作为其测度,他的公式清楚地表明,在度量一个集合E时 ,其极限点集 应视为 E 的一部分。即,Cantor 将一个集合 E 的外容定义为
(因为
,因此定义相同。 ) 因此,测度 [0 ,1] 中的比率数(rational)点的集合 E 就是测度
。同时,Cantor 对无限点集的研究的其他结果表明,至少在某些方面,可数集是可以忽略不计的。
其中一个结果被证明尤为重要。它包含在 Cantor 的1882a 中,这是 Cantor 的《无限线性点集》(Über unendliche, lineare Punktmannichfaltigkeiten)的第三部分。为了与标题(“论无限线性点集”)保持一致,前两部分都致力于实线的子集。Cantor 的主要目标是证明连续统(continnum)(译注:连续统一体)假设(参见 5.4 节)。然而,在第三部分中,他决定指出他的工作与数学界目前广泛关注的数学领域的相关性:复变函数论和几何基础。为此,他转向考虑 n 维空间中的点集。在提出一个他认为与复变函数论相关的定理之后,他继续提出了一些他认为对几何基础有影响的观察结果。
Cantor 在 n 维空间 的背景下做出这样的观察,但我将考虑平面
这种特殊情况。他注意到,若 M 是平面
的一个可数紧致子集,则
(即从平面中删除掉 M 之后的部分)仍然是“连续连通的”。即若
,则存在一条完全包含于 U 中的将
和
连接起来的连续曲线。证明思想如下:考虑如图 4.6.1 中所示的线段
及其垂直平分线。
---------------------------------图 4.6.1--------------------------------------
垂直平分线上的每一个点 p 确定一个连接 和
的圆弧。由于这些弧仅与
和
相交,因此它们与 M 相交于不同的集合。因为是 M 可数的,因此与 M 相交的圆弧数至多可数。假设
位于这些弧的中心。由于在 1874a 中 Cantor 已经证明,位于平 分线上的任意区
都包含一个不可数点数的集合。使得对于任意
,
,从而由 p 确定的圆弧不与 M 相交——其完全位于
。
Cantor认为上述观察结果与物理世界的几何本质问题相关,而这一主题已由Hermann von Helmholtz 在科学界推广开来。大多数关注几何基础的数学家都追随Riemann在1854b的著作中的脚步,将空间等同于所有实数三元组(x ,y ,z)的流形(manifold)。Cantor认为,他的观察表明,将空间等同于 并不能得到空间中连续运动可能存在这一事实的支持。连续运动在
中同样可能存在,其中M是可数的且稠密的。因此,他提出了发展一种适用于
的力学方法的价值。
Cantor的言论并没有引起对几何基础感兴趣的数学家们的回应,但却给 Emile Borel留下了深刻的印象,他发现这些言论中蕴含着一个可以用于复变函数理论的思想!在Jordan之前,唯一一位将Cantor集合论应用于分析的法国数学家是 Henri Poincaré。在1883a 中 ,Poincaré 考虑了以下解析表达式
(4.6.1) ,
其中, ,z 和
是复数且
。他注意到,若 C 是平面中的一个简单闭合凸曲线,且若
是 C 的一个稠密子集,则表达式 f (z) 定义了两个不同的解析函数,一个定义于 C 内,另一个定义于 C 外。原因在于,f (z) 关于 C 内任意点
的幂级数展开式在一个与C相交但不超过它的圆盘上收敛(见图 4.6.2):由 f (z) 定义的解析函数在 Weierstrass 解析函数的意义上在整个 C 上不可能是解析连续的。(注:若变量 z 的两个函数
和
分别解析地定义于
和
上 , 且若在
上
(且若
是
在
上的这样一个延拓)。)
--------------------------------图 4.6.2---------------------------------------
在1894a 中,Borel在他的博士论文中采用了Cantor的思想,表明这两个函数可以相互关联,从而提供一种广义类型的解析连续性。通过将 Cantor 的观察结果应用于可数集 ,他总结道,存在至多可数点的数量
,使得从
到
的圆弧与 C 相交于点
之一(见图 4.6.2)。然而,Borel 的问题要求证明级数 f (z) 在从
到
的圆弧上绝对且一致地收敛。这促使他对 Cantor 的观察结果进行了新的诠释,使其与可数集的测度更加相关。
在假设 下,Borel 选择一个 N 使得
小于
的长度的一半。然后他应用 Harnack 的思想:将每一个
(n ≥ N ) 封闭于一个长为
的区间
中。则这些长度之和是
,其长度小于
的长度。然后,Borel推导出在
上存在不可数多个 p ,使得
, 且
( n ≥ N ) 。(注:证明涉及“一个本身就很有趣的定理……”:如果一条线上有无穷多个子区间[即闭区间],使得该线上的每一个点都位于至少一个子区间的内部,那么可以有效地确定有限个具有相同性质的区间。这里我们得到了所谓的“Heine-Borel定理”的第一个表述(见第 3.12 节)。) 在与这些点 p 对应的圆弧上,级数 f (z) 一致收敛,并具有其他性质,这些性质在某种意义上表明 z 点内外的函数是相同的。因此,奇点
(尽管在 C 上稠密分布)并不阻止级数
在 C 的不可数多个点处收敛。即 C 与从
到
的“好”弧的交点处收敛。这个结果无疑鼓励了 Borel 进一步研究这个级数的收敛点集的性质,并在此基础上发展了上述关于如何度量可数集的思想。
在1896-1897学年期间,Borel有幸在母校巴黎高等师范学院就他的新成果举办了一系列讲座。Lebesgue很可能也听过这些讲座,因为他从1894年到1897年在那里学习。由于讲座反响热烈,这些讲座于1898年出版成书,名为《函数论教程》(Legons sur la Théory des Fonctions ,1898a)。
为了在最简单的情况下说明他的方法,Borel 首先考虑了 (4.6.1) 式中级数 f (z) 绝对值的实变量类似对象,即 , 其中
,
,且
是 [0,1] 的一个稠密子集,为了研究这个级数的收敛点,他的研究进展与这篇论文大致相同。每一个点
都封闭于一个区间
,其中
。若
,则对于
,
,有
或者等价地有
(4.6.2) (对于所有的 n)。
此外,若 且若 D 表示级数的非收敛点集,则 D ⊂ B ,因此通过使k 适当大, D 可以封闭于任意小总长度的区间
中。
这些结果,以及类似复值级数的许多其他引人入胜的结果,占据了Borel著作的后半部分。前半部分致力于发展集合论和测度论的概念,以便以他认为合适的方式表述后半部分的结果。在这方面,容量(content)理论并没有起到什么作用。由于 是 [0,1] 的一个稠密子集且
,D 和收敛点集 [0,1] - D 均具有外内 1 和内容 0 。它们在容量上无法区分,也无法度量。因此,Borel认为引入一种测度理论来区分D和([0,1] – D )是合适的,前者的测度为0,后者的测度为1。
Borel将注意力集中在 [0, 1] 的子集上,因此提出了以下测度和可测性的定义 (1898a ,第46-48页 ):
“当一个集合由可数无穷多个区间内的所有点组成,这些区间不重叠,且总长度为 s 时,我们称该集合的测度为 s 。当两个集合没有共点,且它们的测度分别为 s 和 时,将它们合并得到的集合,也就是它们的和,测度为
;
更一般地,如果有可数无穷多个集合,它们两两之间没有共点,并且具有测度 ,它们的和具有测度
。
所有这些都是测度定义的结果。现在给出一些新的定义:如果集合 E 的测度为 s,且包含集合 中所有测度为
的点,则集合
…… 将称测度为
…… 。
凡能根据前述定义来定义测度的集合,我们称之为可测集…… ”
Borel没有提供进一步的阐述或澄清。他的话语听起来更像是一个谜,而不是一个定义,尽管熟悉现代实分析的读者应该很容易就能察觉到Borel集的概念。(注:对 Borel来说,Borel集是这样的:它是一个 Borel可测集,通过在区间(或已构造的 Borel集)上进行可数次并集和交集运算而构造。Borel并没有使用“Borel集”这个短语,后来一些关于该概念的定义比这个要宽泛得多。)
Borel定义的本质反映了他后来明确表达的一种哲学态度:他的可测集是通过“反复”应用集合并和差运算,从区间构造而来的。Jordan的可测集并非以这种方式“从头开始”定义的,因此Borel认为Jordan的定义比他自己的定义更具普遍性。Borel认为,这两种截然不同的定义反映了它们所适用的完全不同的问题;他显然没有设想过将他的测度思想应用于积分理论。
Borel在定义上遇到了一个小难题。他的级数中不收敛点集 D 是测度为零的Borel可测集 B 的一个子集。但根据Borel的分析,并不能得出 D 是Borel可测集的结论。因此,他不得不采用以下约定。如果集合 E 夹在测度为 a 和 b 的Borel可测集之间,我们一致认为 E 的测度为 a 和 b,而不必担心 E 是否可测。集合 D 当然夹在测度为零的空集和集合 B 之间。因此,根据Borel的约定,D 被指定为测度为零;他可以得出结论,他的级数在 [0, 1] 的所有点处收敛,除了测度为零的集合。
对于哲学顾虑较少的人来说,对Borel约定的自然反应是:为什么不简单地模仿容量理论,定义一个集合,如果它可以被可数个任意小的区间包围,则测度为零?那么,D 的测度就自动为零!这正是Lebesgue为了推广Jordan的可测性和测度概念所做的。事实上,正如Lebesgue在1902a中第241页指出的那样,根据Borel约定被赋予确定测度的集合——也就是说,夹在两个具有相同测度的Borel集之间的集合——正是Lebesgue可测集。换句话说,隐藏在Borel约定中,或多或少作为必要之恶而引入的,正是Lebesgue的可测集。最有趣的是,非收敛点集D实际上是一个Borel可测集。Borel的暗示性约定实在是没有必要!
一旦 Borel 提出了关于集合测度的新颖思想,其他数学家最终不可避免地会将它们与 Jordan 的方法结合起来,产生Lebesgue 测度理论。对于子集 E⊂[0, 1] ,Lebesgue 在他的 1902a 的博士论文中进行了如下研究。令 和 表示所有数
最大下界, 其中
。这是
的惯常定义,只是允许区间数为无限大。由于
( 其中
) ,因此内测度的类似定义为
。根据这些定义不难推出
(4.6.4) 。
Lebesgue 可测集 E 是使得 的那些集合,且上述不等式表明,每一个 Jordan 可测集都是一个 Lebesgue 可测集,且对于这样的集合有 c( E ) = m( E ) 。因此,Lebesgue 测度论是 Jordan 测度论的一个推广,此外,Lebesgue 可测集具有Borel在其定义中提出的性质。例如,若
且
是Lebesgue 可测集,并满足
,则 E 是可测的,且
。
测度和可测性的等价定义是由G. Vitali (1904a) 和 W. H. Young (1905a) 独立提出的。或许,新的测度论最初并没有吸引很多数学家,尤其是那些在19世纪七八十年代还很年轻的时候,Riemann的积分理论似乎代表着终极普遍性和未来的潮流的数学家。我提到的“代沟(generation gap)”在Arthur Schönflies对Borel著作的论述中显而易见。1875年,也就是Vitali和Lebesgue出生的那一年,Schönflies 22岁。(Young比他大12岁,但他34岁才开始他的数学生涯。) Schönflies受德国数学家联盟的委托,撰写了一份关于集合论的报告。这份书本长度的报告发表于1900a中;这是第一篇关于点集理论及其应用的论文。
当Schönflies撰写关于集合测度的部分时,他指出,已经发展出的理论不止一种,而且与所有数学定义一样,测度的定义也带有一定主观性,必须根据其结果与其引入背后的目标的契合程度来判断。在这方面,Schönflies显然认为Borel的定义并不恰当。首先,集合E的容量与 E∪E' 的容量相同。Schönflies接受了这一内容性质的合理性,并指出Borel的测度不具备这一性质。稠密集可以具有零Borel测度这一事实对Schönflies的吸引力与对Harnack的吸引力一样小。
Schönflies对 Borel 测度方法的厌恶体现在他对待 Borel关于级数 的态度上,即上述围绕 (4.6.2)所讨论的内容 。他钦佩Borel的结果,但避免使用 Borel 的测度论来表征这些结果。Schönflies早先曾约定,“容量(content)”一词应仅指外容,因为“对于应用而言,它始终只是一个关于外容的问题”(1900年,1994年)。因此,他观察到该级数收敛于外容为1的集合。Schönflies没有得出非收敛点集 D 包含在测度为零的Borel集B中的结论,而是强调了B 的广度:
(4.6.5) ,
且每一个集合 无处稠密(因为
是稠密的)。因此,([0, 1]- B) 是无处稠密集的可数并集,用 Baire 在其 1899a 博士论文(参见 3.13 节)中引入的术语来说,它属于“第一类”。Baire 证明了 [0, 1] 不属于第一类;因此 B 不可能属于第一类。与 [0, 1] 一样,它属于第二类。
4.7 总结(Conclusion)
通过强调集合 B 的巨大性,Schönflies似乎在暗示,B 不应视为测度上可忽略的集合,暗示一个包含此类结论的定义是不恰当的。其他人无疑也认同他的观点。事实上,我们已经看到,稠密集可以有零测度的思想与 Harnack,Cantor 和许多其他数学家采用的、并由 Schönflies倡导的集合测度方法相悖。Lebesgue的工作实际上解决了关于最合适的测度定义的问题,因为他证明了 Borel 型测度是必要的——或许是必要之恶,但无论如何都是必要的。也就是说,Lebesgue推广 Jordan 测度理论时所伴随的积分定义(如第 4.5 节开头所述)没有Riemann积分的大部分缺陷,包括第 4.4 节中讨论的那些缺陷。因此,如果一致有界的Lebesgue可积函数序列 对 [a, b] 中的每一个 x 都收敛于一个函数 f (x),则 f 是Lebesgue可积的,并且
(4.7.1) 。
而若一个函数 f (x) 在 [a, b] 上具有有界导数 , 则
在 Lebesgue 积分的意义上总是可积的,且
(4.7.2) 。
Lebesgue的重大成就是发现他所推广的积分具有这些以及许多其他显著的性质。(注:有关Lebesgue贡献的更详细的历史分析,请参阅 Hawkins 1970a,第 5 和 6 章。Royden 1968a,第 3-5 章对Lebesgue的理论进行了出色的阐述。) 通过创建积分理论,Lebesgue实际上证实了Fourier的朴素(naïve)信念,即“任意函数”并不超出数学分析的范畴。
内容来源:
<<From the Calculus to Set Theory, 1630-1910>>(An Introductory History),I.Grattan-Guinness 等。