可数集与不可数集
本文为基于 “《机器学习的数学》- 第1章 一元函数微积分 - 1.1 极限与连续 - 1.1.1 可数集与不可数集” 的学习笔记
知识脉络梳理
- 本节的重点在于理解可数与不可数的概念,它们将用于定积分中函数的可积性,以及概率论中的离散型与连续型随机变量等重要概念中。
- 可数集是在“集合等势”概念的基础上进行定义的,因此要理解可数与不可数首先要理解什么是集合等势。
- 本节的讨论范围是“有限集+无限集”,而初等数学的主要讨论对象是有限集。
- 当我们面对“无穷”问题时,必须建立以下几个基本观点:1)有限到无限是从量变到质变;2)有限集的性质不能推广到无限,反之亦然;3)要依靠理性的论证,而不是直观和常识来认识无限。
- 因此首先要放弃以前初等数学中(有限)集合的知识,重现建立“有限集+无限集”下集合的严格定义。
一、初等数学中对有限集/无限集及其基数的理解
在初等数学中:
- 对有限集和无限集的理解仅仅停留在“直观理解”层面:元素个数有限的集合是有限集;元素个数无限的集合是无限集。
- 用集合中元素的个数(基数)作为集合大小的度量方式,比如集合\(A=\{a,b,c,d,e,f,g,h\}\)中有8个元素,因此集合\(A\)的基数就是8,记为\(|A|=8\);
- 可以将集合的基数看作数值直接进行比较,比如集合\(|A|=80\),\(|B|=100\),因为 \(80 < 100\),所以 \(|A| < |B|\);
- 定义了集合间的基本关系(子集、真子集、相等)以及集合的基本运算(交集、并集、补集)。
- 经常利用集合间关系和维恩图的直观理解进行集合基数的相关运算,比如:
- $|A \cup B| = |A| + |B| - |A \cap B| $
- 如果\(A \subset B\),则\(|A|<|B|\)
- 如果\(A \cap B = \emptyset\),则$|A|+|B|=|A \cup B| $
- ...
当扩展到无限集时,初等数学中的有些概念和规则不再适用,比如:
- 对无限集讨论元素个数是没有意义的,因为所有无限集元素的个数都是\(+\infty\)
- 某些在有限集下成立的性质在无限集中不再成立,比如“如果\(A \subset B\),则\(|A|<|B|\)”这条性质就不在成立,举例说明如下:
因此,我们需要对有限集和无限集重新进行定义,并重新审视以前不假思索就直接使用的很多性质和规则。
二、基数的本质
我们来深入思考\(|A|=8\)这一简单结论背后的思想:
- 判断一个有限集合中元素的“多少”,其实是采用“数数”的方法。比如在集合\(A\)中:a是第一个元素、b是第二个元素、...、h是第8个元素;一个一个去数集合中的元素,等到把所有的元素都数完了(因为是有限集所有才有可能数完),得出该集合中一共有8个元素的结论。
- “数数”的过程其实就是与有限集合\(N_n=\{1,2,...,n\}\)建立“一一对应”的映射关系的过程。比如计算集合\(A\)中元素个数的过程实际上就是建立如下图所示的映射关系的过程:
注:在集合基数及其比较.ppt中对“基数的本质”有一些很有意思的讨论,可以了解一下。
三、有限集和无限集的定义
一个集合“能够与有限集合\(N_n=\{1,2,...,n\}\)建立一一对应的映射关系”实际上就是说:如果一个一个数,该集合中的元素是可以数完的。在这样的考虑下可以重新对有限集和无限集进行定义:
例如,下列集合均为有限集:
注意:
- 无限集是指“不能与集合\(N_n\)建立一一对应关系的集合”,而不是“能与\(N_n\)建立一一对应关系,但n为无穷大的集合(此时\(N_n\)其实就是正整数集 $\mathbb{N^+} $ )(这其实是可数集的定义)”。
- “能与\(N_n\)建立一一对应关系”意味着可以一个一个数,而有的无限集比如实数集是根本就不能计数的。
四、 集合等势
假设集合\(A=\{a,b,c,d,e,f,g,h\}, B=\{1月, 2月, 3月, ... , 8月\}\),很容易可以得出“集合\(A\)和集合\(B\)的基数相等”的结论,下面思考这一结论是如何得出的?
- 集合\(A=\{a,b,c,d,e,f,g,h\}\)可以与有限集合\(N_8 = \{1, 2, 3, ..., 8\}\)建立一一映射关系
=> 集合\(A\)中有8个元素,\(|A|=8\) - 集合\(B=\{1月, 2月, 3月, ... , 8月\}\)可以与有限集合\(N_8 = \{1, 2, 3, ..., 8\}\)建立一一映射关系
=> 集合\(B\)中有8个元素,\(|B|=8\) - 因为\(|A|=|B|=8\),所以集合\(A\)和集合\(B\)的基数相等
从表面上看,得出“集合\(A\)和集合\(B\)的基数相等”这一结论的原因似乎是\(|A|=|B|=8\),本质上却是“集合\(A\)和集合\(B\)都能与有限集合\(N_8 = \{1, 2, 3, ..., 8\}\)建立一一映射关系”,进一步说实际上是“集合\(A\)和集合\(B\)能够建立一一映射关系”。
在这样的考虑下给出两个集合等势的定义:
- 集合的势是一个用来度量集合所含元素多少的量。集合的势越大,所含的元素越多。
- 两个集合等势的定义中并没有对集合的类型进行限制,也就是说上面的定义对有限集和无限集都适用
- 有限集可以直击计算出元素个数(基数),一般不用“势”来度量元素的个数
在【例1】中曾经提到过“正整数集 \(\mathbb{N^+}\)、正奇数集 \(A_1\)和正偶数集 \(A_2\)两两之间等势”,下面对这一结论进行说明:
- 正整数集 \(\mathbb{N^+}\)与正偶数集 \(A_2\)等势:
- 对于集合\(\mathbb{N^+}\)中的每一个元素\(i\),都有\(A_2\)中的元素\(2i\)与之对应;反过来\(A_2\)中的元素\(i\)也都有 \(\mathbb{N^+}\)中的元素\(\frac{i}{2}\)与之对应。
- 即存在从集合\(\mathbb{N^+}\)到集合\(A_2\)的双射关系:\(i \rightarrow 2i, i \in \mathbb{N^+}, 2i \in A_2\)。
- 因此,正整数集 \(\mathbb{N^+}\)与正偶数集 \(A_2\)等势
同理:
- 因为存在从集合\(\mathbb{N^+}\)到集合\(A_1\)的双射关系:\(i \rightarrow 2i-1, i \in \mathbb{N^+}, 2i-1 \in A_1\),所以正整数集 \(\mathbb{N^+}\)与正奇数集 \(A_1\)等势;
- 因为存在从集合\(A_1\)到集合\(A_2\)的双射关系:\(i \rightarrow i+1, i \in A_1, i+1 \in A_2\),所以正奇数集 \(A_1\)与正偶数集 \(A_2\)等势。
再举一个连续集合的例子:实数集 \(\mathbb{R}\)与区间 \((0, 1)\)等势
- 因为存在从实数集 \(\mathbb{R}\)到区间 \((0, 1)\)的双射函数:\(f(x) = \frac{1}{1+e^{-x}}, x \in \mathbb{R}\),所以实数集 \(\mathbb{R}\)与区间 \((0, 1)\)等势
- 这一函数也称为logistic函数或sigmoid函数,其函数图像如下图所示:
五、可数集与不可数集
5.2 对“可数”的理解
因为一开始对“可数”这一概念实在是不能理解,所以查阅了很多资料,先将其中一部分我认为有价值的列出来,这些资料分别从不同角度对“可数”的概念进行了解释:
- 百度百科:
- 按照可数集合的定义,若A为有限集,则A一定是可数集合,否则若A与自然数集之间存在一个一一对应的映射,则A为可数集合。
- 若A与某可数集合之间存在一一对应的映射,则A为可数集合。
- 若A中所有元素可按某种规律进行排序,则A是可数集合。
- 若A是n(>1)个可数集合的并集,则A是可数集合。
- 若A是某个已知是可数集合的子集,则A是可数集合。
- 若A是n(>1)个可数集合的笛卡儿乘积,则A是可数集合。
- 维基百科:
总结: 其实对“可数”最好的解释就是“可以一个一个地数”或者“可以计数”。
本文在「2.1基数的本质」中已经对“计数”这一行为进行了讨论,下面通过对什么是“不可计数”进行说明,以便更好地理解:
5.4 连续/离散与可数/不可数的关系
- 离散与可数是等价的
5.5 一些可数集的例子
- 自然数集\(\mathbb{N}\)
- 整数集\(\mathbb{Z}\)
对于所有的整数\(... ,-4, -3, -2, -1, 0, 1, 2, 3, 4, ...\)可以按照下面的顺序一直数下去:\(0, 1,-1,2,-2,3,-3,4,-4,...\) - 有理数集\(\mathbb{Q}\)