本文為基於 「《機器學習的數學》- 第1章 一元函數微積分 - 1.1 極限與連續 - 1.1.1 可數集與不可數集」 的學習筆記
知識脈絡梳理
在初等數學中:
當擴充套件到無限集時,初等數學中的有些概念和規則不再適用,比如:
【例1】對下面幾個集合的基數進行比較:
- 正整數集 \(\mathbb{N^+}\)
- 正奇數集 \(A_1\)
- 正偶數集 \(A_2\)
對於【例1】中提到的這三個集合,有下面幾組集合關係:
\[ \mathbb{N^+} = A_1 \cup A_2 \\ A_1 \subset \mathbb{N^+} \\ A_2 \subset \mathbb{N^+} \\ A_1 \cap A_2 = \emptyset \]這是否意味著 \(|A_1| <|\mathbb{N^+}|\) 、 \(|A_2| <|\mathbb{N^+}|\) 或 \(|A_1|+|A_2|=|\mathbb{N^+}|\) 呢?答案是否定的(實際上這三個集合是等勢的)。
因此,我們需要對有限集和無限集重新進行定義,並重新審視以前不假思索就直接使用的很多性質和規則。
在初等數學中:
...
2. 用集合中元素的個數(基數)作為集合大小的度量方式,比如集合\(A=\{a,b,c,d,e,f,g,h\}\)中有8個元素,因此集合\(A\)的基數就是8,記為\(|A|=8\)$
...
我們來深入思考\(|A|=8\)這一簡單結論背後的思想:
注:在集合基數及其比較.ppt中對「基數的本質」有一些很有意思的討論,可以瞭解一下。
一個集合「能夠與有限集合\(N_n=\{1,2,...,n\}\)建立一一對應的對映關係」實際上就是說:如果一個一個數,該集合中的元素是可以數完的。在這樣的考慮下可以重新對有限集和無限集進行定義:
【定義1】 一個集合\(S\)與集合\(N_n=\{1,2,...,n\}\)(定義\(N_0 = \emptyset\))之間如果存在一一對應函數 \(f: S \rightarrow N_n\),則稱\(S\)是有限集,否則稱\(S\)是無限集。
【定義2】有限集\(S\)的元素的個數稱為S的基數,記為\(|S|\)。
例如,下列集合均為有限集:
注意:
假設集合\(A=\{a,b,c,d,e,f,g,h\}, B=\{1月, 2月, 3月, ... , 8月\}\),很容易可以得出「集合\(A\)和集合\(B\)的基數相等」的結論,下面思考這一結論是如何得出的?
從表面上看,得出「集合\(A\)和集合\(B\)的基數相等」這一結論的原因似乎是\(|A|=|B|=8\),本質上卻是「集合\(A\)和集合\(B\)都能與有限集合\(N_8 = \{1, 2, 3, ..., 8\}\)建立一一對映關係」,進一步說實際上是「集合\(A\)和集合\(B\)能夠建立一一對映關係」。
在這樣的考慮下給出兩個集合等勢的定義:
【定義2】對於集合\(A\)和集合\(B\),如果集合\(A\)中的任意元素\(a\),在集合\(B\)中都有唯一的元素\(b\)通過某種對映關係與之對應,即存在如下的從\(A\)到\(B\)的雙射函數(Bijection,一對一對映函數)
\[b=f(a), a \in A, b \in B, f: A \rightarrow B \]則稱集合\(A\)與集合\(B\)等勢,記為\(A \sim B\)
在【例1】中曾經提到過「正整數集 \(\mathbb{N^+}\)、正奇數集 \(A_1\)和正偶數集 \(A_2\)兩兩之間等勢」,下面對這一結論進行說明:
同理:
再舉一個連續集合的例子:實數集 \(\mathbb{R}\)與區間 \((0, 1)\)等勢
【定義3】如果集合\(S\)能與正整數集 \(\mathbb{N^+}\)建立一一對應的對映關係,即存在從正整數集 \(\mathbb{N^+}\)到集合\(S\)的雙射關係:\(f: \mathbb{N^+} \rightarrow S\),則稱集合\(S\)是可數的。換句話說,與正整數集 \(\mathbb{N^+}\)等勢的集合稱為可數集。
因為一開始對「可數」這一概念實在是不能理解,所以查閱了很多資料,先將其中一部分我認為有價值的列出來,這些資料分別從不同角度對「可數」的概念進行了解釋:
可數集(Countable set),是指每個元素都能與自然數集N的每個元素之間能建立一一對應的集合。如果將可數集的每個元素標上與它對應的那個自然數記號,那麼可數集的元素就可以按自然數的順序排成一個無窮序列 a1,a2,a3,…an,…。
以下是判斷一個集合是可數集合的一些結論。
在數學上,可數集,或稱可列集,是與自然數集的某個子集具有相同基數(等勢)的集合。在這個意義下,可數集由有限可數集和無限可數集組成。不是可數集的無窮集稱為不可數集。這個術語是康托爾創造的。可數集的元素,正如其名,是「可以計數」的:儘管計數有可能永遠無法終止,集合中每一個特定的元素都將對應一個自然數。
「可數集」這個術語有時僅僅指代無限可數集,即僅代表能和自然數集本身一一對應的集合。兩個定義的差別在於有限集合在前者中算作可數集,而在後者中不算作可數集。為了避免歧義,前一種意義上的可數有時稱為至多可數,後一種可數集則稱為無限可數集。
...它無非是將我們數數(shǔ shù)的行為進行了數學定義。因為日常,當我們數數的時候,就是沿著自然數的元素一個個數一些物件的個數的...
問:可列集是不是能全列出來就算可列集?
答:不是說能全列出來,理論上的意思是你對於一個可列集中的元素你總能在排序中確定一個他的位置,或者說這個集合與正整數集存在一一對應關係才叫可列,全列出來是不可能的,因為畢竟是無限集,不過可以說能夠一直列下去。
無限集中,所有的可數集都是等勢的,其中可數等價於可列,即所有元素可以排成一個無窮數列{a_i},其中對於集合中的每一個元素,總存在唯一一個自然數下標n,使得a_n就是這個元素。
總結: 其實對「可數」最好的解釋就是「可以一個一個地數」或者「可以計數」。
本文在「2.1基數的本質」中已經對「計數」這一行為進行了討論,下面通過對什麼是「不可計數」進行說明,以便更好地理解:
【例2】實數集\(\mathbb{R}\)或長度不為0的實數區間是不可數的。
- 這些集合中的元素是連續的,它們在數軸上是相當稠密的。
- 對於長度不為0的實數區間\((a_1,a_2)\),在該區間內任意兩個不相等的實數(不論它們之間的距離有多近)之間都有無數個實數,它們之間的這些實數同樣也屬於\((a_1,a_2)\)實數區間。
- 考慮一個實數區間 $ [1, 10 ]$,試圖對它所包含的實數進行計數。一開始先間隔1取數進行計數,數了10個數:1到10;這時發現剛剛取到的10個數中相鄰兩個數之間仍有無數個數,於是先試著數一數1和2之間的數,這次間隔0.1取數,取到了1.0、1.1、...、1.9、2.0這11個數;然後發現1.1和1.2之間還有無數個數,繼續用更小的間隔0.01取數:1.00、1.01、...、1.09、1.10;...這樣的過程似乎可以無止盡地進行下去,即使數到了1.0000000000000000001和1.0000000000000000002,它們之間還是有無窮多個數。最後發現根本沒有辦法對它進行計數。
- 「無法計數」並不是說「數不完」,「數不完」的含義其實是「可以數」但是「計數的過程會無止境地進行下去」,「數不完」說的是無限可數集的情況,比如對於正偶數集,我可以按照2、4、6、8、10、...的規律一直往下數但是永遠也數不完。