集齊全套要多久？優待券收集問題的機率解析 - 智匯雲端數位教育行

在日常生活中，我們常遇到「集齊全套換好禮」的活動。

假設共有 \( N \) 種不同類型的優待券，且每次獲得某種類型的機會不但獨立於先前的收集品，
且獲得每種優待券的機會皆為均等的（即機率皆為 \( 1/N \)）。

這是一個經典的機率模型，我們感興趣的是隨機變數 \( T \) ——
代表一個人為了獲得一整套優待券（即每種類型至少有一張）時，總共所需收集的張數。

1. 關鍵轉折：為何直接計算 \( P\{T = n\} \) 並不容易？

讀者的直覺通常是直接求解「剛好在第 \( n \) 張集齊」的機率 \( P\{T = n\} \)。

然而，這種正面強攻的方法在數學推導上極其繁瑣。

實戰演練 A：當 \( N=3 \), \( n=4 \) 時

若要在第 \( 4 \) 張剛好集齊，我們需要計算前 \( 3 \) 張「恰好」涵蓋其中 \( 2 \) 種的情形：

選取種類：\(C^{3}_{2} = 3 \) 種組合。
排列情況：前 \( 3 \) 張中這兩類的分配（如 \( 2+1 \) 或 \( 1+2 \)），
計算為 \( \frac{3!}{2!1!} + \frac{3!}{1!2!} = 6 \) 種。
總路徑：\( 3 \times 6 = 18 \) 種。這還算能在紙上列完。
第 4 張的情形：必須抽中最後缺少的那一種（機率為 \( 1/3 \)）。
最終結果： \[ P\{T=4\} = \frac{18 \times 1}{3^4} = \frac{18}{81} = \frac{2}{9} \approx 22.2% \]

實戰演練 B：當 \( N=10 \), \( n=20 \) 時（恐怖的開始）

若要在第 \( 20 \) 張剛好集齊，代表前 \( 19 \) 張必須「恰好」涵蓋某 \( 9 \) 種，
且這 \( 9 \) 種每一種都至少要出現一次。如果你想正面列式，你會遇到：

選取種類：\( C^{10}_{9} = 10 \) 種組合。
分配情況：你必須把 \( 19 \) 張券分配給這 \( 9 \) 個類別，可能的分配包含：
- (11, 1, 1, 1, 1, 1, 1, 1, 1) 的各種排列
- (10, 2, 1, 1, 1, 1, 1, 1, 1) 的各種排列
- … 甚至是 (3, 2, 2, 2, 2, 2, 2, 2, 2) 等數十種拆解方式。
對應的排列數：每一種分配都要計算多項式係數，例如其中一種路徑就是：\[ \frac{19!}{11! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1!} \text{} \]光是這一個數字就高達數十億。而你必須把幾百種這類型的排列全部加總，才能得到 \( P\{T=20\} \) 的分子。
這就是為什麼直接計算會讓電腦也感到吃力。

解題旁註：高中數學「機率」章節中的「間接計算法」。
當正面情況過於瑣碎時，從反面（餘事件）切入是簡化問題的核心路徑。

2. 嚴謹推導：從「未集齊」中看見結構

因此，我們轉而計算 \( P\{T > n\} \)，這代表收集了 \( n \) 張後依然沒有湊齊全套。

這意味著在首 \( n \) 張中，至少有一種類型是缺席的。

我們定義事件 \(A_1, A_2, …, A_N\) 如下：\( A_{j} \) 為「首 \( n \) 張中沒有第 \( j \) 種優待券」的事件，\(j=1,2,…,N\)。

(1) 單次抽取的「避開率」

想像現在有 \( N \) 種優待券。當你隨機抽取一張時，抽中第 \( j \) 種的機率是 \( \frac{1}{N} \)。
相對地，「沒抽中」第 \( j \) 種（也就是抽中其餘 \( N-1 \) 種任一種）的機率就是： \[ 1 – \frac{1}{N} = \frac{N-1}{N} \]

(2) 連續 \( n \) 次的「生存考驗」

因為題目假設每次收集都是相互獨立的（這就是高中數學「獨立試驗」的觀念），
這意味著第一張沒抽中，並不會影響第二張沒抽中的機率。

若要讓第 \( j \) 種類型在 \( n \) 張中徹底消失，這 \( n \) 次抽取必須全部滿足「避開」的條件：

第 \( 1 \) 張避開的機率：\( \frac{N-1}{N} \)
第 \( 2 \) 張避開的機率：\( \frac{N-1}{N} \)
…以此類推，直到第 \( n \) 張。

利用排容原理處理重疊缺席的情況，展開如下： \[ P\{T > n\} = \sum_{i=1}^{N-1} C^{N}_{i} ( \frac{N-i}{N} )^{n} (-1)^{i+1} \text{} \]

同學看到這個式子可能有點暈了，我們再說清楚一點：
當我們說「沒集齊全套」（即 \( T > n \)）時，情況其實有很多種：

可能只缺了第 \( 1 \) 種，其他都拿到了。
可能同時缺了第 \( 1 \) 種與第 \( 2 \) 種。

問題就在這裡：當我們計算「缺少第 \( 1 \) 種」的機率時，
裡面其實已經包含了「同時缺少第 \( 1 \) 種與第 \( 2 \) 種」的情況。

如果我們單純地把每種缺席的機率加起來，那些「同時缺好幾種」的情況就會被重複計算。

解題旁註：這就是高中數學「排列組合」中的「取捨原理」。
為了修正重複計算的數量，我們必須「加一次、減一次、再加一次」。

根據排容原理，聯集機率（至少一個事件發生）的展開式為：
\[ P(A_{1} \cup A_{2} \cup \dots \cup A_{N}) = \sum P(A_{i}) – \sum P(A_{i} A_{j}) + \sum P(A_{i} A_{j} A_{k}) – \dots \]

這裡有一個細節：為什麼 \( i \) 最高只到 \( N-1 \)？

因為如果 \( i = N \)，代表缺了所有 \( N \) 種優待券。

但在我們的設定中，你每次「一定」會抽到某一種券，所以不可能缺了所有種類。

當 \( i=N \) 時，括號內的 \( \frac{N-N}{N} \) 會等於 \( 0 \)，該項自然消失。

因此得到 \[ P\{T > n\} = \sum_{i=1}^{N-1} C^{N}_{i} ( \frac{N-i}{N} )^{n} (-1)^{i+1} \text{} \]
最後，利用差分關係輕鬆求得精確機率： \[ P\{T = n\} = P\{T > n-1\} – P\{T > n\} \text{} \]

我們用這個方式再算一次 \(n=20\)，\(N=10\) 的情況。

利用排容原理，我們已知 \( P\{T > n\} \) 的通式。

要計算 \( N=10 \) 且 \( n=20 \) 時「剛好」在第 \( 20 \) 張集齊的機率，我們使用差分邏輯： \[ P\{T = 20\} = P\{T > 19\} – P\{T > 20\} \]

這代表「前 \( 19 \) 張沒集齊」的情況，減去「前 \( 20 \) 張也沒集齊」的情況。

第一步：理解單一事件的「生存」機率

事件 \( A_{j} \) 為首 \( n \) 張中沒有第 \( j \) 種優待券。
因為每張「避開」第 \( j \) 種的機率為 \( \frac{N-1}{N} \)，由獨立性假設得： \[ P(A_{j}) = ( \frac{N-1}{N} )^{n} \]

第二步：展開排容原理通式

對於 \( N=10 \)，\( P\{T > n\} \) 展開如下： \[ P\{T > n\} = \sum_{i=1}^{9} C^{10}_{i} ( \frac{10-i}{10} )^{n} (-1)^{i+1} \]

第三步：進行差分運算

最後，我們利用差分關係求得 \( P\{T = 20\} \)。

這個觀念在高中數學「機率」章節中非常重要：
要得到「剛好在第 20 張集齊」的機率，可以用「前 19 張還沒集齊」的情況，減去「前 20 張也還沒集齊」的情況。

將 \( n=19 \) 與 \( n=20 \) 帶入排容原理通式並相減：

\[ P\{T = 20\} = P\{T > 19\} – P\{T > 20\} \]

\[ P\{T = 20\} = \sum_{i=1}^{9} C^{10}_{i} (-1)^{i+1} [ ( \frac{10-i}{10} )^{19} – ( \frac{10-i}{10} )^{20} ] \]

為了簡化這個式子，我們可以提取公因式 \( ( \frac{10-i}{10} )^{19} \)，
括號內會剩下 \( ( 1 – \frac{10-i}{10} ) \)，也就是 \( \frac{i}{10} \)。整理後得到最終的精確表達式：

\[ P\{T = 20\} = \sum_{i=1}^{9} C^{10}_{i} (-1)^{i+1} \frac{i \times (10-i)^{19}}{10^{20}} \]

解題旁註：這就是「差分法」的應用。在處理隨機變數的機率質量函數（PMF）時，
利用累積機率的差值來求解，能避開極其複雜的路徑排列組合。

3. 進階觀察：手上的種類數

除了關心「何時集齊」，我們也常好奇：如果我今天只買了 \( n \) 張，我手裡到底會有幾種不同的券？

我們令 \( D_{n} \) 代表這 \( n \) 張中「\(k\) 種不同種類的優待券」。

先考慮一個例子：\(n=20\)，\(k=3\)

也就是說，要讓「20 張裡剛好有 3 種（\( D_{20} = 3 \)）」，必須通過以下三道關卡：

第一關：海選種類（選出那 3 種）

首先，這 3 種到底是哪 3 種？是 \(A\)、\(B\)、\(C\) 還是 \(X\)、\(Y\)、\(Z\)？

我們必須從全部的 \( N \) 種裡面(先考慮\(N=10\))的情況，選出特定的 3 種。

這在數學上就是組合數：\( C^{10}_{3} \)

這是第一步，先決定我們要討論的對象。

第二關：劃定範圍（20 次都抽中這 3 種之一）

每一張抽出來，都必須是剛剛選中的那三位成員。
抽一張中的機率是 \( \frac{3}{10} \) ，
連續抽 20 張的機率就是：\[ ( \frac{3}{10} )^{20} \]

這一步保證了你的口袋裡「絕不會出現」第 4 種或第 5 種券。
但注意，這一步還沒排除「20 張全抽到同一種或兩種」的情況。

第三關：這 3 種都必須「現身」

既然說是「剛好有 3 種」，那就不能只拿到 1 種或 2 種。
我們要扣掉在「範圍 3」裡面，卻沒有湊齊 3 種的所有可能。
\[ 1 – \sum_{i=1}^{2} C^{3}_{i} ( \frac{3-i}{3} )^{20} (-1)^{i+1} \]

這是在這 3 種的「小世界」裡玩集集樂，確保 \(A\)、\(B\)、\(C\) 三種每一種都至少有一張。

最後組合起來的樣子

當 \( k=3 \) 時，公式就會長這樣： \[ P\{D_{20} = 3\} = C^{10}_{3} \times ( \frac{3}{10} )^{20} \times [ 1 – ( C^{3}_{1} ( \frac{2}{3} )^{20} – C^{3}_{2} ( \frac{1}{3} )^{20} ) ] \]

解題旁註：這就是「分層計算法」。我們先處理外部的選擇（選出 \( k \) 種），再處理內部的分佈（確保 \( k \) 種都出現）。

好的，最後我們將這所有的推理過程，濃縮成一個最強大的一般項公式。

這個公式能讓你在任何張數 \(n\)、總種類 \(N\) 下，精準計算出「手中有 \(k\) 種不同券」的機率。

4. 最終總結：手持種類數的一般形式

當我們從總共 \(N\) 種優待券中隨機抽取 \(n\) 張時，
手中「剛好」持有 \(k\) 種不同優待券（其中 \(1 \le k \le N\)）的機率 \(P\{D_{n} = k\}\)，
可以表示為以下的一般形式：

\Large P(D_n=k)=C^N_k\cdot(\frac{k}{N})^n\cdot[1-\sum_{i=1}^{k-1}C^k_i\cdot(\frac{k-i}{k})^n\cdot(-1)^{i+1})]

為什麼這個式子這樣寫？

第一關 \(C^N_k\)：從總共 \(N\) 種裡，挑出你手裡有的那 \(k\) 種（選定主角）。
第二關 \((\frac{k}{N})^n\)：確保你抽了 \(n\) 張，每一張都落在這 \(k\) 種的範圍內（鎖定邊界）。
第三關中括號 \([\dots]\)：這是在這 \(k\) 種的小圈圈裡玩排容，扣掉「雖然在範圍內，但卻沒湊齊 \(k\) 種」的所有遺憾情況。

這篇文章就先停在這邊，祝學習愉快。
如果你覺得這篇關於「優待券收集問題」的拆解對你有幫助，
別忘了將它分享給身邊正為了集點或抽卡而苦惱的朋友，
讓他們也能用數學的眼光看穿商家的遊戲規則。

📩 掌握更多數學思維，別錯過每一篇深度解析！

數學不應該只是課本上的考題，而是理解世界的工具。
如果你想持續與我一起從生活細節中挖掘有趣的數學邏輯，現在就加入我的訂閱名單：

如果還沒訂閱電子報，請在下方輸入您的 Email：

每週精選： 深入淺出的數學科普、生活中的統計陷阱、以及讓你大呼過癮的邏輯挑戰。
專屬內容： 電子報訂閱者將優先收到完整的「數學學習實踐指南」PDF 與文章更新通知。
互動交流： 隨時回信與我討論你的發現，你的疑惑可能就是下一篇專欄的主題！

歡迎訂閱高中數學數位學習電子報

數學數位學習教室

國高中自主學習式線上課程