在日常生活中,我們常遇到「集齊全套換好禮」的活動。

假設共有 \( N \) 種不同類型的優待券,且每次獲得某種類型的機會不但獨立於先前的收集品,
且獲得每種優待券的機會皆為均等的(即機率皆為 \( 1/N \)) 。

這是一個經典的機率模型,我們感興趣的是隨機變數 \( T \) ——
代表一個人為了獲得一整套優待券(即每種類型至少有一張)時,總共所需收集的張數 。

1. 關鍵轉折:為何直接計算 \( P\{T = n\} \) 並不容易?

讀者的直覺通常是直接求解「剛好在第 \( n \) 張集齊」的機率 \( P\{T = n\} \)。

然而,這種正面強攻的方法在數學推導上極其繁瑣。

實戰演練 A:當 \( N=3 \), \( n=4 \) 時

若要在第 \( 4 \) 張剛好集齊,我們需要計算前 \( 3 \) 張「恰好」涵蓋其中 \( 2 \) 種的情形:

  1. 選取種類:\(C^{3}_{2} = 3 \) 種組合。
  2. 排列情況:前 \( 3 \) 張中這兩類的分配(如 \( 2+1 \) 或 \( 1+2 \)),
    計算為 \( \frac{3!}{2!1!} + \frac{3!}{1!2!} = 6 \) 種。
  3. 總路徑:\( 3 \times 6 = 18 \) 種。這還算能在紙上列完。
  4. 第 4 張的情形:必須抽中最後缺少的那一種(機率為 \( 1/3 \))。
  5. 最終結果: \[ P\{T=4\} = \frac{18 \times 1}{3^4} = \frac{18}{81} = \frac{2}{9} \approx 22.2% \]

實戰演練 B:當 \( N=10 \), \( n=20 \) 時(恐怖的開始)

若要在第 \( 20 \) 張剛好集齊,代表前 \( 19 \) 張必須「恰好」涵蓋某 \( 9 \) 種,
且這 \( 9 \) 種每一種都至少要出現一次。如果你想正面列式,你會遇到:

  1. 選取種類:\( C^{10}_{9} = 10 \) 種組合。
  2. 分配情況:你必須把 \( 19 \) 張券分配給這 \( 9 \) 個類別,可能的分配包含:
    • (11, 1, 1, 1, 1, 1, 1, 1, 1) 的各種排列
    • (10, 2, 1, 1, 1, 1, 1, 1, 1) 的各種排列
    • … 甚至是 (3, 2, 2, 2, 2, 2, 2, 2, 2) 等數十種拆解方式。
  3. 對應的排列數:每一種分配都要計算多項式係數,例如其中一種路徑就是:\[ \frac{19!}{11! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1! \times 1!} \text{} \]光是這一個數字就高達數十億。而你必須把幾百種這類型的排列全部加總,才能得到 \( P\{T=20\} \) 的分子。
    這就是為什麼直接計算會讓電腦也感到吃力。
  • 解題旁註:高中數學「機率」章節中的「間接計算法」。
    當正面情況過於瑣碎時,從反面(餘事件)切入是簡化問題的核心路徑。

2. 嚴謹推導:從「未集齊」中看見結構

因此,我們轉而計算 \( P\{T > n\} \),這代表收集了 \( n \) 張後依然沒有湊齊全套 。

這意味著在首 \( n \) 張中,至少有一種類型是缺席的 。

我們定義事件 \(A_1, A_2, …, A_N\) 如下:\( A_{j} \) 為「首 \( n \) 張中沒有第 \( j \) 種優待券」的事件 ,\(j=1,2,…,N\)。

(1) 單次抽取的「避開率」

想像現在有 \( N \) 種優待券。當你隨機抽取一張時,抽中第 \( j \) 種的機率是 \( \frac{1}{N} \)。
相對地,「沒抽中」第 \( j \) 種(也就是抽中其餘 \( N-1 \) 種任一種)的機率就是: \[ 1 – \frac{1}{N} = \frac{N-1}{N} \]

(2) 連續 \( n \) 次的「生存考驗」

因為題目假設每次收集都是相互獨立的(這就是高中數學「獨立試驗」的觀念),
這意味著第一張沒抽中,並不會影響第二張沒抽中的機率。

若要讓第 \( j \) 種類型在 \( n \) 張中徹底消失,這 \( n \) 次抽取必須全部滿足「避開」的條件:

  • 第 \( 1 \) 張避開的機率:\( \frac{N-1}{N} \)
  • 第 \( 2 \) 張避開的機率:\( \frac{N-1}{N} \)
  • …以此類推,直到第 \( n \) 張。

利用排容原理處理重疊缺席的情況 ,展開如下: \[ P\{T > n\} = \sum_{i=1}^{N-1} C^{N}_{i} ( \frac{N-i}{N} )^{n} (-1)^{i+1} \text{} \]

同學看到這個式子可能有點暈了,我們再說清楚一點:
當我們說「沒集齊全套」(即 \( T > n \))時,情況其實有很多種:

可能只缺了第 \( 1 \) 種,其他都拿到了。
可能同時缺了第 \( 1 \) 種與第 \( 2 \) 種。

問題就在這裡:當我們計算「缺少第 \( 1 \) 種」的機率時,
裡面其實已經包含了「同時缺少第 \( 1 \) 種與第 \( 2 \) 種」的情況。

如果我們單純地把每種缺席的機率加起來,那些「同時缺好幾種」的情況就會被重複計算。

解題旁註:這就是高中數學「排列組合」中的「取捨原理」。
為了修正重複計算的數量,我們必須「加一次、減一次、再加一次」。

根據排容原理,聯集機率(至少一個事件發生)的展開式為:
\[ P(A_{1} \cup A_{2} \cup \dots \cup A_{N}) = \sum P(A_{i}) – \sum P(A_{i} A_{j}) + \sum P(A_{i} A_{j} A_{k}) – \dots \]

這裡有一個細節:為什麼 \( i \) 最高只到 \( N-1 \)?

因為如果 \( i = N \),代表缺了所有 \( N \) 種優待券。

但在我們的設定中,你每次「一定」會抽到某一種券,所以不可能缺了所有種類。

當 \( i=N \) 時,括號內的 \( \frac{N-N}{N} \) 會等於 \( 0 \),該項自然消失。

因此得到 \[ P\{T > n\} = \sum_{i=1}^{N-1} C^{N}_{i} ( \frac{N-i}{N} )^{n} (-1)^{i+1} \text{} \]
最後,利用差分關係輕鬆求得精確機率 : \[ P\{T = n\} = P\{T > n-1\} – P\{T > n\} \text{} \]

我們用這個方式再算一次 \(n=20\),\(N=10\) 的情況。

利用排容原理,我們已知 \( P\{T > n\} \) 的通式。

要計算 \( N=10 \) 且 \( n=20 \) 時「剛好」在第 \( 20 \) 張集齊的機率,我們使用差分邏輯: \[ P\{T = 20\} = P\{T > 19\} – P\{T > 20\} \]

這代表「前 \( 19 \) 張沒集齊」的情況,減去「前 \( 20 \) 張也沒集齊」的情況。

第一步:理解單一事件的「生存」機率

事件 \( A_{j} \) 為首 \( n \) 張中沒有第 \( j \) 種優待券。
因為每張「避開」第 \( j \) 種的機率為 \( \frac{N-1}{N} \),由獨立性假設得: \[ P(A_{j}) = ( \frac{N-1}{N} )^{n} \]

第二步:展開排容原理通式

對於 \( N=10 \),\( P\{T > n\} \) 展開如下: \[ P\{T > n\} = \sum_{i=1}^{9} C^{10}_{i} ( \frac{10-i}{10} )^{n} (-1)^{i+1} \]

第三步:進行差分運算

最後,我們利用差分關係求得 \( P\{T = 20\} \)。

這個觀念在高中數學「機率」章節中非常重要:
要得到「剛好在第 20 張集齊」的機率,可以用「前 19 張還沒集齊」的情況,減去「前 20 張也還沒集齊」的情況。

將 \( n=19 \) 與 \( n=20 \) 帶入排容原理通式並相減:

\[ P\{T = 20\} = P\{T > 19\} – P\{T > 20\} \]

\[ P\{T = 20\} = \sum_{i=1}^{9} C^{10}_{i} (-1)^{i+1} [ ( \frac{10-i}{10} )^{19} – ( \frac{10-i}{10} )^{20} ] \]

為了簡化這個式子,我們可以提取公因式 \( ( \frac{10-i}{10} )^{19} \),
括號內會剩下 \( ( 1 – \frac{10-i}{10} ) \),也就是 \( \frac{i}{10} \)。整理後得到最終的精確表達式:

\[ P\{T = 20\} = \sum_{i=1}^{9} C^{10}_{i} (-1)^{i+1} \frac{i \times (10-i)^{19}}{10^{20}} \]

  • 解題旁註:這就是「差分法」的應用。在處理隨機變數的機率質量函數(PMF)時,
    利用累積機率的差值來求解,能避開極其複雜的路徑排列組合。

3. 進階觀察:手上的種類數

除了關心「何時集齊」,我們也常好奇:如果我今天只買了 \( n \) 張,我手裡到底會有幾種不同的券?

我們令 \( D_{n} \) 代表這 \( n \) 張中「\(k\) 種不同種類的優待券」。

先考慮一個例子:\(n=20\),\(k=3\)

也就是說,要讓「20 張裡剛好有 3 種(\( D_{20} = 3 \))」,必須通過以下三道關卡:

第一關:海選種類(選出那 3 種)

首先,這 3 種到底是哪 3 種?是 \(A\)、\(B\)、\(C\) 還是 \(X\)、\(Y\)、\(Z\)?

我們必須從全部的 \( N \) 種裡面(先考慮\(N=10\))的情況,選出特定的 3 種。

這在數學上就是組合數:\( C^{10}_{3} \)

這是第一步,先決定我們要討論的對象。

第二關:劃定範圍(20 次都抽中這 3 種之一)

每一張抽出來,都必須是剛剛選中的那三位成員。
抽一張中的機率是 \( \frac{3}{10} \) ,
連續抽 20 張的機率就是:\[ ( \frac{3}{10} )^{20} \]

這一步保證了你的口袋裡「絕不會出現」第 4 種或第 5 種券。
但注意,這一步還沒排除「20 張全抽到同一種或兩種」的情況。

第三關:這 3 種都必須「現身」

既然說是「剛好有 3 種」,那就不能只拿到 1 種或 2 種。
我們要扣掉在「範圍 3」裡面,卻沒有湊齊 3 種的所有可能。
\[ 1 – \sum_{i=1}^{2} C^{3}_{i} ( \frac{3-i}{3} )^{20} (-1)^{i+1} \]

這是在這 3 種的「小世界」裡玩集集樂,確保 \(A\)、\(B\)、\(C\) 三種每一種都至少有一張。

最後組合起來的樣子

當 \( k=3 \) 時,公式就會長這樣: \[ P\{D_{20} = 3\} = C^{10}_{3} \times ( \frac{3}{10} )^{20} \times [ 1 – ( C^{3}_{1} ( \frac{2}{3} )^{20} – C^{3}_{2} ( \frac{1}{3} )^{20} ) ] \]

  • 解題旁註:這就是「分層計算法」。我們先處理外部的選擇(選出 \( k \) 種),再處理內部的分佈(確保 \( k \) 種都出現)。

好的,最後我們將這所有的推理過程,濃縮成一個最強大的一般項公式。

這個公式能讓你在任何張數 \(n\)、總種類 \(N\) 下,精準計算出「手中有 \(k\) 種不同券」的機率。

4. 最終總結:手持種類數的一般形式

當我們從總共 \(N\) 種優待券中隨機抽取 \(n\) 張時,
手中「剛好」持有 \(k\) 種不同優待券(其中 \(1 \le k \le N\))的機率 \(P\{D_{n} = k\}\),
可以表示為以下的一般形式:

P(Dn=k)=CkN(kN)n[1i=1k1Cik(kik)n(1)i+1)]\Large P(D_n=k)=C^N_k\cdot(\frac{k}{N})^n\cdot[1-\sum_{i=1}^{k-1}C^k_i\cdot(\frac{k-i}{k})^n\cdot(-1)^{i+1})]

為什麼這個式子這樣寫?

  1. 第一關 \(C^N_k\):從總共 \(N\) 種裡,挑出你手裡有的那 \(k\) 種(選定主角)。
  2. 第二關 \((\frac{k}{N})^n\):確保你抽了 \(n\) 張,每一張都落在這 \(k\) 種的範圍內(鎖定邊界)。
  3. 第三關 中括號 \([\dots]\):這是在這 \(k\) 種的小圈圈裡玩排容,扣掉「雖然在範圍內,但卻沒湊齊 \(k\) 種」的所有遺憾情況。

這篇文章就先停在這邊,祝學習愉快。
如果你覺得這篇關於「優待券收集問題」的拆解對你有幫助,
別忘了將它分享給身邊正為了集點或抽卡而苦惱的朋友,
讓他們也能用數學的眼光看穿商家的遊戲規則。

📩 掌握更多數學思維,別錯過每一篇深度解析!

數學不應該只是課本上的考題,而是理解世界的工具。
如果你想持續與我一起從生活細節中挖掘有趣的數學邏輯,現在就加入我的訂閱名單:

如果還沒訂閱電子報,請在下方輸入您的 Email:

  • 每週精選: 深入淺出的數學科普、生活中的統計陷阱、以及讓你大呼過癮的邏輯挑戰。
  • 專屬內容: 電子報訂閱者將優先收到完整的「數學學習實踐指南」PDF 與文章更新通知。
  • 互動交流: 隨時回信與我討論你的發現,你的疑惑可能就是下一篇專欄的主題!

歡迎訂閱 高中數學數位學習電子報

高中數學數位學習電子報訪客