Urnen-Modelle

 Die Formel

|k(A)|  =  nk  mit  n = |A|(Anzahl der k-elementigen Teilmengen)

rechtfertigt die Lesart „k aus n“ der Binomialkoeffizienten. Wir wählen k paarweise verschiedene Elemente unter n möglichen. Dies bringt uns zu unserem nächsten Thema:

 Die Mengen T1, …, T4 können wir als Ergebnisräume für das blinde Ziehen von k Kugeln aus einer Urne mit nummerierten Kugeln 1, …, n auffassen:

T1wird gewählt für  Ziehen mit Reihenfolge, mit Zurücklegen,

T2wird gewählt für  Ziehen mit Reihenfolge, ohne Zurücklegen,

T3wird gewählt für  Ziehen ohne Reihenfolge, ohne Zurücklegen,

T4wird gewählt für  Ziehen ohne Reihenfolge, mit Zurücklegen.

 Für T3 und T4 gilt dabei: Die nummerierten Kugeln werden nach der Ziehung monoton steigend angeordnet. Dadurch werden Mengen bzw. Multimengen in natürlicher und eindeutiger Weise (im funktionalen Sinn) zu Tupeln. Beim Experiment des dritten Typs mit n = 8 und k = 6 wird aus der Ziehung 4, 5, 3, 6, 8, 1 zum Beispiel das Ergebnis (1, 3, 4, 5, 6, 8). Das gleiche Ergebnis erhalten wir, wenn die Kugeln 1, 8, 6, 3, 4, 5 gezogen werden.

ema22-AbbID4-2-4

Übergang von { 4, 5, 3, 6, 8, 1 } ⊆ { 1, …, 8 } zu (1, 3, 4, 5, 6, 8)  ∈  T3(8, 6)

 Das Vorgehen entspricht der Mitteilung des Ergebnisses einer Ziehung beim Lotto. Die gezogenen Kugeln werden nach der Ziehung streng monoton steigend angeordnet.

Gleichverteilung für T1, T2 und T3

 Für die Urnenexperimente mit den Ergebnisräumen T1, T2 bzw. T3 gilt:

(◇)  Jedes Ergebnis (a1, …, ak) ist gleichwahrscheinlich.

Diese Aussage lässt sich nicht im mathematischen Sinne beweisen, da sie sich nicht innerhalb der mathematischen Sprache formulieren lässt. Möglich ist eine physikalische Begründung wie zum Beispiel „aus Symmetriegründen“ und weiter die statistische Überprüfung, ob das durch (◇) definierte mathematische Modell korrekt ist. Dieses Problem betrifft alle Modellierungen der Wahrscheinlichkeitstheorie: Ein reales Zufallsexperiment − hier: das Ziehen von Kugeln aus einer Urne mit bestimmten Regeln − wird mathematisch durch eine Ergebnismenge und ein zugehöriges Wahrscheinlichkeitsmaß beschrieben. Ob das Modell dem Experiment entspricht, lässt sich begründen und durch Vergleich von statistischen Werten mit mathematischen Vorhersagen überprüfen, nicht aber beweisen.

ema22-AbbID4-2-5

Für n = 8 und k = 6 und Ziehungen ohne Reihenfolge ohne Zurücklegen sind die Ziehungen { 1, 3, 4, 5, 6, 8 } und { 1, 2, 4, 5, 7, 8 } aus Symmetriegründen gleichwahrscheinlich.

 Unter der Modellierung (◇) ergibt sich für die ersten drei Urnenexperimente 1/|T1|, 1/|T2| bzw. 1/|T3| als Wahrscheinlichkeit für jedes Ergebnis.

Beispiel

Die Wahrscheinlichkeit, bei einem Urnenexperiment mit 10 Kugeln ohne Reihenfolge und ohne Zurücklegen das Ergebnis (1, 3, 7) zu erhalten, ist der Kehrwert von

|T3(10, 3)|  =  103  =  10 · 9 · 83 · 2 · 1  =  120,

also 1/120.

Die Verteilung für das Ziehen ohne Reihenfolge mit Zurücklegen

 Die Modellierung für das Ziehen ohne Reihenfolge, aber mit Zurücklegen ist komplizierter, da wir hier keine Gleichverteilung mehr vorfinden. Um dies einzusehen, betrachten wir einen besonders übersichtlichen Fall:

Beispiel

Seien n = 2 und k = 2. Der Ergebnisraum ist

T4  =  T4(2, 2)  =  { (1, 1),  (1, 2),  (2, 2) }.

Wie wird ein Ergebnis erhalten? Wir können aus einer Urne mit einer Hand zwei Kugeln ziehen, aber dadurch ist kein Zurücklegen möglich. Bei einem Experiment mit Zurücklegen müssen wir die Kugeln nacheinander ziehen. Nach dem Ziehen der ersten Kugel wird diese notiert und zurückgelegt. Erst dann wird die zweite Kugel gezogen. Die Ergebnisse liegen also zunächst in

T1  =  { (1, 1),  (1, 2),  (2, 1),  (2, 2) }.

Nun werden die Zwischenergebnisse (1, 2) und (2, 1) miteinander identifiziert, um die Reihenfolge aufzulösen. Aus der Gleichverteilung auf T1 ergeben sich dann die Wahrscheinlichkeiten für T4:

P(1, 1)  =  P(2, 2)  =  1/4  und  P(1, 2)  =  1/2.

 Die Bestimmung der Wahrscheinlichkeiten für T4 = T4(n, k) erfordert das kombinatorische Zählen von Tupeln in T1 = T1(n, k), die durch monotone Anordnung zum gleichen Tupel in T4 führen. Wir betrachten also in T1 die Äquivalenz

(a1, …, ak)  ≡   (b1, …, bk)falls  g(a1, …, an)  =  g(b1, …, bk),

wobei die Funktion g : T1  T4 die monotone Anordnung eines Tupels beschreibt, etwa g(1, 3, 1, 2) = (1, 1, 2, 3) = g(3, 1, 1, 2). Im Unterschied zu den bisherigen Identifizierungen sind die Klassen dieser Äquivalenz nicht mehr gleichgroß. Hierin liegt der Grund für die größere Komplexität des Modells für das Ziehen ohne Reihenfolge mit Zurücklegen.

 Um die Größe der Äquivalenzklassen zu bestimmen, notieren wir die Elemente von T4 in der Block-Form

(1 : k1,  2 : k2,  …,  n : kn),  mit  k1 + … + kn = k,

mit der Bedeutung: k1 mal 1, k2 mal 2, …, kn mal n.

Beispiel

Für n = 3 und k = 5 gilt

(1 : 0,  2 : 3,  3 : 2)  =  (2, 2, 2, 3, 3),

(1 : 1,  2 : 0,  3 : 4)  =  (1, 3, 3, 3, 3).

 Im Urnenexperiment bedeutet das Ergebnis (1 : k1,  2 : k2,  …,  n : kn), dass die Kugel 1 genau k1 mal, die Kugel 2 genau k2 mal, …, gezogen wird.

 Seien nun n, k ≥ 1 und k1, …, kn ≥ 0 gegeben mit k1 + … + kn = k. Wir setzen

M  =  { (a1, …, ak)  ∈  T1 | g(a1, …, ak) = (1 : k1,  2 : k2,  …,  n : kn) }.

Zur Bestimmung der Kardinalität |M| argumentieren wir wie folgt: Wir betrachten ein k-Tupel (u, …, u), wobei u für „undefiniert“ steht. Nun wählen wir k1 Stellen, die wir mit dem Eintrag 1 beschreiben. Hierzu gibt es „k1 aus k“ Möglichkeiten. Unter den verbleibenden k − k1 freien Stellen wählen wir nun k2 Stellen aus, die wir mit 2 beschreiben. Hierzu gibt es „k2 aus k − k1“ Möglichkeiten. Im nächsten Schritt haben wir „k3 aus k − k1 − k2“ Möglichkeiten, um k3 freie Stellen mit 3 zu beschreiben usw. Insgesamt erhalten wir

|M| =  kk1 kk1k2 kk1k2k3  …  kk1kn1kn
=  k!k1! (k − k1)! (k − k1)!k2! (k − k1 − k2)!  …  (k − k1 − … kn − 1)!kn! 0!
=  k!k1! … kn!.

Es gilt |T1| = nk. Damit definieren wir die Wahrscheinlichkeit, das Ergebnis (1 : k1, 2 : k2, …, n : kn) in T4 zu erhalten, als

P(1 : k1, 2 : k2, …, n : kn)  =  1nk k!k1! … kn!.

Beispiel

Wir ziehen 5 mal aus einer Urne mit den Kugeln 1, 2, 3 ohne Reihenfolge mit Zurücklegen und möchten die Wahrscheinlichkeit berechnen, dass genau zweimal die 1, genau zweimal die 2 und genau einmal die 3 gezogen wird. Mit n = 3, k = 5, k1 = k2 = 2 und k3 = 1 gilt

P(1 : 2, 2 : 2, 3 : 1)  =  135 5!2! 2! 1!  =  3035  =  1081.

Für die Ziehung mit Reihenfolge mit Zurücklegen gibt es

(1, 1, 2, 2, 3),  (1, 1, 2, 3, 2),  (1, 1, 3, 2, 2),  (1, 3, 1, 2, 2),  (3, 1, 1, 2, 2)

und genau 25 weitere gleichwahrscheinliche Ergebnisse, die alle zum Ergebnis (1 : 2, 2 : 2, 3 : 1) der Ziehung ohne Reihenfolge mit Zurücklegen führen. Wir können die Anzahl 30 so begründen: Für die 3 gibt es 5 verschiedene Positionen. Legen wir eine Position fest, so können wir die beiden Einsen frei auf zwei von vier Plätze verteilen, wodurch die Positionen der beiden Zweien festgelegt sind. Damit gibt es für jede Position der 3 genau „2 aus 4“ = 6 Möglichkeiten, sodass sich 5 · 6 = 30 Tupel ergeben.

Simultanes Ziehen

 Wir betrachten unsere Überlegungen zur Bestimmung der Wahrscheinlichkeiten für T4 noch in einem etwas anderen Licht. Seien also wieder n, k ≥ 1 gegeben. Wir stellen uns nun k Urnen vor, in denen sich jeweils nummerierte Kugeln 1, …, n befinden. Nun ziehen wir gleichzeitig (oder zumindest unabhängig voneinander) aus jeder Urne eine Kugel und tragen die Ergebnisse zusammen, sodass wir wieder ein Tupel (1 : k1, 2 : k2, …, n : kn) in T4 erhalten. Obige Argumentation zur Bestimmung der Wahrscheinlichkeit für dieses Tupel können wir übernehmen, wobei die Stellen des k-Tupels (u, …, u) nun den k Urnen entsprechen: In k1 Urnen wird die 1 gezogen, in k2 Urnen die 2 usw. Damit entspricht das Ziehen von k aus n Kugeln ohne Reihenfolge mit Zurücklegen dem simultanen Ziehen je einer Kugel aus k Urnen mit je n Kugeln ohne Beachtung der Reihenfolge. Mit realen Urnen wirkt diese Überlegung eher konstruiert, bei der Sammlung zufälliger Daten von k weltweit durchgeführten Experimenten ist dagegen die Vorstellung eines Zurücklegens weniger intuitiv.