1.Der Satz von Franz Mertens

Es ist instruktiv, den Primzahlsatz mit einem heuristischen Ansatz zu vergleichen, der auf dem Sieb des Eratosthenes beruht. Wir betrachten hierzu eine beliebig große natürliche Zahl n und das Zahlenintervall

2,  3,  4,  …,  n2.

Sieben wir alle echten Vielfachen der 2 aus, so bleibt etwa die Hälfte der Zahlen übrig, also etwa n2/2. Für n = 3 und n2 = 9 bleiben beispielsweise 2, 3, 5, 7, 9 übrig, für n = 4 und n2 = 16 dagegen 2, 3, 5, 7, 9, 11, 13, 15. Die genaue Anzahl der übrigbleibenden Zahlen ist n2/2 für n gerade und (n2 + 1)/2 für n ungerade. Sieben wir dagegen alle Vielfachen der 3 aus, so überleben etwa 2/3 der Zahlen, also etwa 2n2/3. Allgemein überleben etwa

(1 − 1p)  n2

Zahlen, wenn wir alle echten Vielfachen einer Primzahl p aussieben. Um alle Primzahlen unseres Intervalls zu erhalten, müssen wir nacheinander alle echten Vielfachen der Primzahlen p1, …, pk mit

p1  <  …  <  pk  ≤  n,  k = π(n),

aussieben. Dies genügt, denn jede zusammengesetzte Zahl unseres Intervall besitzt einen Primteiler kleinergleich n. Wr nehmen nun an, dass jede Siebung mit einer Primzahl pi einen von den bisherigen Siebungen mit den Primzahlen p1, …, pi − 1 unabhängigen Anteil an den überlebenden Zahlen heraussiebt, sodass etwa der Anteil 1 − 1/pi der bislang überlebenden Zahlen weiterhin überleben. Wir erhalten so die Abschätzung

n2 p ≤ n, p prim (1 − 1p)

für die Anzahl der Primzahlen im Intervall { 2, …, n2 }. Ist unsere Annahme zumindest asymptotisch korrekt, so gilt also

n2 p ≤ n, p prim (1 − 1p)  ∼  π(n2).

Nach dem Primzahlsatz gilt π(n2) ∼ n2/log(n2). Setzen wir dies auf der rechten Seite ein und dividieren wir auf beiden Seiten durch n2, so ergibt sich wegen log(n2) = 2log(n), dass

p ≤ n, p prim (1 − 1p)  ∼  12 log(n).

Diese asymptotische Aussage ist nicht richtig, aber unsere Überlegungen sind auch nicht vollkommen falsch! Franz Mertens hat 1874 (also noch vor dem Beweis des Primzahlsatzes) das folgende bemerkenswerte Ergebnis gezeigt:

Satz (dritter Satz von Mertens)

Es gilt

p ≤ n, p prim (1 − 1p)  ∼  e−γlog(n)

mit der Euler-Mascheroni-Konstanten γ = 0,57721…

prim1-AbbID-mertens1

Die Funktionen e−γ/log(n) (blau), (1/2)/log(n) (gelb)

und das Primzahlprodukt wie Satz von Mertens (grün)

 Numerisch gilt

e−γ  =  0,561459483566885169824143214790…

Unsere Heuristik berechnet damit die Anzahl der Primzahlen im Zahlenintervall 2, …, n2 asymptotisch zu etwas mehr als 0,56 n2/log(n), während nach dem Primzahlsatz 0,5 n2/log(n) herauskommen sollte. Unser Ansatz überschätzt damit die Anzahl der Primzahlen um etwa 12%. Dass die Anzahl der Primzahlen mit unserer Produktformel nicht korrekt berechnet und sogar überschätzt wird, ist als Mertens Paradox bekannt. Unsere Unabhängigkeitsannahme erweist sich als falsch. Der Satz von Mertens zeigt: Eine Siebung mit einer Primzahl pi siebt in der Regel mehr Zahlen aus den die Siebungen mit p1, …, pi − 1 überlebenden Zahlen aus als wir erwarten würden. Asymptotisch überleben nur 0,5 n2/log(n) Zahlen die Siebung, während wir erwarten, dass mehr als 0,56 n2/log(n) Zahlen überleben. Kurz:

Das Sieb des Eratosthenes siebt stärker als gedacht.

 Das Phänomen lässt sich wahrscheinlichkeitstheoretisch formulieren und erklären: Die Wahrscheinlichkeit, dass eine zufällig ausgewählte natürliche Zahl durch 2 teilbar ist, ist 1/2. Allgemein ist die Wahrscheinlichkeit, dass eine zufällige natürliche Zahl durch p teilbar ist, gleich 1/p. Damit ist 1 − 1/p die Wahrscheinlichkeit einer Zufallszahl, nicht durch p teilbar zu sein. Nehmen wir nun an, dass die Ereignisse, nicht durch eine Primzahl p teilbar zu sein, unabhängig voneinander sind, so erhalten für das Ereignis, dass eine Zufallszahl relativ prim zu allen Primzahlen kleinergleich n ist, Produkte der oben betrachteten Form. Der Satz von Mertens zeigt, dass die Annahme der Unabhängigkeit bei dieser Berechnung der Anzahl der Primzahlen zu einem Fehler führt, und er gibt diesen Fehler genau an.

 Dass unser Ansatz die Primzahlen in einem Intervall 2, …, n2 überschätzt, wird erst für relativ große n sichtbar. Für n = 100 sieben wir mit den ersten 25 Primzahlen p1 = 2, p2 = 3, …, p24 = 89, p25 = 97. Für i = 0, …, 25 setzen wir

ai  =  „die Anzahl der Zahlen nach der i-ten Siebung“,

bi  =  „die gerundete Zahl n2 1 ≤ j ≤ i (1 − 1/pj)“.

Die Zahlen ai protokollieren die Durchführung des Siebs des Eratosthenes, die Zahlen bi sind Schätzwerte für die ai entsprechend unserer Heuristik. Die folgende Tabelle für n = 100 zeigt: Ab etwa der Hälfte des Verfahrens überschätzt unsere Heuristik die Anzahl der Primzahlen, am Ende wird sie unterschätzt.

n = 100:  Siebung mit

ai

bi

Differenz

9999

10000

−1

2

5000

5000

0

3

3334

3333

1

5

2668

2667

1

7

2288

2286

2

11

2081

2078

3

13

1922

1918

4

17

1812

1805

7

19

1718

1710

8

23

1642

1636

6

29

1583

1579

4

31

1527

1529

−2

37

1481

1487

−6

41

1440

1451

−11

43

1403

1417

−14

47

1370

1387

−17

53

1343

1361

−18

59

1320

1338

−18

61

1299

1316

−17

67

1282

1296

−14

71

1267

1278

−11

73

1255

1260

−5

79

1246

1245

1

83

1238

1230

8

89

1232

1216

16

97

1229

1203

26

Für größere n zeigt sich die Überschätzung wie im Satz von Mertens auch am Ende:

n = 500a95  =  π(5002)  =  22044,  bn  =  22402
n = 1000a168  =  π(10002)  =  78498,  bn  =  80965
n = 1000000a78498  =  π(10000002)  =  37607912018,  bn  =  40638210172

Korrelationen

 Im Hinblick auf die wahrscheinlichkeitstheoretische Interpretation bietet es sich an, bei festem n und Primzahlen p in { 1, …, n } die Zufallsvariablen

Xp : { 1, …, n2 }  { 0, 1 } mit

Xp(k) = 1, falls p ein Teiler von k ist,  Xp(k) = 0, sonst

auf ihre Korrelation

ρ(Xp, Xq)  =  E((XpE(Xp))(XqE(Xq)))Var(Xp)Var(Xq)

zu untersuchen. Für n = 10 erhalten wir für die vier Siebungsprimzahlen p1 = 2, p2 = 3, p3 = 5, p4 = 7 die folgende Korrelationsmatrix (mit gerundeten Korrelationskoeffizienten):

(ρ(Xpi, Xpj))1 ≤i, j ≤4  =  10.021000.02110.0320.03800.03210.05800.0380.0581

Die Korrelationskoeffizienten sind sehr klein, sodass die Zufallsvariablen „fast“ unabhängig sind. Auch für n = 100 und das Intervall von 1 bis 10000 sind die Koeffizienten klein. Der minimale und maximale Korrelationskoeffizient außerhalb der Diagonale der (25 x 25)-Matrix (mit 25 = π(100)) berechnet sich mit Hilfe eines Computer zu

ρ(X61, X83)  =  − 0,0069  bzw.  ρ(X47, X53)  =  0,000074.

Von den 300 Einträgen oberhalb der Diagonale sind 18 positiv, 19 gleich Null und 263 negativ. Für n = 500 erhalten wir die minimalen und maximale Werte

ρ(X251, X499)  =  − 0,0014  bzw.  ρ(X53, X131)  =  0,0000025.

Oberhalb der Diagonale der (95x95)-Matrix (mit 95 = π(500)) sind 117 Koeffizienten positiv, 31 gleich Null und 4317 negativ.

 Ist n gegeben und sind p, q ≤ n prim, so bedeutet ein negatives Vorzeichen von ρ(Xp, Xq), dass die Teilbarkeitseigenschaften einer Zahl k im Intervall von 1 bis n2 bzgl. p und q eher einander entgegengesetzt als einander entsprechend sind. Viele negative Koeffizienten zusammen mit wenigen und sehr kleinen positiven Koeffizienten liefern damit eine Erklärung, warum beim Sieb des Eratosthenes mehr Zahlen ausgesiebt werden als es die Heuristik erwarten lässt. Warum die Vorzeichen der Koeffizienten derart verteilt sind, bleibt selbst erklärungsbedürftig.