Das Newton-Verfahren
Wir stellen ein klassisches Verfahren zur Bestimmung von Nullstellen für konvexe oder konkave Funktionen vor (Newton-Verfahren). Durch Übergang zu −f können wir uns auf konvexe Funktionen beschränken. Vorab beobachten wir:
Satz (Nullstellensatz für konvexe Funktionen)
Sei f : [ a, b ] → ℝ stetig und konvex mit f (a) < 0 < f (b). Dann besitzt f eine eindeutige Nullstelle p, und es gilt
f < 0 in [ a, p [, f > 0 in ] p, b ].
Ist f differenzierbar, so gilt f ′ > 0 in [ p, b ].
Eine analoge Aussage gilt, falls f (a) > 0 > f (b).
Beweis
Die Existenz einer Nullstelle folgt aus f (a) < 0 < f (b) und der Stetigkeit von f aus dem Zwischenwertsatz.
Zum Beweis der Eindeutigkeit sei p eine Nullstelle von f. Da f konvex ist, gilt f ≤ fa, p auf [ a, p ]. Wegen f (a) < 0 und f (p) = 0 gilt also
f ≤ fa, p < 0 auf [ a, p [.
Dies zeigt, dass links einer Nullstelle keine weitere Nullstelle liegen kann, woraus die Eindeutigkeit folgt.
Sei also p die eindeutige Nullstelle von f. Wegen f (b) > 0 ist f > 0 in ] p, b ], da sonst f eine weitere Nullstelle in ] p, b ] hätte. Analog ist f < 0 in [ a, p [.
Sei nun f differenzierbar. Da f konvex ist, gilt f ″ ≥ 0 und damit ist f ′ monoton steigend. Es genügt also, f ′(p) > 0 zu zeigen. Wäre aber
f ′(p) ≤ 0,
so wäre f ′ ≤ 0 auf [ a, p ] nach Monotonie von f ′. Dann wäre aber f monoton fallend auf [ a, p ], im Widerspruch zu f (a) < 0 und f (p) = 0.
Das Diagramm suggeriert im Fall der Differenzierbarkeit von f ein approximatives Verfahren zum Auffinden der eindeutigen Nullstelle p von f:
Wir beginnen mit einem beliebigen Startpunkt x0 mit f (x0) ≥ 0, etwa dem rechten Randpunkt x0 = b. Nun legen wir die Tangente g0 an f im Punkt (x0, f (x0)) an, und berechnen ihren Schnittpunkt x1 mit der x-Achse. Ist f identisch mit g0 auf [ x1, x0 ], so haben wir die Nullstelle p bereits gefunden. Andernfalls führt die Konvexität von f dazu, dass
p < x1 < x0,
und damit ist f (x1) ≥ 0. Nun wiederholen wir das Verfahren mit der Bildung der Tangente g1 an f im Punkt (x1, f (x1)) und erhalten so ein x2 mit x2 = p oder
p < x2 < x1 < x0
usw. Die Schnittpunkte der Tangenten mit der x-Achse sind dabei leicht zu berechnen. Es gilt
g0(x) = f (x0) + f ′(x0) (x − x0) für alle x,
und damit ist
x1 = „die eindeutige Nullstelle von g0“ = x0 − f (x0)f ′(x0).
Analog erhalten wir:
x2 = „die eindeutige Nullstelle von g1“ = x1 − f (x1)f ′(x1).
Diese Überlegungen motivieren die folgende Definition:
Definition (Newton-Iteration)
Sei f : [ a, b ] → ℝ differenzierbar, und sei x0 ∈ [ a, b ]. Wir definieren rekursiv
xn + 1 = xn − f (xn)f ′(xn) für alle n, solange möglich.
Im Fall der Existenz heißt die Folge (xn)n ∈ ℕ die Newton-Iteration von f für den Startpunkt x0.
Der Ausdruck „solange möglich“ beinhaltet zweierlei: Es muss f ′(xn) ≠ 0 gelten und xn muss im Definitionsbereich von f liegen. Unter diesen Voraussetzungen ist xn + 1 definiert. Andernfalls bricht die Rekursion ab.
Wir zeigen nun:
Satz (Konvergenzsatz für die Newton-Iteration für konvexe Funktionen)
Sei f : [ a, b ] → ℝ stetig differenzierbar und konvex mit f (a) < 0 < f (b).
Sei p die eindeutige Nullstelle von f, und sei x0 ein Punkt in [ a, b ] mit
(i) | f (x0) ≥ 0 oder |
(ii) | f (x0) < 0, f ′(x0) > 0, x1 = x0 − f (x0)/f ′(x0) ≤ b. |
Dann existiert die Newton-Iteration (xn)n ∈ ℕ von f für den Startpunkt x0 und es gilt limn xn = p. Ist x0 ≥ p, so ist (xn)n ∈ ℕ monoton fallend. Andernfalls ist x1 ≥ p und (xn)n ≥ 1 monoton fallend.
Eine analoge Aussage gilt, falls f (a) > 0 > f (b).
Beweis
Wir nehmen zunächst (i) an, sodass x0 ≥ p. Die Aussage ist klar für x0 = p, denn dann gilt xn = x0 = p für alle n.
Sei also x0 > p. Sei g0 die Tangente an f im Punkt (x0, f (x0)). Nach dem Tangentenkriterium gilt g ≤ f, und damit gilt p ≤ x1 ≤ x0 für die eindeutige Nullstelle x1 der Geraden g0. Induktiv zeigt diese Überlegung, dass die Newton-Iteration (xn)n ∈ ℕ existiert und dass
p ≤ … ≤ xn ≤ … ≤ x1 ≤ x0.
Sei p* = limn xn = infn xn. Da f und f ′ stetig sind, gilt
p* = limn xn + 1 = limn (xn − f (xn)f ′(xn)) = p* − f (p*)f ′(p*).
Folglich ist f (p*) = 0. Da f nur eine Nullstelle besitzt, ist p = p*.
Gilt (ii), so gilt g0 ≤ f für die Tangente g0 an f im Punkt (x0, f (x0)). Also gilt x1 ≥ p für den Schnittpunkt x1 < b von g0 mit der x-Achse. Damit verläuft die Newton-Iteration ab x1 wie für (i).
Der Leser beachte, dass die Konvergenz im Fall (i) streng monoton ist, solange xn ≠ p gilt. Dies ist immer der Fall, wenn für alle ε > 0 gilt, dass f auf dem Intervall [ p, p + ε ] keine Gerade ist.
Die Newton-Iteration konvergiert im Allgemeinen sehr schnell. Mit Hilfe des Satzes von Taylor werden wir eine Abschätzung für den Fehler xn − p nachreichen können.
Das Verfahren lässt sich insbesondere zur effektiven Berechnung von Wurzeln einsetzen:
Korollar (Wurzelberechnung mit dem Newton-Verfahren)
Seien k ∈ ℕ*, a > 0, und sei f : [ 0, ∞ [ → ℝ die Funktion mit
f (x) = xk − a für alle x ∈ [ 0, ∞ [.
Dann konvergiert die Newton-Iteration von f für jedes x0 > 0 gegen k.
Beweis
Für b hinreichend groß erfüllt f | [ 0, b ] die Voraussetzungen des Konvergenzsatzes.
Es gilt also k = limn xn mit einem beliebigen x0 > 0 und der Rekursion
xn + 1 = xn − für alle n.
Für den Fall k = 2 der Berechnung von Quadratwurzeln erhalten wir
xn + 1 = xn − = xn + a/xn2 für alle n.
Damit stimmt die Newton-Iteration für k = 2 und x0 = 0 mit der Heron-Folge für a überein (vgl. 2.1). Eine geometrische Interpretation diskutieren wir in den Ergänzungen E11.
Beispiel
Sei f : [ 0, ∞ [ → ℝ mit f (x) = x2 − x − 1. Für die Newton-Iteration gilt
xn + 1 = xn − xn2 − xn − 12xn − 1 = xn2 + 12xn − 1.
Für den Startwert x0 = 2 erhalten wir
x1 = 53, x2 = 3421, x3 = 1597987 = 1,6180344…
Es gilt f (x) = 0 genau dann, wenn x = 1 + 1/x. Die Werte xn approximieren
Φ = ( + 1)/2 = 1,6180339887…(Goldener Schnitt)