Das Newton-Verfahren

 Wir stellen ein klassisches Verfahren zur Bestimmung von Nullstellen für konvexe oder konkave Funktionen vor (Newton-Verfahren). Durch Übergang zu −f können wir uns auf konvexe Funktionen beschränken. Vorab beobachten wir:

Satz (Nullstellensatz für konvexe Funktionen)

Sei f : [ a, b ]   stetig und konvex mit f (a) < 0 < f (b). Dann besitzt f eine eindeutige Nullstelle p, und es gilt

f  <  0  in  [ a, p [,  f  >  0  in  ] p, b ].

Ist f differenzierbar, so gilt f ′ > 0 in [ p, b ].

Eine analoge Aussage gilt, falls f (a) > 0 > f (b).

Beweis

Die Existenz einer Nullstelle folgt aus f (a) < 0 < f (b) und der Stetigkeit von f aus dem Zwischenwertsatz.

Zum Beweis der Eindeutigkeit sei p eine Nullstelle von f. Da f konvex ist, gilt f ≤ fa, p auf [ a, p ]. Wegen f (a) < 0 und f (p) = 0 gilt also

f  ≤  fa, p  <  0  auf [ a, p [.

Dies zeigt, dass links einer Nullstelle keine weitere Nullstelle liegen kann, woraus die Eindeutigkeit folgt.

Sei also p die eindeutige Nullstelle von f. Wegen f (b) > 0 ist f > 0 in ] p, b ], da sonst f eine weitere Nullstelle in ] p, b ] hätte. Analog ist f < 0 in [ a, p [.

Sei nun f differenzierbar. Da f konvex ist, gilt f ″ ≥ 0 und damit ist f ′ monoton steigend. Es genügt also, f ′(p) > 0 zu zeigen. Wäre aber

f ′(p)  ≤  0,

so wäre f ′ ≤ 0 auf [ a, p ] nach Monotonie von f ′. Dann wäre aber f monoton fallend auf [ a, p ], im Widerspruch zu f (a) < 0 und f (p) = 0.

analysis1-AbbID159

 Das Diagramm suggeriert im Fall der Differenzierbarkeit von f ein approximatives Verfahren zum Auffinden der eindeutigen Nullstelle p von f:

 Wir beginnen mit einem beliebigen Startpunkt x0 mit f (x0) ≥ 0, etwa dem rechten Randpunkt x0 = b. Nun legen wir die Tangente g0 an f im Punkt (x0, f (x0)) an, und berechnen ihren Schnittpunkt x1 mit der x-Achse. Ist f identisch mit g0 auf [ x1, x0 ], so haben wir die Nullstelle p bereits gefunden. Andernfalls führt die Konvexität von f dazu, dass

p  <  x1  <  x0,

und damit ist f (x1) ≥ 0. Nun wiederholen wir das Verfahren mit der Bildung der Tangente g1 an f im Punkt (x1, f (x1)) und erhalten so ein x2 mit x2 = p oder

p  <  x2  <  x1  <  x0

usw. Die Schnittpunkte der Tangenten mit der x-Achse sind dabei leicht zu berechnen. Es gilt

g0(x)  =  f (x0)  +  f ′(x0) (x − x0)  für alle x,

und damit ist

x1  =  „die eindeutige Nullstelle von g0“  =  x0  −  f (x0)f ′(x0).

Analog erhalten wir:

x2  =  „die eindeutige Nullstelle von g1“  =  x1  −  f (x1)f ′(x1).

analysis1-AbbID160

 Diese Überlegungen motivieren die folgende Definition:

Definition (Newton-Iteration)

Sei f : [ a, b ]   differenzierbar, und sei x0  ∈  [ a, b ]. Wir definieren rekursiv

xn + 1  =  xn  −  f (xn)f ′(xn)  für alle n, solange möglich.

Im Fall der Existenz heißt die Folge (xn)n  ∈   die Newton-Iteration von f für den Startpunkt x0.

 Der Ausdruck „solange möglich“ beinhaltet zweierlei: Es muss f ′(xn) ≠ 0 gelten und xn muss im Definitionsbereich von f liegen. Unter diesen Voraussetzungen ist xn + 1 definiert. Andernfalls bricht die Rekursion ab.

 Wir zeigen nun:

Satz (Konvergenzsatz für die Newton-Iteration für konvexe Funktionen)

Sei f : [ a, b ]   stetig differenzierbar und konvex mit f (a) < 0 < f (b).

Sei p die eindeutige Nullstelle von f, und sei x0 ein Punkt in [ a, b ] mit

(i)

f (x0)  ≥  0  oder

(ii)

f (x0)  <  0,  f ′(x0)  >  0,  x1  =  x0  −  f (x0)/f ′(x0)  ≤  b.

Dann existiert die Newton-Iteration (xn)n  ∈   von f für den Startpunkt x0 und es gilt limn xn = p. Ist x0 ≥ p, so ist (xn)n  ∈   monoton fallend. Andernfalls ist x1 ≥ p und (xn)n ≥ 1 monoton fallend.

Eine analoge Aussage gilt, falls f (a) > 0 > f (b).

Beweis

Wir nehmen zunächst (i) an, sodass x0 ≥ p. Die Aussage ist klar für x0 = p, denn dann gilt xn = x0 = p für alle n.

Sei also x0 > p. Sei g0 die Tangente an f im Punkt (x0, f (x0)). Nach dem Tangentenkriterium gilt g ≤ f, und damit gilt p ≤ x1 ≤ x0 für die eindeutige Nullstelle x1 der Geraden g0. Induktiv zeigt diese Überlegung, dass die Newton-Iteration (xn)n  ∈   existiert und dass

p  ≤  …  ≤  xn  ≤  …  ≤  x1  ≤  x0.

Sei p* = limn xn = infn xn. Da f und f ′ stetig sind, gilt

p*  =  limn xn + 1  =  limn (xn  −  f (xn)f ′(xn))  =  p*  −  f (p*)f ′(p*).

Folglich ist f (p*) = 0. Da f nur eine Nullstelle besitzt, ist p = p*.

Gilt (ii), so gilt g0 ≤ f für die Tangente g0 an f im Punkt (x0, f (x0)). Also gilt x1 ≥ p für den Schnittpunkt x1 < b von g0 mit der x-Achse. Damit verläuft die Newton-Iteration ab x1 wie für (i).

 Der Leser beachte, dass die Konvergenz im Fall (i) streng monoton ist, solange xn ≠ p gilt. Dies ist immer der Fall, wenn für alle ε > 0 gilt, dass f auf dem Intervall [ p, p + ε ] keine Gerade ist.

 Die Newton-Iteration konvergiert im Allgemeinen sehr schnell. Mit Hilfe des Satzes von Taylor werden wir eine Abschätzung für den Fehler xn − p nachreichen können.

 Das Verfahren lässt sich insbesondere zur effektiven Berechnung von Wurzeln einsetzen:

Korollar (Wurzelberechnung mit dem Newton-Verfahren)

Seien k  ∈  *, a > 0, und sei f : [ 0, ∞ [   die Funktion mit

f (x)  =  xk  −  a  für alle x  ∈  [ 0, ∞ [.

Dann konvergiert die Newton-Iteration von f für jedes x0 > 0 gegen ka.

Beweis

Für b hinreichend groß erfüllt f | [ 0, b ] die Voraussetzungen des Konvergenzsatzes.

Es gilt also ka  =  limn xn mit einem beliebigen x0 > 0 und der Rekursion

xn + 1  =  xn  −  xnkakxnk1  für alle n.

Für den Fall k = 2 der Berechnung von Quadratwurzeln erhalten wir

xn + 1  =  xn  −  xn2a2xn  =  xn  +  a/xn2  für alle n.

Damit stimmt die Newton-Iteration für k = 2 und x0 = 0 mit der Heron-Folge für a überein (vgl. 2.1). Eine geometrische Interpretation diskutieren wir in den Ergänzungen E11.

Beispiel

Sei f : [ 0, ∞ [   mit f (x) = x2 − x − 1. Für die Newton-Iteration gilt

xn + 1  =  xn  −  xn2 − xn − 12xn − 1  =  xn2 + 12xn − 1.

Für den Startwert x0 = 2 erhalten wir

x1  =  53,  x2  =  3421,  x3  =  1597987  =  1,6180344…

Es gilt f (x) = 0 genau dann, wenn x = 1 + 1/x. Die Werte xn approximieren

Φ  =  (5 + 1)/2  =  1,6180339887…(Goldener Schnitt)