Bedingte Extremalstellen und Lagrange-Multiplikatoren

 Wir untersuchen nun lokale Extremalstellen einer Funktion f : P  , die einer bestimmten Nebenbedingung genügen. Gegeben ist zusätzlich zu f eine Funktion g : P  . Für ein festes c  ∈   betrachten wir die Niveaumenge

N  =  nivg(c)  =  { x  ∈  P | g(x) = c }.

Die Frage lautet:

In welchen Punkten p  ∈  N besitzt die Funktion f|N : N  

ein lokales Maximum oder Minimum ?

Eine lokale Minimalstelle von f|N ist zum Beispiel ein Punkt p  ∈  N derart, dass ein ε > 0 existiert, sodass f (x) ≥ f (p) für alle x  ∈  Uε(p) ∩ N.

analysis2-AbbID510

Das Diagramm zeigt eine Höhenlandschaft f und eine dickere Linie, die das f-Bild einer Höhenlinie N einer (nicht dargestellten) zweiten Funktion g ist. Anschaulich fragen wir nach den lokalen Extremwerten der Wanderung entlang des Pfades f[ N ].

 Für die Dimension n = 2, auf die wir uns hier konzentrieren wollen, lässt sich die Frage weiter motivieren. In einem metreologischen Kontur-Plot kann zum Beispiel die Funktion g die Höhe über dem Meeresspiegel angeben und die Funktion f die aktuelle Temperatur. Wir betrachten nun eine bestimmte Höhe c und fragen, an welchen Punkten der Höhe c die aktuelle Temperatur lokal minimal oder maximal ist.

 Manchmal ist ein eindimensionaler Ansatz zur Beantwortung der Frage möglich. Ist die Höhenlinie N ein „deformierter Kreis“ und h : [ 0, 2π ]  N eine geschlossene, differenzierbare und auf [ 0, 2π [ bijektive Kurve, so sind, mit Ausnahme der Randpunkte 0 und 2π, die evtl. gesondert untersucht werden müssen, die lokalen Extremalstellen von f|N genau die h-Bilder der lokalen Extremalstellen der reellen Funktion f ∘ h : [ 0, 2π ]  . Ist zum Beispiel t  ∈  ] 0, 2π [ ein striktes lokales Maximum von f ∘ h, so ist h(t)  ∈  N ein striktes lokales Maximum von f|N. Für die Bestimmung der lokalen Extremalstellen von f ∘ h können wir die bekannten eindimensionalen Methoden einsetzen.

 Eine einfache Parametrisierung von N steht aber nicht immer zur Verfügung und wir brauchen dann andere Methoden, um die Frage zu beantworten. Nach unseren bisherigen Erfahrungen mit notwendigen Bedingungen für lokale Extrema ist zu vermuten, dass die Gradienten von f und g eine wichtige Rolle spielen. Eine geometrische Überlegung bringt ans Licht:

Notwendige Bedingung: Berühren der Höhenlinien

Sei p  ∈  N mit grad(f)(p), grad(g)(p) ≠ 0. Steht der Gradient von f in p nicht senkrecht auf der Höhenlinie N, so steigt f an, wenn wir uns von p in Richtung der Projektion des Gradienten auf N bewegen. Da grad(g)(p) senkrecht auf N steht, müssen die Vektoren grad(f)(p) und grad(g)(p) in lokalen Extremalstellen auf einer Geraden liegen. Anders formuliert:

Kreuzen sich in p die Höhenlinie N = nivg(c) = nivg(g(p)) von g und die Höhenlinie M = nivf(f (p)) von f, so ist p keine lokale Maximalstelle von f|N. Für solche Maximalstellen ist es notwendig, dass sich die Höhenlinien N und M im Punkt p berühren.

analysis2-AbbID512a
analysis2-AbbID512b

Im ersten Diagramm berühren sich die Höhenlinien N und M in p, sodass p ein Kandidat für eine lokale Extremalstelle von f|N ist. Im zweiten Diagramm kreuzen sich dagegen die beiden Höhenlinien in p. Der Gradient von f hat dort eine nichtverschwindende Projektion auf die Tangente von N in p. Bewegen wir uns von p ausgehend auf N in Richtung bzw. Gegenrichtung zu dieser Projektion, so nimmt f zu bzw. ab. Damit kann p keine lokale Extremalstelle von f|N sein.

 Dass diese Überlegung korrekt ist, zeigt der folgende Satz:

Satz (Multiplikatorregel von Lagrange, Spezialfall)

Seien f, g : P  , P ⊆ 2, stetig differenzierbar, c  ∈  , N = nivg(c) und p  ∈  N derart, dass grad(g)(p) ≠ 0 und f|N eine lokale Extremalstelle in p besitzt. Es gebe eine stetig differenzierbare Kurve h : ] − ε, ε [  N mit

h(0)  =  p  und  h′(p)  ≠  0.

Dann existiert ein λ mit grad(f)(p)  +  λ grad(g)(p)  =  0.

Beweis

Die reelle Funktion f ∘ h hat eine lokale Extremalstelle im Punkt 0, also gilt (f ∘ h)′(0) = 0 nach dem notwendigen eindimensionalen Kriterium. Nach der Kettenregel gilt damit

0  =  (f ∘ h)′(0)  =  Jf(p) h′(0)  =  〈 grad(f)(p), h′(0) 〉.

Die reelle Funktion g ∘ h ist konstant gleich c, sodass

0  =  (g ∘ h)′(0)  =  Jg(p) h′(0)  =  〈 grad(g)(p), h′(0) 〉.

Damit stehen sowohl grad(f)(p) als auch grad(g)(p) ≠ 0 senkrecht auf h′(0) ≠ 0, sodass grad(f)(p) ein skalares Vielfaches von grad(g)(p) ist.

 Ein λ wie im Satz heißt auch ein Lagrange-Multiplikator für f und g im Punkt p. Wir werden das Resultat gleich noch verbessern und verallgemeinern. Speziell werden wir zeigen, dass h unter den übrigen Voraussetzungen immer existiert. Zunächst wollen wir das Ergebnis noch einmal in anderer Form aufschreiben.

Korollar (Multiplikatoransatz)

Seien f, g, N, p  ∈  N wie oben. Für alle λ  ∈   sei hλ : P   definiert durch

hλ(x)  =  f (x)  +  λ g(x)  für alle x  ∈  P.

Dann gibt es ein λ mit grad(hλ)(p) = 0.

Beweis

Dies folgt aus dem Satz wegen grad(hλ) = grad(f) + λ grad(g).

 In der Praxis bedeutet dies: Kandidaten für bedingte Extremalstellen können durch Einführung einer Variablen λ und Lösen des Gleichungssystems

grad(f + λ g)(x)  =  0,  g(x)  =  c  (mit N = nivg(c))

in den Variablen x  ∈  n und λ  ∈   gefunden werden.

Beispiel

Sei f : 2   definiert durch f(x, y) = xy. Weiter sei g : 2   mit g(x, y) = ∥ (x, y) ∥2. Wir suchen die lokalen Extremalstellen von f auf der Kreislinie S1 = nivg(1). Es gilt

grad(f)(x, y)  =  (y, x),  grad(g)(x, y)  =  2 (x, y)  für alle (x, y)  ∈  2.

Damit ist für eine lokale Extremalstelle (x, y) von f|S1 notwendig, dass ein λ existiert mit

grad(f + λ g)(x, y)  =  (y, x)  +  2 λ (x, y)  =  0,  x2 + y2  =  1, 

d. h., es muss gelten

(+)  y  +  2 λ x  =  0,  x  +  2 λ y  =  0,  x2  +  y2  =  1.

Dieses Gleichungssystem hat in (x, y, λ) mit w = 1/2 die vier Lösungen

(w, w, −1/2),  (−w, w, 1/2),  (−w, −w, −1/2),  (w, −w, 1/2).

Damit sind also höchstens die vier Punkte

p1  =  (w, w),  p2  =  (w, −w),  p3  =  (−w, w),  p4  =  (−w, −w)

lokale Extremalstellen von f|S1. Diese Kandidaten liefert auch der alternative Ansatz, die Kreislinie durch h(t) = ei t = (cos(t), sin(t)) zu parametrisieren. Zu lösen ist hier die Gleichung

d/dt (cos(t) sin(t))  =  0,  d. h.  cos2(t) − sin2(t)  =  0,  d. h.  cos(2t)  =  0.

Die Gleichung cos(2t) = 0 wird im Intervall [ 0, 2π [ genau durch

tk  =  2k + 14 π  mit  k = 0, 1, 2, 3

gelöst. Damit haben wir die vier mit der Multiplikatormethode gefundenen Kandidaten wiedergefunden:

analysis2-AbbID514b

(w, w)  =  ei t1,  (−w, w)  =  ei t2,

(−w, −w)  =  ei t3,  (w, −w)  =  ei t4.

Erst zusätzliche Überlegungen zeigen, dass tatsächlich lokale Maxima und Minima von f auf S1 vorliegen. Das Diagramm rechts zeigt einige Höhenlinien nivf(c) von f sowie S1 von g. Das Berühren in Extremalstellen ist sichtbar und es lässt sich auch einsehen, dass p1 und p3 bedingte lokale Maxima und p2 und p4 bedingte lokale Minima sind. Das Gleiche gilt für das zweite Diagramm, das f in einer kreisförmigen Umgebung von S1 zeigt.

analysis2-AbbID514a

Wir werden später ein hinreichendes allgemeines Kriterium angeben, das sich auf den vorliegenden Fall anwenden lässt.