Kritische Punkte und der Satz von Darboux
Im letzten Kapitel hatten wir gesehen, dass die Ableitung f ′ einer Funktion f eine Unstetigkeit der zweiten Art aufweisen kann (f (x) = x2 sin(1/x) mit f (0) = 0). Nun wollen wir zeigen, dass f ′ keine Unstetigkeitsstelle der ersten Art besitzt. Eine Ableitung kann also keinen Sprung machen, und damit gilt ein Nullstellen-, Zwischenwert- und Intervallsatz für f ′.
Der Nullstellensatz für eine stetige Funktion f auf einem kompakten Intervall [ a, b ] besagt: Haben f (a) und f (b) verschiedene Vorzeichen, so existiert eine Nullstelle von f. Anschaulich müssen wir auf dem Weg von a nach b irgendwann die x-Achse schneiden. Für eine differenzierbare Funktion f auf einem kompakten Intervall [ a, b ] ist die folgende Aussage ähnlich anschaulich:
Gilt f′(a) > 0 und f′(b) < 0, so beginnt ein durch f beschriebener Höhenweg von f (a) nach f (b) mit einem Anstieg, und er endet mit einem Abstieg. Dazwischen erreichen wir irgendwann eine maximale Höhe, und dort besitzt die Tangente an f die Steigung 0, da wir sonst weiter steigen würden. Also existiert ein p ∈ ] a, b [ mit f′(p) = 0.
Analoge Überlegungen gelten für die andere Vorzeichenwahl der Ableitungen an den Randpunkten.
Für unsere Überlegungen ist nützlich:
Definition (kritischer Punkt)
Sei f : P → ℝ differenzierbar in p ∈ P. Dann heißt p ein kritischer Punkt von f, falls f ′(p) = 0.
Die kritischen Punkte von f : P → ℝ sind genau die Stellen, an denen die Tangente an f die Steigung 0 besitzt. Ein p ∈ P ist also genau dann kritisch, wenn
f (x) = f (p) + o(x − p) für x → p.
Beispiele
(1) | Die Funktion sq : ℝ → ℝ mit sq(x) = x2 hat genau den Nullpunkt als kritischen Punkt (da d/dx x2 = 2x). Dort nimmt f ihr Minimum an. |
(2) | Die Funktion f : ℝ → ℝ mit f (x) = x3 hat ebenfalls genau den Nullpunkt als kritischen Punkt (da d/dx = 3x2). An dieser Stelle nimmt f weder ihr Maximum noch ihr Minimum an. |
(3) | Die kritischen Punkte der Kosinusfunktion sind die Nullstellen des Sinus (da d/dx cos(x) = − sin(x)), also die ganzzahligen Vielfachen von π. |
Um unsere Anschauung über f ′ zu beweisen, betrachten wir die Tangente an f in einem Extremum.
Satz (Tangentensteigung an Extremalstellen)
Sei f : ] a, b [ → ℝ differenzierbar, und f nehme in p ∈ ] a, b [ ihr Maximum oder ihr Minimum an. Dann ist p ein kritischer Punkt von f.
Beweis
Wir nehmen zunächst an, dass f in p ihr Maximum annimmt. Dann gilt:
f (x) ≤ f (p) für alle x ∈ ] a, b [.
Aufgrund der Differenzierbarkeit von f in p gilt also:
f ′(p) = limx ↑ p f (x) − f (p)x − p ≥ 0,(Zähler ≤ 0, Nenner negativ)
f ′(p) = limx ↓ p f (x) − f (p)x − p ≤ 0.(Zähler ≤ 0, Nenner positiv)
Denn in der ersten Abschätzung sind alle Differenzenquotienten größergleich 0, während sie in der zweiten Abschätzung kleinergleich 0 sind. Also ist f ′(p) = 0.
Der Beweis bei Annahme des Minimums wird analog geführt.
Eine Vorzeichenanalyse von Differenzenquotienten wie in diesem Beweis wird im Folgenden noch häufiger auftreten.
Bei Randextrema muss f keine kritischen Punkte besitzen.
Die offene Form ] a, b [ des Definitionsbereichs ist wesentlich. Im Beweis haben wir den links- und rechtsseitigen Grenzwert herangezogen, um f ′(p) = 0 zu folgern. Dieses Argument versagt für die Randpunkte des Definitionsbereichs. Der Satz ist ja zum Beispiel für die Identität auf [ 0, 1 ] nicht richtig. Diese Funktion besitzt ein Minimum in 0 und ein Maximum in 1, aber ihre Ableitung ist konstant gleich 1 und damit frei von Nullstellen. Andererseits ist ein kompakter Definitionsbereich [ a, b ] wünschenswert, denn wir wissen, dass eine differenzierbare Funktion wie jede stetige Funktion dort ihr Maximum und ihr Minimum annimmt. Der obige Satz wird mit diesem Wunsch verträglich, wenn wir ausschließen können, dass sich beide Extrema am Rand befinden. Wir erreichen dies durch unterschiedliche Vorzeichen der Ableitung in den Randpunkten:
Satz (Nullstellensatz der Differentialrechnung)
Sei f : [ a, b ] → ℝ differenzierbar, und f ′(a) und f ′(b) haben verschiedene Vorzeichen (mit f ′(a), f ′(b) ≠ 0). Dann gilt:
(a) | Ist f ′(a) > 0 > f ′(b), so nimmt f in ] a, b [ ihr Maximum an. |
(b) | Ist f ′(a) < 0 < f ′(b), so nimmt f in ] a, b [ ihr Minimum an. |
Insbesondere besitzt f einen kritischen Punkt in ] a, b [.
Beweis
Es gelte zunächst f ′(a) > 0 und f ′(b) < 0. Wir zeigen, dass f ihr Maximum in ] a, b [ annimmt. Da f stetig ist, nimmt f ihr Maximum in einem Punkt p ∈ [ a, b ] an. Wegen
f ′(a) = limx ↓ a f (x) − f (a)x − a > 0
gibt es ein x mit f (x) > f (a), sodass also p ≠ a. Analog gilt p ≠ b. Also ist p ∈ ] a, b [ und damit gilt f ′(p) = 0 nach dem obigen Satz.
Analog zeigt man, dass f ihr Minimum in ] a, b [ annimmt, wenn f ′(a) < 0 und f ′(b) > 0.
Eine positive Tangentensteigung in a erzwingt eine positive Sekantensteigung und damit ein x mit der Eigenschaft f (x) > f (a).
Wie für stetige Funktionen erhalten wir aus dem Nullstellensatz einen allgemeineren Zwischenwertsatz:
Satz (Zwischenwertsatz der Differentialrechnung)
Sei f : [ a, b ] → ℝ differenzierbar, und sei y ∈ ℝ derart, dass y zwischen f ′(a) und f ′(b) liegt. Dann existiert ein p ∈ ] a, b [ mit f ′(p) = y.
Beweis
Wir definieren g : [ a, b ] → ℝ durch
g(x) = f (x) − yx für alle x ∈ [ a, b ].
Dann ist g differenzierbar mit
g′(x) = f ′(x) − y für alle x ∈ [ a, b ].
Da y zwischen f ′(a) und f ′(b) liegt, haben g′(a) und g′(b) verschiedene Vorzeichen (mit g′(a), g′(b) ≠ 0), Also gibt es ein p ∈ ] a, b [ mit g′(p) = 0. Dann gilt aber
f ′(p) = g′(p) + y = y.
Wie für die stetigen Funktionen erhalten wir, dass die Ableitung Intervalle in Intervalle überführt:
Korollar (Satz von Darboux, Intervallsatz der Differentialrechnung)
Sei I ein Intervall, und sei f : I → ℝ differenzierbar. Dann ist der Wertebereich f ′ [ I ] = { f ′(x) | x ∈ I } von f ′ ein Intervall.
Bemerkung
Hier kann I kompakt und f ′[ I ] unbeschränkt sein (f (x) = x2 sin(1/x2) mit f (0) = 0, vgl. die Beispiele im letzten Kapitel). Die Ableitung nimmt auch auf einem kompakten Intervall nicht notwenig ihr Minimum und Maximum an.
Obwohl also die Ableitung einer Funktion nicht notwendig stetig ist, kann sie keine Werte überspringen. Umgekehrt heißt das, dass zu einer Funktion f, die Werte überspringt, keine Funktion F mit F′ = f existieren kann. Solche Stammfunktionen F einer Funktion f werden wir in der Integrationstheorie im zweiten Band genauer untersuchen. Die hier bewiesenen Sätze zeigen, dass der Nullstellen- und Zwischenwertsatz für jede Funktion f : [ a, b ] → ℝ richtig sind, für die eine Stammfunktion F existiert. Wir werden in der Integrationstheorie sehen, dass jede stetige Funktion auf einem kompakten Intervall eine Stammfunktion besitzt. Damit sind die obigen Sätze echte Verallgemeinerungen des Nullstellen- und des Zwischenwertsatzes für stetige Funktionen.