Kriterien der Konvexität
Sehr nützlich ist ein Steigungskriterium, das auf der folgenden Beobachtung beruht: Sind g und h Geraden der Steigung a bzw. b, die an der Stelle p übereinstimmen, so gilt a ≥ b genau dann, wenn g(x) ≥ h(x) für alle x > p (und genau dann, wenn g(x) ≤ h(x) für alle x < p). In dieser Äquivalenz kann „für alle x > p“ sogar durch „für ein x > p“ ersetzt werden. Damit können wir zeigen:
Satz (Steigungskriterium)
Sei f : I → ℝ. Dann sind äquivalent:
(a) | f ist konvex. |
(b) | Für alle p < q < r in I gilt a(p, q) ≤ a(p, r) ≤ a(q, r). |
(c) | Für alle p < q < r in I gilt a(p, q) ≤ a(q, r). |
Analoge Aussagen gelten für streng konvexe, konkave und streng konkave Funktionen mit <, ≥ bzw. > in (b) und (c).
zur Bedingung (b) des Steigungskriteriums
Beweis
(a) impliziert (b):
Seien p < q < r in I. Es gilt fp, q(p) = f (p) = fp, r(p) und
fp, q(q) = f (q) ≤ fp, r(q)
nach Konvexität von f. Hieraus folgt (nach der Vorüberlegung):
a(p, q) ≤ a(p, r).
Die zweite Ungleichung ergibt sich analog.
(b) impliziert (c):
Ist trivial.
(c) impliziert (a):
Seien p < q < r drei Punkte in I. Wegen a(p, q) ≤ a(q, r) gilt
fp, q(r) ≤ fq, r(r) = f (r) = fp, r(r).
Folglich ist a(p, q) ≤ a(p, r) und damit
f (q) = fp, q(q) ≤ fp, r(q).
Dies zeigt, dass f konvex ist.
Eine Umformulierung der Äquivalenz von (a) und (b) ist:
Korollar (Monotonie der Sekantensteigungen)
Eine Funktion f : I → ℝ ist genau dann (streng) konvex, wenn die Sekantensteigungsfunktion a(x, y) (streng) monoton steigend in beiden Variablen ist. Analoges gilt für „(streng) konkav“ mit „(streng) monoton fallend“.
Es genügt die Monotonie in einer der beiden Variablen. Die Monotonie in der zweiten Variablen folgt aus der Symmetrie a(x, y) = a(y, x).
Aus dem Satz ergibt sich weiter die einseitige Differenzierbarkeit einer konvexen oder konkaven Funktion im Inneren ihres Definitionsintervalls:
Korollar (einseitige Differenzierbarkeit konvexer und konkaver Funktionen)
Sei f : I → ℝ konvex, und sei p ∈ I kein Randpunkt von I. Dann existieren die Grenzwerte
− ∞ < limx ↑ p a(x, p) ≤ limx ↓ p a(p, x) < ∞,
d. h., f ist im Punkt p links- und rechtsseitig differenzierbar (und damit insbesondere stetig in p). Die Differenzenquotienten konvergieren monoton steigend von links und monoton fallend von rechts. Ist f streng konvex, so gilt strenge Monotonie. Analoge Eigenschaften gelten für konkave Funktionen.
Ist f : [ c, d ] → ℝ konvex, so existieren zudem eigentlich oder uneigentlich
− ∞ ≤ limx ↓ c a(c, x) ≤ limx ↑ d a(x, d) ≤ ∞.
Der konvexe untere Halbkreis f : [ −1, 1 ] → ℝ mit f (x) = − zeigt, dass die uneigentliche Konvergenz in den Randpunkten eintreten kann. Analoges gilt für die konvexe unstetige Funktion g : [ 0, 1 ] → ℝ mit g(x) = 0 für x ∈ ] 0, 1 [ und den Randwerten g(0) = g(1) = 1.
Mit Hilfe der Monotonie der Sekantensteigungen a(x, y) können wir ein weiteres anschauliches Kriterium für die Konvexität beweisen:
Satz (Geraden- und Tangentenkriterium für Konvexität und Konkavität)
Sei f : I → ℝ mit einem offenen Intervall I. Dann sind äquivalent:
(a) | f ist konvex. |
(b) | Für alle p ∈ I existiert eine Gerade g durch (p, f (p)) mit g ≤ f auf I. |
Genauer ist dann für jedes p ∈ I jede Gerade g durch (p, f (p)) wie in (b), falls für ihre Steigung a gilt:
limx ↑ p a(x, p) ≤ a ≤ limx ↓ p a(p, x).
Ist f differenzierbar, so ist f genau dann konvex, wenn f größergleich jeder ihrer Tangenten ist.
Analoge Aussagen gelten für konkave Funktionen und für die strengen Versionen (mit g(x) < f (x) bzw. g(x) > f (x) für alle x ≠ p in (b)).
Beweis
(a) impliziert (b): Sei also f konvex, und sei p ∈ I. Dann ist
a1 = limx ↑ p a(x, p) ≤ limx ↓ p a(p, x) = a2.
Seien g und h die Geraden durch (p, f (p)) mit den Steigungen a1 bzw. a2. Ist nun x < p in I, so hat fx, p eine Steigung kleinergleich a1. Damit gilt
h(x) ≤ g(x) ≤ fx, p(x) = f (x).
Dies zeigt, dass
f ≥ g ≥ h auf ] −∞, p [ ∩ I.
Analog gilt
f ≥ h ≥ g auf ] p, ∞ [ ∩ I.
Dies zeigt die Aussage (b) und den Zusatz über die Steigungen.
Ist f differenzierbar in p, so gilt a1 = a2 = f ′(p), woraus die Behauptung über die Tangente von f aus dem bereits Bewiesenen folgt.
(b) impliziert (a): Seien p < q < r in I, und sei g eine Gerade durch (q, f (q)) mit g ≤ f auf I. Dann gilt
g(p) ≤ f (p) = fp, r(p), g(r) ≤ f (r) = fp, r(r).
Da g und fp, r Geraden sind, gilt also g(x) ≤ fp, r(x) für alle x in [ p, r ]. Folglich ist f (q) = g(q) ≤ fp, r(q). Dies zeigt, dass f konvex ist.
Der Satz gilt auch für Funktionen f : [ c, d ] → ℝ, falls
limx ↓ c a(c, x) > − ∞ und limx ↑ d a(x, d) < ∞.