4. Partielle Ableitungen
Wir gehen nun der Frage nach, wie wir im Fall der Differenzierbarkeit die Einträge einer Jacobi-Matrix
Jf (p) = (ai j)i j = (ai j)1 ≤ i ≤ m, 1 ≤ j ≤ n
bestimmen können. Betrachten wir den Fall n = 2, m = 1 und eine Tangentialebene, so sehen wir, dass wir die Frage mit Hilfe der lokalen Steigungen von f im Punkt p in Richtung der Koordinatenachsen beantworten können. Denn die Tangentialebene − und damit die Jacobi-Matrix − ist durch diese Steigungen eindeutig bestimmt. Allgemeiner genügt es, die lokalen Steigungen in zwei linear unabhängigen Richtungen zu kennen. Wir konzentrieren uns aber zunächst auf die Achsen.
Definition (partielle Differenzierbarkeit einer reellwertigen Funktion)
Sei f : P → ℝ, P ⊆ ℝn, und seien p ∈ P und 1 ≤ j ≤ n. Dann heißt f im Punkt p in der j-ten Koordinate partiell differenzierbar, falls
a = limh → 0 f (p + h ej) − f (p)h
existiert, wobei ej der j-te kanonische Einheitsvektor im ℝn ist. Die reelle Zahl a heißt die j-te partielle Ableitung von f im Punkt p, und wir schreiben
∂jf (p) = ∂f∂xj(p) = ∂∂xjf (p) = a.
Existiert die partielle Ableitung von f in p für alle Koordinaten j, so heißt f partiell differenzierbar in p. Ist f partiell differenzierbar in allen p ∈ P, so heißt f partiell differenzierbar. Für 1 ≤ j ≤ n heißt dann
∂j f : P → ℝ oder ∂∂xj f : P → ℝ
die j-te partielle Ableitung von f oder die Ableitung von f in der Koordinate j.
Sind alle ∂j f stetig in p ∈ P, so heißt f stetig partiell differenzierbar in p. Gilt dies für alle p ∈ P, so heißt f stetig partiell differenzierbar.
Die reelle Zahl ∂j f (p) gibt also die Steigung der reellwertigen Funktion f im Punkt p in Richtung der j-ten Koordinatenachse an. Eine partielle Ableitung ist eine gewöhnliche eindimensionale Ableitung, wobei wir alle bis auf eine Koordinate festhalten. Wir zeichnen ein xj als Variable aus und betrachten alle anderen Variablen der Funktion f zwischenzeitlich als Parameter. Gegeben p = (p1, …, pn) und eine Koordinate j, bilden wir nun den Limes der Differenzenquotienten
f (p1, …, pj − 1, pj + h, pj + 1, …, pn) − f (p1, …, pn)h, h gegen 0. |
Definieren wir also g : ] pj − ε, pj + ε [ → ℝ für ein hinreichend kleines ε > 0 durch
g(x) = f (p1, …, pj − 1, x, pj + 1, …, pn) für alle x mit |x − pj| < ε,
so gilt ∂jf (p) = g′(pj).
Für m = 2 verwenden wir oft wieder x, y statt x1, x2 sowie ∂f/∂x, ∂f/∂y statt ∂1f, ∂2f. Analoges gilt für m = 3 und andere Variablennamen.
f(x, y) = 3 exp(−2x2 − y2/4), p = (1/2, −1)
g(x) = f(x, −1)
h(y) = f(1/2, y)
∂1f (p) ist die Ableitung von g im Punkt 1/2, ∂2f (p) die von h im Punkt −1.
Beispiel
Sei P = { (x, y, z) ∈ ℝ3 | y ≠ 0 }. Wir definieren f : P → ℝ durch
f(x, y, z) = x + y z2 + xy für alle (x, y, z) ∈ P.
Dann gilt für alle p = (x, y, z) ∈ P:
∂f∂x (p) = 1 + 1y, ∂f∂y (p) = z2 − xy2, ∂f∂z (p) = 2yz.
Die Funktion f ist also stetig partiell differenzierbar.
Die Begriffsbildung können wir sehr einfach auf mehrdimensionale Wertebereiche erweitern:
Definition (partielle Differenzierbarkeit einer mehrdimensionalen Funktion)
Ein f : P → ℝm heißt partiell differenzierbar, wenn alle Komponenten f1, …, fm von f partiell differenzierbar sind. Sind alle Komponenten stetig partiell differenzierbar (in p), so heißt f stetig partiell differenzierbar (in p).
Nach diesen Vorbereitungen können wir nun die Einträge der Jacobi-Matrix bestimmen.
Satz (Identifikation der Jacobi-Matrix)
Sei f : P → ℝm in p ∈ P differenzierbar, und sei
Jf (p) = (ai j)1 ≤ i ≤ m, 1 ≤ j ≤ n
die Jacobi-Matrix von f im Punkt p. Dann ist f partiell differenzierbar in p, und es gilt
ai j = ∂j fi (p) = ∂fi∂xj (p) für alle 1 ≤ i ≤ m und 1 ≤ j ≤ n.
Ist f reellwertig, so gilt für die (1 × n)-Matrix Jf(p):
Jf(p) = =
Beweis
Da die Jacobi-Matrix von f im Punkt p zeilenweise aus den Jacobi-Matrizen der Komponenten f1, …, fm von f im Punkt p aufgebaut ist, genügt es, die Aussage für den Fall m = 1 zu beweisen. Sei also f : P → ℝ und
A = Jf(p) = .
Weiter sei r : P → ℝ mit
f (x) = f (p) + A(x − p) + r(x) für alle x ∈ P, limx → p r(x)∥ x − p ∥ = 0.
Damit gilt für jedes 1 ≤ j ≤ n:
∂jf (p) | = limh → 0 f (p + h ej) − f (p)h = limh → 0 A (hej) + r(p + hej)h |
= A ej + limh → 0 r(p + hej)h = a1j + 0 = a1j. |
Für Höhenlandschaften (n = 2 und m = 1) ist das Ergebnis sehr anschaulich: Ist g : ℝ2 → ℝ eine Ebene mit g(x, y) = c + (a b)(x, y) = c + ax + by, so sind a und b die Steigungen der Ebene in x- bzw. y-Richtung. Ist die Ebene tangential zu f im Punkt p, so gilt a = ∂1f (p), b = ∂2f (p), sodass Jf(p) = (∂1f (p) ∂2f (p)).
In voller Schönheit lautet die Jacobi-Matrix:
Jf(p) | = (aij)1 ≤ i ≤ m, 1 ≤ j ≤ n = (aij)i,j = (∂j fi(p))i, j |
= |
Die Jacobi-Matrix von f wird also aus allen partiellen Ableitungen der Komponenten gebildet. Die Berechnung von nm Ableitungen ist für große n und m sehr aufwendig, aber prinzipiell genügt die eindimensionale Differentialrechnung, um die Jacobi-Matrix Zeile für Zeile zu füllen.
Explizit halten wir folgende Umformulierung eines Spezialfalls der mehrdimensionalen Kettenregel fest:
Korollar (Kettenregel für reellwertige Verknüpfungen)
Seien f : P → ℝd und g : Q → ℝ mit P ⊆ ℝn und f[ P ] ⊆ Q ⊆ ℝd. Ist dann f differenzierbar in p ∈ P und g differenzierbar in f (p), so gilt
∂j (g ∘ f) (p) = ∑1 ≤ k ≤ d ∂k g (f (p)) ∂jfk(p) für alle 1 ≤ j ≤ n.
Beweis
Wir halten fest:
Jg(f (p)) | = (∂kg(f (p)))1, 1 ≤ k ≤ d | ist eine (1 × d)-Matrix |
Jf (p) | = (∂jfk(p))1 ≤ k ≤ d, 1 ≤ j ≤ n | ist eine (d × n)-Matrix |
Jg ∘ f (p) | = (∂j(g ∘ f) (p))1, 1 ≤ j ≤ n | ist eine (1 × n)-Matrix |
Nach der mehrdimensionalen Kettenregel und der Definition der Matrizenmultiplikation gilt also für alle 1 ≤ j ≤ n
∂j (g ∘ f) (p) = Jg ∘ f(p)1, j = (Jg (f (p)) Jf (p))1, j = ∑1 ≤ k ≤ d ∂k g (f (p)) ∂j fk (p).
Rechts bilden wir dabei „erste (eindeutige) Zeile mal j-te Spalte“.