7.11 Positive Definitheit
Satz (Charakterisierungen der positiven Definitheit)
Seien n ≥ 1 und A ∈ ℂn × n eine hermitesche Matrix. Dann sind äquivalent:
(a) | A ist positiv definit, d. h., für das kanonische Skalarprodukt auf dem ℂn gilt 〈 z, Az 〉 > 0 für alle z ∈ ℂn − { 0 }. |
(b) | Für die Matrizen Ak = (aij)1 ≤ i, j ≤ k ∈ ℂk × k gilt det(Ak) > 0 für alle 1 ≤ k ≤ n. (Hauptminorenkriterium) |
(c) | A lässt sich durch Multiplikation mit Additionstypen Wij(λ), i > j, in eine Dreiecksmatrix B mit positiven reellen Diagonaleinträgen verwandeln. |
(d) | Es gibt eine Dreiecksmatrix L ∈ GL(n, ℂ) mit A = L*L. (Cholesky-Zerlegung) |
(e) | Es gibt ein B ∈ GL(n, ℂ) mit A = B*B. |
Analoges gilt für symmetrische Matrizen A ∈ ℝn × n.
Die Zahlen det(Ak) heißen die Hauptminoren von A. Nach (b) sind alle Ak und damit A = An invertierbar, wenn A positiv definit ist.
Der Satz erlaubt für eine gegebene Hermitesche Matrix A ∈ ℂn × n (oder symmetrische Matrix A ∈ ℝn × n) die Beantwortung von:
Ist A positiv definit?
Für kleine n ist das Hauptminorenkriterium geeignet, um die positive Definitheit von A zu entscheiden. Für größere n überführen wir A durch Spaltenadditionen in eine Dreiecksmatrix B = A L1 … Lk. Dann ist A genau dann positiv definit, wenn alle Diagonaleinträge λi von B reell und zudem positiv sind. Die Cholesky-Zerlegung
A = L*L ist im positiv definiten Fall gegeben durch
L = (L1 … Lk Wnn(μn) … W11(μ1))−1 mit μi = .
Dass die Abschwächung (e) von (d) die positive Definitheit impliziert, folgt aus
〈 x, B*Bx 〉 = 〈 B**x, Bx 〉 = 〈 Bx, Bx 〉 > 0 für B ∈ GL(n, ℂ) und x ≠ 0.
Für die in 6. 12 untersuchten Sesquilinearformen gilt:
Positiv definite Formen
Seien V ein ℂ-Vektorraum, φ : V × V → ℂ eine hermitesche Form, 𝒜 = (v1, …, vn) eine Basis von V und A = (φ(vi, vj))ij ∈ ℂn × n die gramsche Matrix von φ bzgl. 𝒜. Dann ist φ genau dann positiv definit, wenn eine (alle) der Aussagen (a) − (e) gelten. Analoges gilt für eine symmetrische Form φ : V × V → ℝ auf einem ℝ-Vektorraum.
Beispiele
(1) | Ist A ∈ ℝn × n symmetrisch und positiv definit, so sind alle Diagonaleinträge von A positiv, da aii = 〈 ei, A ei 〉 > 0 für alle 1 ≤ i ≤ n. Dass diese Eigenschaft nicht hinreichend ist, zeigt die Matrix A ∈ ℝ2 × 2 mit den Spalten (1, 2), (2, 1). |
(2) | Da AtA und AAt für alle A ∈ GL(3, ℝ) positiv definit sind, gilt dies mit A = für At A = und A At = . |
(3) | Auf V = ℝ2 sei die symmetrische Bilinearform φ definiert durch φ(v, w) = v1 w1 − v2 w2 für alle v, w ∈ ℝ2. Für die Basen 𝒜 = (e1, e2) und ℬ = (e1, (2, 1)) sind Aφ, 𝒜 = , Aφ, ℬ = die zugehörigen gramschen Matrizen. Sie sind nicht positiv definit. |
(4) | Die Definitheit einer Matrix spielt in der mehrdimensionalen Analysis bei der Suche nach lokalen Extrema eine Rolle. Für ein zweimal stetig differenzierbares f : ℝ2 → ℝ und (x, y) ∈ ℝ2 sind der Gradient grad(f)(x, y) = ∇f (x, y) ∈ ℝ2 und die Hesse-Matrix Hf(x, y) ∈ ℝ2 × 2 von f an der Stelle (x, y) definiert durch grad(f)(x, y) = (∂1f (x, y), ∂2f (x, y)), Hf(x, y) = , wobei ∂1 und ∂2 die partiellen Ableitungen nach der ersten bzw. zweiten Koordinate bezeichnen. Ist (x, y) ∈ ℝ2 ein kritischer Punkt von f, d. h. grad(f)(x, y) = 0, so hat f in (x, y) eine lokale Minimalstelle (bzw. Maximalstelle), wenn Hf(x, y) (bzw. −Hf(x, y)) positiv definit ist. Für f mit f(x, y) = x2 + xy + y2 gilt ∂1f(x, y) = 2x + y, ∂2f(x, y) = 2y + x, ∂1∂1f(x, y) = ∂2∂2f(x, y) = 2, ∂1∂2f(x, y) = ∂2∂1f(x, y) = 1. Im kritischen Punkt 0 = (0, 0) ist Hf(0) = positiv definit. Also ist 0 eine lokale Minimalstelle. |