10. Normalformen
Wir stellen einige Normalformen von Matrizen zusammen, d. h., wir geben möglichst einfache Repräsentanten für wichtige Äquivalenzrelationen an. Dabei beschränken wir uns zunächst auf Matrizen in ℂn × n, n ≥ 1.
Äquivalente Matrizen
Definition
A, B ∈ ℂn × n sind äquivalent, falls S, T ∈ GL(n, ℂ) existieren mit B = S A T−1.
Bedeutung
A und B stellen dieselbe lineare Abbildung bzgl. verschiedener Basen dar, d. h., es gibt ein lineares f : ℂn → ℂn und Basen 𝒜, ℬ, 𝒜′, ℬ′ des ℂn mit A = A𝒜, ℬf, B = A𝒜′, ℬ′f.
Normalformen
Sei A ∈ ℂn × n, und sei r = rang(A). Dann gibt es S, T ∈ GL(n, ℂ) mit
S A T−1 = . (Normalformdarstellung)
Weiter gibt es S, T ∈ U(n) und σ1, …, σr > 0 mit
S A T−1 = . (Singulärwertzerlegung)
Kongruente Matrizen
Definition
A, B ∈ ℂn × n sind kongruent, falls ein S ∈ GL(n, ℂ) existiert mit B = S*AS.
Bedeutung
A und B stellen dieselbe Sesquilinearform bzgl. einer Basis des ℂn dar, d. h., es gibt eine Sesquilinearform φ : ℂn × ℂn → ℂ und Basen 𝒜, ℬ mit
φ(x, y) = 〈 Φ𝒜(x), A Φ𝒜(y) 〉kanonisch = 〈 Φℬ(x), B Φℬ(y) 〉kanonisch für alle x, y ∈ ℂn,
Normalform (für hermitesche Matrizen)
Ist A hermitesch, so existiert ein S ∈ GL(n, ℂ) mit
S* A S = , (Hauptachsentransformation, Trägheitssatz)
wobei s+ und s− die Anzahlen der positiven bzw. negativen Eigenwerte von A sind.
Ähnliche Matrizen
Definition
A, B ∈ ℂn × n sind ähnlich, falls ein S ∈ GL(n, ℂ) existiert mit B = S A S− 1.
Bedeutung
A und B stellen dieselbe lineare Abbildung bezüglich einer Basis dar, d. h., es gibt ein lineares f : ℂn → ℂ und Basen 𝒜, ℬ des ℂn mit
A = A𝒜f = A𝒜, 𝒜f, B = Aℬf = Aℬ, ℬf.
Normalformen
Sei A ∈ ℂn und seien λ1, …, λn die in ihrer algebraischen Vielfachheit gezählten Eigenwerte A. Dann gilt:
(1) | Es gibt ein S ∈ GL(n, ℂ) und bij ∈ ℂ mit i < j mit S A S−1 = . (Trigonalisierung, Schur-Zerlegung) |
(2) | Ist für jeden Eigenwert λ die geometrische Vielfachheit dim(Eig(f, λ)) gleich der algebraischen Vielfachheit μf(λ), so existiert ein S ∈ GL(n, K) mit S A S−1 = diag(λ1, …, λn). (Diagonalisierung) |
(3) | Ist A normal (d. h. AA* = A*A), so gibt es ein S ∈ U(n) mit S A S−1 = diag(λ1, …, λn). (unitäre Diagonalisierung, spektrale Zerlegung) Insbesondere gilt dies für hermitesche A (A = A*) und für unitäre A (A* = A−1). Genau für die hermiteschen Matrizen sind alle λi reell. |
(4) | Es gibt ein S ∈ GL(n, ℂ) mit S A S−1 = , (Jordan-Normalform) wobei nun λ1, …, λm, m ≤ n, die paarweise verschiedenen Eigenwerte von A bezeichnen und jedes J(λi) eine aus dim(Eig(A, λi)) Jordan-Blöcken zusammengesetze Bidiagonalmatrix ist. Die algebraische Vielfachheit des Eigenwerts λi entspricht der Zeilen- und Spaltenzahl von J(λi). Die Matrix SAS−1 ist eine obere Dreiecksmatrix, sodass die Jordan-Normalform die Trigonalisierung verfeinert. |
Normalformen für reelle Matrizen
Wir betrachten nun reelle Matrizen A ∈ ℝn × n. Die Ergebnisse für die Äquivalenz und die Kongruenz bleiben gleich (mit „symmetrisch“ statt „hermitesch“). Für die Ähnlichkeit ergeben sich Unterschiede, da das charakteristische Polynom pA über ℝ im Allgemeinen nicht in Linearfaktoren zerfällt:
(1) | Eine Trigonalisierung ist im Allgemeinen nicht möglich. |
(2) | Die Diagonalisierung gilt unter den Vielfachheitsvoraussetzungen, wenn pA in Linearfaktoren zerfällt. |
(3) | Eine orthogonale Diagonalisierung ist genau dann möglich, wenn A symmetrisch ist. Wie für ℂ ist dies ein zentrales Ergebnis der Linearen Algebra, vgl. 8. 6. |
(4) | Die Jordan-Normalform ist als Verstärkung der Trigonalisierung im Allgemeinen nicht mehr erreichbar. Sie gilt, falls pA in reelle Linearfaktoren zerfällt. |
Eine Matrix A ∈ ℝn × n heißt normal, falls AAt = AtA. Im Gegensatz zum komplexen Fall ist die Normalität nicht mehr hinreichend für die Diagonalisierbarkeit. Das Beste, was man erreichen kann, ist eine Diagonalform mit (2 × 2)-Kästchen: Es gibt ein S ∈ O(n) mit
S A S−1 = , (Normalform für normale reelle Matrizen)
wobei die λi die Eigenwerte von A sind und die Bi ∈ ℝ2 × 2 die schiefsymmetrische Form
Bi = , bi ≠ 0
besitzen. Dies zeigt man so: Wegen A ∈ ℝn × n ⊆ ℂn × n gibt es eine Orthonormalbasis 𝒜 des ℂn aus Eigenvektoren von A. Da A reell ist, kann 𝒜 = (x1, …, xk, z1, z1, …, zs, zs) mit xi ∈ ℝn erreicht werden. Ersetzt man die komplexen zi-Paare durch Re(zi), Im(zi) ∈ ℝn, so erhält man eine Orthonormalbasis 𝒜′ des ℝn, die A in Normalform bringt. Dabei ist ai = Re(λ) und bi = Im(λ) für einen komplexen Eigenwert λ von A ∈ ℂn × n.
Für den wichtigen Spezialfall einer orthogonalen Matrix A ∈ O(n) kann man
Bi = , αi kein Vielfaches von π,
schreiben (da dann a2i + b2i = 1). Diese Matrizen stellen Drehungen dar. Da die Eigenwerte einer orthogonalen Matrix den Betrag 1 haben, lässt sich die Normalform von A ∈ O(n) als „±1-Kette + Drehkästchen“ beschreiben (vgl. hierzu die Tabelle in 7. 8).