Die Singulärwertzerlegung

 Aus der Diagonalisierung AAt = S−1DS = StDS der symmetrischen Matrix AAt können wir trickreich, aber ohne großen Aufwand eine dreiteilige Zerlegung von A selbst gewinnnen, bei der in der Mitte eine Diagonalmatrix und links und rechts orthogonale Matrizen verwendet werden:

Satz (Singulärwertzerlegung)

Sei A  ∈  2 × 2 invertierbar. Weiter sei AAt = S−1DS mit S orthogonal und D = diag1, λ2). Weiter sei

T  =  D1/2SA−t,  wobei  A−t = (A−1)t,  D1/2 = diag1, σ2) = diag(λ1, λ2).

Dann ist T orthogonal und es gilt

A  =  S−1D1/2T.(Singulärwertzerlegung von A)

 Wir können dieses sehr bedeutsame Ergebnis als Version des Spektralsatzes für nichtsymmetrische Matrizen ansehen.

Beweis

Die Matrix T ist orthogonal, da

Tt T  =  A−1S−1D1/2D1/2SA−t  =  A−1AAtA−t  =  E2 E2  =  E2.

Weiter ist

A  =  S−1DSA−t  =  S−1D1/2D1/2SA−t  =  S−1D1/2T.

 Die Zerlegung A = S−1D1/2T ist als Singulärwertzerlegung von A bekannt und die Diagonaleinträge σ1, σ2 von D1/2 heißen die Singulärwerte von A. Die Matrix A wird in drei Teile wie bei der Diagonalisierung zerlegt, wobei die äußeren Matrizen immer noch orthogonal, aber im Allgemeinen nicht mehr invers zueinander sind. Mehr können wir nicht erreichen, da wir A nicht als symmetrisch voraussetzen.

 Dass das Bild des Einheitskreises unter A eine Ellipse ist, lässt sich mit Hilfe der Singulärwertzerlegung A = S−1D1/2T wie oben bei der Diagonalisierung so einsehen: Wir nehmen an, dass S und T Drehungen sind. Dann wird der Einheitskreis zunächst mit T gedreht. Seine Form bleibt dabei unverändert. Nun wird der gedrehte Kreis durch Anwendung von D1/2 in x- und y-Richtung um die positiven Skalare σ1 bzw. σ2 gestreckt und damit zur achsenparallelen Ellipse Eσ1, σ2. Schließlich wird diese Ellipse mit S−1 zur Ellipse E = A[ K ] gedreht. Die Spaltenvektoren von S−1 sind damit Halbachsenrichtungen und die Singulärwerte von A die Längen der Halbachsen von E. Die Ellipse E ist damit vollständig durch die Matrizen S−1 und D bestimmt. Da die orthogonale Matrix S−1 wiederum durch ihre erste Spalte bestimmt ist, legen die vier Parameter S−1(1, 1), S−1(2, 1), σ1, σ2 die zentrische Ellipse E fest. Die Rolle der vorgeschalteten Drehung T lässt sich so beschreiben: Durchlaufen wir den Einheitskreis K mit f (t) = (cos t, sin t), t  ∈  [ 0, 2π ], so durchläuft Af (t) die Ellipse E. Die Matrix T beeinflusst dabei den Startpunkt Ae1 des Durchlaufs. Im Fall T = E2 beginnt der Durchlauf von E bei einem Halbachsenvektor von E (genauer bei σ1S−1e1). Durch Änderung des Drehwinkels von T kann der Startpunkt des Durchlaufs beliebig eingestellt werden, ohne die Ellipse EA zu verändern.

Beispiel

Seien σ1 = 2, σ2 = 1, φ = π/3, ψ = π/8, D = diag1, σ2), S−1 = rotψ, T = rotφ. Wir setzen

A  =  S−1 D T  (Drehung um ψ, Skalierung mit D, Drehung um φ).

Die Anwendung von T gefolgt von D ergibt zunächst:

ema12-AbbID4-5-6a

Anwendung von S−1 dreht die achsenparallele Ellipse um den Winkel ψ:

ema12-AbbID4-5-6b

 Analoge Überlegungen gelten, wenn S oder T eine Spiegelung ist. Die Determinante von S oder von T kann dabei frei als 1 oder −1 gewählt werden: Multiplizieren wir die zweiten Spalten von S und T mit −1, so erhalten wir eine Singulärwertzerlegung von A, bei der die Determinanten der beiden äußeren Matrizen ihr Vorzeichen gewechselt haben. Ist S eine Drehung, so entspricht das Vorzeichen von det(T) wegen

det(A)  =  det(S−1) det(D1/2) det(T)  =  σ1 σ2 det(T) mit σ1, σ2 > 0

der Orientierung der Spalten von A, also der Bilder von e1 und e2 unter A. Ist die Determinante von A negativ, so durchläuft Af (t)) mit obiger Parametrisierung f (t) von K die Ellipse E im Uhrzeigersinn.

 Subtile Beziehungen bestehen zwischen den zu A und At gehörigen Ellipsen E = A[ K ] und Et = At[ K ]. Wegen At = T−1D1/2S haben A und At die gleichen Singulärwerte, sodass die Ellipsen E und Et die gleichen Halbachsenlängen σ1 und σ2 aufweisen. Ist vi = S−1ei, i = 1,2, ein normierter Halbachsenvektor von E, so ist

At vi  =  T−1D1/2SS−1 ei  =  T−1D1/2ei  =  σiT−1ei

ein Halbachsenvektor von Et.

ema12-AbbID4-5-7

Die Ellipsen von A und At für A = ((1, −1); (3, 2/3))