Lineare Gleichungssysteme
Wir betrachten ein lineares Gleichungssystem mit m Gleichungen und n Variablen, „Unbestimmten“ oder „Unbekannten“ x1, …, xn:
a1, 1 x1 + a1, 2 x2 + … + a1, n xn = b1, (Gleichung 1)
a2, 1 x1 + a2, 2 x2 + … + a2, n xn = b2, (Gleichung 2)
… …
am, 1 x1 + am, 2 x2 + … + am, n xn = bm. (Gleichung m)
Hierbei sind alle ai, j und alle bi gegebene Elemente von K. Die Skalare ai, j heißen die Koeffizienten des Gleichungssystems, und b = (b1, …, bm) heißt der rechte Vektor des Systems. Das Gleichungssystem heißt homogen, falls der rechte Vektor der Nullvektor ist.
Das Gleichungssystem heißt lösbar, falls x1, …, xn ∈ K existieren, sodass alle Gleichungen des Systems simultan erfüllt sind. Der Vektor (x1, …, xn) ∈ Kn heißt dann eine Lösung des Systems. Die Menge
L = { (x1, …, xn) ∈ Kn | (x1, …, xn) ist eine Lösung des Systems }
heißt die Lösungsmenge oder der Lösungsraum des Systems.
Wir notieren die Koeffizienten des Systems als (m × n)-Matrix A = (ai j)i j. Formal ist eine derartige Matrix eine Abbildung A : { 1, …, m } × { 1, …, n } → K, und wir schreiben dann ai j für die Funktionswerte A(i, j).
Oft ist es auch nützlich, den rechten Vektor in die Koeffizientenmatrix zu integrieren, indem wir der Koeffizientenmatrix eine weitere aus b1, …, bm gebildete Spalte hinzufügen. Wir bezeichnen diese Matrix mit (A, b) und nennen sie die erweiterte Koeffizientenmatrix. Sie hat m Zeilen und n + 1 Spalten. Die i-te Zeile dieser Matrix ist (ai, 1, …, ai, n, bi).
Ein Gleichungssystem mit erweiterter Koeffizientenmatrix (A, b) und Unbekannten x1, …, xn notieren wir oft auch in der kompakten Form
A x = b. (Notation für lineare Gleichungssysteme)
Als Nächstes wollen wir einer Koeffizientenmatrix A eine Funktion zuordnen, die die Berechnungen durchführt, die entstehen, wenn wir in einem Gleichungssystem A x = b für die Unbestimmten Skalare von K einsetzen.
Definition (von einer Matrix induzierte Abbildung)
Sei A = (ai j)i j eine (m × n)-Matrix in K. Dann definieren wir eine Funktion fA : Kn → Km durch:
fA(x1, …, xn)(i) = ∑1 ≤ j ≤ n ai, j xj = ai, 1 x1 + ai, 2 x2 + … + ai, n xn
für alle (x1, …, xn) ∈ Kn und alle 1 ≤ i ≤ m.
Die Funktion fA heißt die von der Matrix A induzierte oder die der Matrix A zugeordnete Abbildung.
Die Abbildung fA wertet für x1, …, xn ∈ K alle m Terme auf der linken Seite eines Gleichungssystems A x = b aus. Die Ergebnisse dieser Auswertungen fassen wir zu einem Vektor fA(x) der Länge m zusammen. Die Frage der Lösbarkeit des Gleichungssystems A x = b lautet nun einfach:
Gilt b ∈ rng(fA)?
Weiter gilt:
L = { x ∈ Kn | fA(x) = b },
d. h. der Lösungsraum ist das Urbild des Vektors b unter der Abbildung fA.
Wir wollen nun die geometrische Struktur des Lösungsraumes L von A x = b noch genauer ergründen. Hierzu betrachten wir das zugeordnete homogene Gleichungssystem Ax = 0 und setzen
L0 = { x ∈ Kn | A x = 0 }.
Für die Lösungsmenge L0 gilt:
Satz (Struktur des Lösungsraumes eines homogenen Systems)
(i) | 0 ∈ L0, | |
(ii) | x + y ∈ L0 | für alle x, y ∈ L0, |
(iii) | α x ∈ L0 | für alle x ∈ L0 und alle α ∈ K. |
Beweis
Sei f = fA die zugeordnete Abbildung. Wir rechnen:
f (0) = f(0 · 0) = 0 · f (0) = 0,
f(x + y) = f (x) + f (y) = 0 + 0 = 0 | für alle x, y ∈ L0, |
f(α x) = α f (x) = α 0 = 0 | für alle x ∈ L0 und alle α ∈ K. |
Aus L0 = { x ∈ Kn | f (x) = 0 } folgen die Behauptungen.
Die aufgetauchten Eigenschaften von f werden wir im Abschnitt über „Lineare Abbildungen“ studieren. Hier halten wir die Strukturaussagen (i) − (iii) begrifflich fest:
Definition (Unterraum)
Ein U ⊆ Kn heißt ein Unterraum oder Untervektorraum des Kn, falls 0 ∈ U gilt und U abgeschlossen unter Vektoraddition und Skalarmultiplikation ist, d. h. für alle x, y ∈ U und alle α ∈ K gilt x + y ∈ U und α x ∈ U.
Der Satz besagt also, dass die Lösungsmenge eines homogenen linearen Gleichungssystems ein Unterraum ist. Umgekehrt zeigt man in der linearen Algebra, dass auch jeder Unterraum als Lösungsraum eines homogenen Gleichungssystems auftaucht.
Für die Lösungsmenge L von A x = b gilt die folgende Darstellung, deren Beweis dem Leser zur Übung überlassen bleiben kann:
Satz (Struktur des Lösungsraumes eines inhomogenen Systems)
Sei y = (y1, …, yn) ∈ L. Dann gilt
L = L0 + y, wobei L0 + y = { x + y | x ∈ L0 }.
Kennen wir also die Lösung L0 des zugeordneten homogenen Systems, so liefert uns jede spezielle Lösung von A x = b alle Lösungen von A x = b.
Wir definieren:
Definition (affiner Unterraum)
Ein X ⊆ Kn heißt ein affiner Unterraum des Kn, falls ein Unterraum U des Kn und ein y ∈ Kn existieren mit
X = U + y = { x + y | x ∈ U }.
Damit ist die Lösungsmenge eines linearen Gleichungssystems also ein affiner Unterraum des Kn.
Affine Unterräume sind i. A. nicht mehr abgeschlossen unter der Addition von Vektoren. Es gilt aber eine bemerkenswerte andere Abschlusseigenschaft.
Satz (Abschlusseigenschaft eines affinen Unterraums)
Sei X = U + y ein affiner Unterraum, und seien x1, …, xk ∈ X.
Zudem seien α1, …, αk ∈ K mit ∑1 ≤ i ≤ k αi = 1. Dann gilt ∑1 ≤ i ≤ k αi xi ∈ X.
Beweis
Sei xi = ui + y für alle 1 ≤ i ≤ k, mit ui in U. Dann gilt:
∑1 ≤ i ≤ k αi xi = ∑1 ≤ i ≤ k αi (ui + y) = (∑1 ≤ i ≤ k αi ui) + 1 y ∈ U + y = X.
Zwei Gleichungen und zwei Unbekannte
Bevor wir uns einem allgemeinen Lösungsverfahren zuwenden, betrachten wir lineare Gleichungssysteme mit zwei Gleichungen und zwei Unbekannten noch etwas genauer. Wir notieren ein derartiges System in der Form
a x + b y = e, (Gleichung 1)
c x + d y = f. (Gleichung 2)
mit Unbekannten x und y und vorgegebenen reellen Zahlen a, …, f. Wir nehmen der Einfachheit halber an, dass b, d ≠ 0 gilt. Dann können wir die beiden Gleichungen schreiben als
y = − (a/b) x + e/b, (Geradengleichung 1)
y = − (c/d) x + f/d. (Geradengleichung 2)
Gerade der ersten Gleichung mit Steigung s = − a/b
Die beiden Gleichungen beschreiben also Geraden in der Ebene, und die Schnittpunkte dieser Geraden bilden die Lösungsmenge des Systems. Sind die Geraden nicht parallel, so existiert genau eine Lösung. Dies ist genau dann der Fall, wenn die Steigungen − a/b und − c/d der Geraden verschieden sind, d. h. falls ad − b c ≠ 0. (Dieser Wert ist unabhängig von e und f.) Sind die Geraden parallel aber verschieden, so existiert keine Lösung. Andernfalls fallen die beiden Geraden zusammen und es gibt unendlich viele Lösungen.
Liegen die Steigungen der Geraden nahe beieinander, d. h. ist |ad − b c| sehr klein, so treten bemerkenswerte Effekte auf. Wir betrachten hierzu folgendes Beispiel (aus einer Arbeit von William Kahan):
0,2161 x + 0,1441 y = 0,1440,
1,2969 x + 0,8648 y = 0,8642.
Die eindeutige Lösung dieses Gleichungssystems ist (x, y) = (2, − 2). Für x = 0,9911 und y = − 0,4870, ergibt sich
0,2161 x + 0,1441 y = 0,1440 + 0,00000001,
1,2969 x + 0,8648 y = 0,8642 − 0,00000001,
d. h. der von (2, − 2) deutlich verschiedene Vektor (x, y) könnte als Lösung des Systems gelten, wenn wir mit weniger als acht Nachkommastellen Genauigkeit rechnen. Umgekehrt betrachtet: Ändern wir die rechte Seite (0,1440, 0,8642) minimal um (10−8, − 10−8) ab, so springt die exakte Lösung von (2, − 2) zu (x, y). Man sagt in der Numerik, dass das Gleichungssystem schlecht konditioniert ist.