Ich möchte hier einen alternativen Beweis für den „Spaltungssatz“ über Minimalpolynome angeben. Den ursprünglichen Satz und Beweis habe ich aus „Lineare Algebra“ von Theo de Jong. Er benutzt dort Widerspruchsbeweise, die ich hier umgehen möchte und eine sehr knappe Formulierung, die ich hier ausführlicher machen möchte.

Notation und Definitionen

Im weiteren Verlauf sei VV ein endlich-dimensionaler Vektorraum über einem beliebigen Körper KK und φ:VV\varphi : V \to V eine lineare Abbildung.

Mit MφK[x]M_\varphi \in K[x] wird das normierte Polynom minimalen Grades bezeichnet, welches Mφ(φ)=0M_\varphi(\varphi) = 0 erfüllt. Hier ist mit 00 die Nullabbildung gemeint. Es heisst „Minimalpolynom von φ\varphi“. Für jeden Vektor vVv \in V wird mit Mφ,vK[x]M_{\varphi, v} \in K[x] das normierte Polynom minimalen Grades bezeichnet, welches Mφ,v(v)=0M_{\varphi, v}(v) = 0 erfüllt. Weil VV endlich-dimensional ist, existieren alle diese Polynome. (Beweis weggelassen)

Definition: Normierte Polynome Ein Polynom k=1nakxkK[x]\sum_{k=1}^n a_k x^k \in K[x] vom Grad nn heisst normiert, falls an=1a_n = 1. In anderen Worten: der Koeffizient mit höchstem Grad hat den Wert 1.

Hilfssatz: für jedes Polynom pK[x]p \in K[x] und jeden Vektor vVv \in V gilt:

  • falls p(φ)=0p(\varphi) = 0 (als Abbildung), dann ist pp ein Vielfaches von MφM_\varphi. D.h. es gibt ein qK[x]q \in K[x] mit p=qMφp = q \cdot M_\varphi.
  • falls p(φ)(v)=0p(\varphi)(v) = 0 (d.h. vker(p(φ))v \in \ker(p(\varphi))), dann ist pp ein Vielfaches von Mφ,vM_{\varphi, v}. D.h. es gibt ein qK[x]q \in K[x] mit p=qMφ,vp = q \cdot M_{\varphi, v}.

Beweis weggelassen, benutzt Euklidischen Algorithmus für Polynome und die Minimalität der Minimalpolynome. Wenn man das Minimalpolynom als Erzeuger eines Hauptideals betrachtet, gibt es einen anderen Beweis.

Spaltungssatz

Nehmen wir an, dass p,qK[x]p, q \in K[x] teilerfremde Polynome sind (d.h. ggT(p,q)=1\text{ggT}(p, q) = 1) so dass Mφ=pqM_\varphi = p \cdot q. Dann gelten:

  • ker(p(φ))=im(q(φ))\ker(p(\varphi)) = \text{im}(q(\varphi)),
  • ker(q(φ))=im(p(φ))\ker(q(\varphi)) = \text{im}(p(\varphi)),
  • diese beiden Unterräume φ\varphi-invariant,
  • die beiden Unterräume bilden eine direkte Summe V=ker(p(φ))im(p(φ))=ker(q(φ))im(q(φ))V = \ker(p(\varphi)) \oplus \text{im}(p(\varphi)) = \ker(q(\varphi)) \oplus \text{im}(q(\varphi)).
  • die Einschränkung φker(p(φ))\varphi|_{\ker(p(\varphi))} von φ\varphi auf ker(p(φ))\ker(p(\varphi)) hat pp als Minimalpolynom. Analog für qq.
  • falls deg(p)>0\deg (p) > 0 ist ker(p(φ))\ker(p(\varphi)) nicht-trivial. Analog für qq.

Quelle Die zweitletzte Aussage taucht bei de Jong nicht auf. Ich habe den Beweis auf StackExchange gefunden und hinzugefügt, weil sie den Beweis des nächsten Theorems via Induktion unterstützt.

Beweis

Zuerst zeigen wir, dass im(p(φ))ker(q(φ))\text{im}(p(\varphi)) \subseteq \ker(q(\varphi)) wie folgt: Sei vim(p(φ))v \in \text{im}(p(\varphi)). Nach Definition des Bilds, muss es ein wVw \in V geben mit v=p(φ)(w)v = p(\varphi)(w). Nun gilt q(φ)(v)=q(φ)(p(φ)(w))=(qp)(φ)(w)=Mφ(φ)(w)=0.q(\varphi)(v) = q(\varphi)\left( p\left(\varphi\right)\left(w\right)\right) = (q \cdot p)(\varphi)(w) = M_\varphi(\varphi)(w) = 0.

Detail Wir benutzen beim dritten Gleichheitszeichen, dass Multiplikation in K[x]K[x] kommutativ ist. De Jong schreibt in seinem Buch als zweiten Term q(φ)(p(φ)(v))q(\varphi)\left(p\left(\varphi\right)\left(v\right)\right). Ich nehme an, dass das ein Druckfehler ist. Ob das in der 2. Ausgabe korrigiert wurde weiss ich nicht, weil ich diese nicht zur Hand habe.
Damit ist diese Behauptung bewiesen. Indem die Rollen von pp und qq vertauscht werden, kann man auch im(q(φ))ker(p(φ))\text{im}(q(\varphi)) \subseteq \ker(p(\varphi)) beweisen.

Als Nächstes beweisen wir, dass ker(p(φ))ker(q(φ))={0}\ker(p(\varphi)) \cap \ker(q(\varphi)) = \{0\}. Sei vker(p(φ))ker(q(φ))v \in \ker(p(\varphi)) \cap \ker(q(\varphi)). Dann ist (nach dem Hilfssatz) Mφ,vM_{\varphi, v} ein Teiler von pp und von qq. Weil diese Polynome teilerfremd sind (nach Annahme), muss Mφ,v=1M_{\varphi, v} = 1 sein. Also ist 0=Mφ,v(φ)(v)=1(φ)(v)=idV(v)=v0 = M_{\varphi, v}(\varphi)(v) = 1(\varphi)(v) = \text{id}_V(v) = v. Genau was für diesen Teil zu zeigen war.

Im nächsten Schritt beweisen wir die erste Aussage des Satzes. Zunächst setzen wir q(φ)q(\varphi) in die Dimensionsformel für lineare Abbildungen und erhalten dim(V)=dim(ker(q(φ)))+dim(im(q(φ)))\dim (V) = \dim \left(\ker\left(q\left(\varphi\right)\right)\right) + \dim \left(\text{im}\left(q\left(\varphi\right)\right)\right). Zusammen mit den Schritten von vorhin erhalten wir folgende Ungleichungen: dim(im(q(φ)))dim(ker(p(φ)))dim(V)dim(ker(q(φ)))=dim(im(q(φ))) \dim \left( \text{im} \left( q \left( \varphi \right) \right) \right) \le \dim \left( \ker \left( p \left( \varphi \right) \right) \right) \le \dim \left( V \right) - \dim \left( \ker \left( q \left( \varphi \right) \right) \right) = \dim \left( \text{im} \left( q \left( \varphi \right) \right) \right)

Details Die (Un-)Gleichungen haben folgende Gründe:
  1. Wegen der Inklusion im(q(φ))ker(p(φ))\text{im} \left( q \left( \varphi \right) \right) \subseteq \ker \left( p \left(\varphi\right)\right).
  2. Weil ker(p(φ))ker(q(φ))={0}\ker(p(\varphi)) \cap \ker(q(\varphi)) = \{0\}.
  3. Wegen der Dimensionsformel.

Also folgt dim(im(q(φ)))=dim(ker(p(φ))) \dim \left( \text{im} \left( q \left( \varphi \right) \right) \right) = \dim \left( \ker \left( p \left( \varphi \right) \right) \right) . Und wir wissen bereits, dass (im(q(φ)))(ker(p(φ))) \left( \text{im} \left( q \left( \varphi \right) \right) \right) \subseteq \left( \ker \left( p \left( \varphi \right) \right) \right) also muss im(q(φ))=ker(p(φ)) \text{im} \left( q \left( \varphi \right) \right) = \ker \left( p \left( \varphi \right) \right) wegen grundsätzlichen Überlegungen bzgl. Dimensionen.

Wir können auch hier die Rollen von pp und qq vertauschen und erhalten so die zweite Aussage des Satzes.

Dass die Unterräume eine direkte Summe bilden, können wir aus der Dimensionsformel (so wie sie oben steht) und der Aussage über den Durchschnitt folgern.

Dass die Unterräume φ\varphi-invariant sind, kann man so zeigen: Sei vker(p(φ))v \in \ker\left(p\left(\varphi\right)\right). Dann ist p(φ)(φ(v))=(px)(φ)(v)=φ(p(φ)(v))=φ(0)=0p(\varphi)(\varphi(v)) = (p \cdot x)(\varphi)(v) = \varphi(p(\varphi)(v)) = \varphi(0) = 0. Also ist φ(v)ker(p(φ))\varphi(v) \in \ker(p(\varphi)).

Nun bestimmen wir das Minimalpolynom von φker(p(φ))\varphi|_{\ker(p(\varphi))}. Nennen wir dieses mm. Zuerst bemerke, dass im(p(φker(p(φ))))=p(φ)(ker(p(φ)))={0}\text{im}(p(\varphi|_{\ker(p(\varphi))})) = p(\varphi)(\ker(p(\varphi))) = \{0\}. Also ist nach dem Hilfssatz pp ein Vielfaches von mm. Nun sei vVv \in V beliebig. Wegen der direkten Summe können wir vv (eindeutig) zerlegen als v=v1+v2v = v_1 + v_2 mit v1ker(p(φ))v_1 \in \ker(p(\varphi)) und v2ker(q(φ))v_2 \in \ker(q(\varphi)). Dann gilt: (mq)(φ)(v)=(mq)(φ)(v1+v2)=(qm)(φ)(v1)+(mq)(φ)(v2)=q(φ)(m(φ)(v1))+m(φ)(q(φ)(v2))=0+0=0(m \cdot q)(\varphi)(v) = (m \cdot q)(\varphi)(v_1 + v_2) = (q \cdot m)(\varphi)(v_1) + (m \cdot q)(\varphi)(v_2) = q(\varphi)\left( m(\varphi)(v_1) \right) + m(\varphi)\left( q(\varphi)(v_2) \right) = 0 + 0 = 0.

Details Es gilt m(φ)(v1)=m(φker(p(φ)))(v1)=0m(\varphi)(v_1) = m(\varphi|_{\ker(p(\varphi))})(v_1) = 0 nach Definition von mm als Minimalpolynom und es gilt q(φ)(v2)=0q(\varphi)(v_2)=0 da v2ker(q(φ))v_2 \in \ker(q(\varphi)).

Mit dem Hilfssatz folgt nun, dass mqm\cdot q ein Vielfaches von Mφ=pqM_\varphi = p \cdot q ist. Wegen Teilbarkeitsregeln muss mm ein Vielfaches von pp sein. Deshalb ist m=pm = p. Ein analoges Argument beweist dass qq das Minimalpolynom von φker(q(φ))\varphi|_{\ker(q(\varphi))} ist.

Für die letzte Behauptung des Satzes nehmen wir an, dass p1p \neq 1. Wenn jetzt ker(p(φ))={0}\ker(p(\varphi)) = \{0\}, dann ist ja dimker(p(φ))=0\dim \ker(p(\varphi)) = 0 und wegen der direkten Summe, V=ker(q(φ))V = \ker(q(\varphi)). Also ist q(φ)=0q(\varphi) = 0 als Abbildung und qq wäre das Minimalpolynom von φ\varphi. Das geht aber nicht.

Detail Das war jetzt kein Widerspruchsbeweis sondern ein „Beweis durch Negation“, denn ich habe hier deg(p)>0    dimker(p(φ))0\deg (p) > 0 \implies \dim \ker(p(\varphi)) \neq 0 gezeigt. In anderen Worten: die gezeigte Aussage war „falls deg(p)>0\deg (p) > 0 und dimker(p(φ))=0\dim \ker(p(\varphi)) = 0 gibt es einen Widerspruch“. Technische Details…

Primary Decomposition Theorem

Eine stärkere Version von diesem Satz ist das „Primary Decomposition Theorem“, das im Buch „Linear Algebra“ von Kenneth Hoffman und Ray Kunze vorgestellt wird (Kapitel 6, Theorem 12 und Korollar 13). Die Aussage lautet so:

Seien p1,,pkp_1, \dots, p_k unterschiedliche irreduzible normierte Polynome mit Grad grösser 0 und r1,,rkr_1, \dots, r_k positive natürliche Zahlen, so dass Mφ=p1r1pkrkM_\varphi = p_1^{r_1} \cdots p_k^{r_k}. Setze nun Wi:=ker(pi(φ)ri)W_i := \ker(p_i(\varphi)^{r_i}) für jedes i{1,,k}i \in \{1, \dots, k\}. Dann gilt:

  1. V=i=1kWiV = \bigoplus_{i=1}^k W_i
  2. Jeder Unterraum WiW_i ist nicht-trivial, φ\varphi-invariant und hat dim(Wi)rideg(pi)\dim \left(W_i\right) \ge r_i \cdot \deg(p_i).
  3. Jeder φ\varphi-invariante Unterraum kann als direkte Summe der WiW_i geschrieben werden.
  4. Das Minimalpolynom von φWi\varphi|_{W_i} ist pirip_i^{r_i}.
  5. Es gibt Polynome hiK[x]h_i \in K[x] so dass πi:=hi(φ):VV\pi_i := h_i(\varphi) : V \to V genau die Projektionen sind, die zur direkten Summe gehören. Das heisst:
    1. für alle ii gilt im(πi)Wi\text{im}(\pi_i) \subseteq W_i,
    2. für alle iji \neq j gilt πiπj=0\pi_i \circ \pi_j = 0
    3. für alle ii gilt πiπi=πi\pi_i \circ \pi_i = \pi_i (d.h. πi\pi_i ist eine Projektion)
    4. i=1kπi=idV\sum_{i=1}^k \pi_i = \text{id}_V
  6. (Bemerkung bzgl. Kommutieren) Wenn eine lineare Abbildung ψ:VV\psi : V \to V mit φ\varphi kommutiert, dann kommutiert sie auch mit jedem πi\pi_i und jeder Unterraum WiW_i ist ψ\psi-invariant.

Diese Eigenschaften kann man auch so auffassen: es gibt eine Basis von VV bzgl. φ\varphi eine Blockstruktur hat, wo entlang der Diagonalen kk (nicht-leere) quadratische Blöcke liegen. Ausserhalb dieser Blöcke ist die Matrix leer. Ausserdem ist das Minimalpolynom des ii-ten Blocks pirip_i^{r_i}.

Definition irreduzibler Polynome Ein Polynom pK[x]p \in K[x] heisst reduzibel, falls es Polynome q,rK[x]q, r \in K[x] mit deg(q),deg(r)>0\deg(q), \deg(r) > 0 gibt, welche p=qrp = q \cdot r erfüllen. Andernfalls heisst ein Polynom irreduzibel.

Die Aussagen 1, 2 und 4 kann man mit dem Spaltungssatz von oben beweisen, indem man Induktion entlang kk macht. Hoffmann und Kunze machen ihren Beweis indem sie die Polynome hih_i konstruieren und bauen daraus die anderen Eigenschaften.

Quellennachweis