Damit wir eine Quantenfeldtheorie bauen können, brauchen wir als erstes mal ein Feld – keinen Acker, auf dem Getreide wächst, sondern ein physikalisches Feld. Bevor wir uns mit der Quantenphysik herumschlagen, machen wir das ganze im Rahmen der klassischen Physik. (Klassische Feldtheorie gilt allgemein als ziemlich schwierig, aber das, was wir hier brauchen, ist zum Glück ziemlich einfach.)
Warum wir klassische Felder brauchen? Dazu eine Rückblende zu den letzten Einträgen mit dem Pfadintegral. Dort haben wir folgendes am Beispiel eines Elektrons herausgefunden:
Um ein System quantenmechanisch zu beschreiben, rechnet man die Wahrscheinlichkeit von Prozessen aus. Das geht so: Man überlegt sich alle Möglichkeiten, wie dieser Prozess stattfinden könnte (das waren unsere Pfade). Für jede dieser Möglichkeiten berechnet man eine Größe, die “Wirkung” heißt, nach den Regeln der klassischen Physik. Aus der Wirkung bekommt man für jede Möglichkeit eine Amplitude – die ist nichts als ein Pfeil, dessen Drehwinkel durch die Wirkung (geteilt durch das Wirkungsquantum ?) gegeben ist. Alle Pfeile für alle Möglichkeiten hängt man aneinander, das gibt einen Gesamtpfeil. Man zeichnet ein Quadrat mit der Kantenlänge dieses Pfeils, und die Fläche des Quadrats gibt die Wahrscheinlichkeit des Prozesses an.
Diese Grundregel der Quantenmechanik muss nun auf Felder übertragen werden, wenn wir eine Quantenfeldtheorie bauen wollen.
Was ist also ein Feld? Mein Lieblingsbeispiel für ein klassisches Feld (in zwei Dimensionen) ist ein gespanntes Gummituch, bei dem das Gummi sich an jedem Punkt aber nur in senkrechter Richtung bewegen kann.
Der Übergang zu diskreten Gittertheorien ist dann nichts als der Übergang zu einer Federkernmatratze – die nimmt übrigens Zee in seinem Buch als Beispiel.
Solange ihr nichts mit dem Gummituch macht (also keine Kräfte wirken), ist es einfach nur gespannt und sieht überall gleich aus, es ist also ganz eben. Wenn ihr aber eine Masse auf das Tuch legt (und zwar ganz langsam), dann wird es sich ausbeulen, ungefähr so:
Wir können den Zustand des Tuchs beschreiben, in dem wir an jedem Punkt des Tuchs angeben, wie stark es dort von der Ruhelage abweicht – das gibt also eine Zahl an jedem Punkt des Tuchs. Ist die Zahl positiv, ist der betrachtete Tuchpunkt nach oben ausgelenkt, ist sie negativ, dann nach unten. Diese Auslenkung bezeichnen wir mit φ, weil sie vom Ort abhängt, können wir also φ(x) schreiben, x ist der Ort auf dem Gummituch, an dem wir gucken, φ(x) ist die Auslenkung aus der Ruhelage.
Im Bild ist die Auslenkung direkt zu sehen, zusätzlich habe ich sie noch farbig markiert (dank gnuplots schicker pm3d-Optionen).
Ich bin hier ein bisschen schlampig mit der Schreibweise – eigentlich müsste das x hier ja ein Vektor sein, weil wir zwei Koordinaten brauchen, um den Ort auf unserem Gummituch zu beschreiben – die Mühe, hier jedesmal das x fett zu drucken oder Vektorpfeile drüberzupinseln, spare ich mir, dafür ist html doch zu unhandlich, und in QFT-Büchern wird das normalerweise eh nicht gemacht. Zusätzlich hängt unser Feld φ auch noch von der Zeit ab, aber nach den Regeln der Relativitätstheorie können wir das alles in einen Vierervektor packen. Lasst euch davon nicht verwirren – auf die mathematische Notation kommt es überhaupt nicht an. φ ist einfach die Auslenkung unseres Gummituchs, und die kann sich natürlich mit dem Ort und der Zeit ändern.
Ich hoffe auch, niemand ist verwirrt, dass ich beim letzten Mal den Winkel unseres Pfeils auch φ genannt habe – beide Formelzeichen sind so üblich. Die Zahl der verfügbaren Formelzeichen ist halt begrenzt; es sei denn, man verwendet die Technik aus dem berühmten Buch von Morse & Feshbach, die Tensoren höherer Stufe ganz locker mit hebräischen Buchstaben bezeichnen.
Zurück zum Gummituchfeld: Wenn ihr jetzt ruckartig an einer Stelle am Tuch zupft, dann breitet sich eine Welle aus, ganz ähnlich wie eine Wasserwelle (eine Wasseroberfläche wäre auch ein gutes Beispiel für ein zweidimensionales Feld). Zu einem bestimmten Zeitpunkt würde das vielleicht so aussehen:
Die Energie
Um das Verhalten des Gummituchs beschreiben zu können, (und das wird hier ein seeehr idealisiertes Gummituch, soviel steht fest), machen wir uns Gedanken über die Energie, die in ihm steckt. Warum? Weil wir ja unsere Pfadintegral-Technik anwenden wollen, und dafür müssen wir – ihr erinnert euch – die Wirkung berechnen, die sich aus Energietermen zusammensetzt.
Noch sind wir ja in der klassischen Physik – da hat so ein Gummituch eine klare Ruhelage. In der ist es flach und alle Punkte haben dieselbe Auslenkung, nämlich Null (warum gerade Null? Klären wir noch.). Um es an einer Stelle aus der Ruhelage auszulenken, brauchen wir eine Kraft, denn dabei müssen wir das Gummi bewegen, und müssen damit Energie aufwenden. Ohne Energiezufuhr ändert sich das Auslenkungsfeld des Gummituchs nicht. Wir können also davon ausgehen, dass es Energie kostet, die Auslenkung an einem Punkt zu ändern – eine zeitliche Veränderung des Gummituchs kostet Energie.
Die Änderung der Auslenkung ist die zeitliche Ableitung des Feldes
Damit die kinetische Energie immer positiv ist, egal ob wir das Tuch nach oben oder unten auslenken, müssen wir diesen Term quadrieren:
Einheitenmäßig bin ich hier natürlich ziemlich schlampig…
Nach der Speziellen Relativitätstheorie ist meine Zeit ja für euch (wenn ihr euch bewegt) eine Mischung aus Zeit und Raum. Entsprechend muss also in der Energie auch ein Term drinstecken, der die räumliche Änderung der Auslenkung beinhaltet. Wie ihr seht, können wir hier den praktischen Trick verwenden, den ich am Anfang der Serie eingeführt habe: Wenn aus Zeit Raum wird, dann kann es in einer relativistischen Theorie keinen Term geben, der nur die zeitliche Änderung enthält. (Das ist beim Gummituch auch ohne SRT leicht einzusehen: Um das Tuch an einer kleinen Stelle stark auszulenken, muss man es stark dehnen. Das Argument mit der SRT zeigt aber, dass das für jedes Feld gelten muss, bei dem eine zeitliche Änderung Energie kostet – letztlich besteht das Universum ja nicht aus Gummitüchern.)
Die lorentzinavriante Größe, die uns hier interessiert, ist die Lagrangefunktion (o.k., für PedantInnen ist es die Lagrange-Dichte, da mache ich keinen Unterschied, weil ich sonst ein schickes kalligraphisches L bräuchte). Die bekommt jetzt als einen Term
Damit ist dieser Teil der Lagrange-Funktion
Für unsere extrem einfache Feldtheorie können wir damit die Wirkung ausrechnen. Beim Elektron haben wir an jedem Punkt seines Pfades (also zu jedem Zeitpunkt) die “Lagrangefunktion” berechnet (die die Drehgeschwindigkeit des Pfeils angab), und dann über alle diese Werte von der Startzeit zur Zielzeit summiert.
Hier ist das jetzt ähnlich, aber da wir es jetzt mit einem Feld zu tun haben, nicht mit einem Pfad, haben wir zu jeden Zeitpunkt nicht bloß einen einzelnen Ort, sondern ein ganzes Feld – zu jeder Zeit hat das Feld ja überall einen Wert. Statt Orten, die sich entlang von Pfaden ändern, müssen wir jetzt also Feldkonfigurationen betrachten, die uns sagen, welchen Wert das Feld an jedem Ort zur gerade betrachteten Zeit hat. Wir müssen also die Funktion φ an jedem Punkt des Raumes kennen, außerdem ihre zeitliche Änderung.
Damit das nicht so abstrakt bleibt, zeige ich es euch an einem Beispiel.
Stellt euch vor, das Feld (also unser Gummituch) würde jetzt so aussehen:
Seine räumliche Änderung könnt ihr leicht erkennen – ihr seht ja direkt, wie sich das Feld von Ort zu Ort ändert. An den “Flanken” des Berges ist sie am größten, an seiner Spitze und ganz Außen ist sie sehr klein. Das sieht dann näherungsweise so aus:
Dieses Bild zeigt also die räumliche Änderung des Feldes.
Weil das Feld einigermaßen “glatt” aussieht, ist die räumliche Änderung von Ort zu Ort klein – deswegen ist auch der Hügel ziemlich flach. Die Energie, die in dieser Anordnung steckt, ist also auch klein.
Um die zeitliche Änderung zu sehen, müssen wir auch noch wissen, wie das Feld einen Moment später aussieht. Hat sich der Berg ein bisschen ausgebreitet und sieht zum Beispiel so aus,
dann können wir den Unterschied zwischen “jetzt” und “gleich” berechnen:
Auch dieser Unterschied ist klein.
Wir wollen jetzt also die Lagrangefunktion berechnen (die uns nachher, in der Quantentheorie, sagen wird, wie schnell sich unsere Amplitudenpfeile drehen), in die die räumliche und zeitliche Änderung eingeht. Die Lagrangefunktion ist eine Funktion an jedem Punkt, denn an jedem Punkt hat das Feld ja eine räumliche und zeitliche Änderung. So sieht sie aus:
Mit Hilfe der Lagrangefunktion können wir jetzt eine Gleichung aufstellen, die das Verhalten der Membran beschreibt, die sogenannte Bewegungsgleichung. Wie das geht? Wir sind ja noch in der klassischen Physik (noch haben wir keine Amplituden oder so berechnet – das können wir ja erst, wenn wir die Wirkung mit den Mitteln der klassischen Physik berechnet haben). Unsere Membrangleichung ist also eine klassische Gleichung, die wir mit dem “Prinzip der kleinsten Wirkung” vom letzten Mal berechnen können. Wer’s genau wissen will, muss sich hinter die Warnschilder trauen.
Das geht ganz analog zur klassischen Mechanik. Dort hat man ja die Lagrange-Funktion L. Für eine Feder ist sie z.B.
und man berechnet die Bewegungsgleichung gemäß
Für die Feder ergibt das
wobei kx gerade die Federkraft ist.
Hier geht das entsprechend (allerdings mathematisch korrekt mit funktionalen Ableitungen)
Das Ergebnis ist eine Wellengleichung, also eine Gleichung, die als Lösung ebene Wellen hat wie zum Beispiel diese hier
Für die Membran ist das auch eigentlich ganz anschaulich – wenn man sie an einer Stelle auslenkt und dann loslässt, dann breiten sich ja Wellen nach außen aus – ähnlich wie wenn man einen Stein ins Wasser wirft und Wasserwellen bekommt.
Diese Animation hier (erstellt mit dem alten aber immer noch hervorragenden Paket xtoys vom Mike Creutz – läuft auf jeder Linux-Kiste mit C-Compiler stressfrei seit 15 Jahren (mit Cygwin sicher auch unter Windows)) gibt eine Idee, wie so eine Welle aussieht, die sich von einer zentralen Anregung aus ausbreitet:
Wie ihr seht, breitet sich die Störung gleichmäßig nach außen aus (und ich verrate hier vermutlich kein Geheimnis, wenn ich euch sage, dass die Geschwindigkeit – für ein echtes Teilchenfeld, nicht für ein Gummituch – natürlich die Lichtgeschwindigkeit ist). Falls ihr euch übrigens wundert, dass der Simulationsschalter hier auf “light” steht – für den hier betrachteten Fall sind die Wellengleichung für Licht und die für unser “Gummituch” identisch.
Exkurs: Diesen kleinen Exkurs dürft ihr überspringen und beim Exkurs-Ende wieder einsteigen, falls ihr keinen Widerspruch zwischen den beiden Animationen seht. Er ist aber nicht sehr anspruchsvoll, deswegen gibt es keine Warnschilder.
Noch dabei? Gut, hier also das Problem, das ich kurz anreißen will und das euch vielleicht Kopfzerbrechen macht: Erst habe ich erzählt, die Lösungen seien ebene Wellen, dann aber habe ich euch einen Blob gezeigt, der sich nach links und rechts ausbreitet und der gar nicht wie die ebene Welle aus dem Bild davor aussieht. Ist das nun eine Lösung oder nicht?
Ja, ist es – sonst hätte ich sie nicht gezeigt. Der Trick besteht darin, dass es sich um eine Überlagerung von ebenen Wellen handelt. Man kann einen solchen “Blob” mathematisch als Summe vieler verschiedener ebener Wellen ansehen. Unsere Gleichung (die ich hier im harmlosen Teil nicht hinschreibe) hat die Eigenschaft, dass die Summe zweier Lösungen auch wieder eine Lösung ist. Deswegen darf man verschiedene Wellen zu einer neuen Lösung addieren.
Das ist übrigens bei vielen physikalischen Gleichungen so – dasselbe Prinzip der Überlagerung von Lösungen gilt auch für den Elektromagnetismus (die Maxwell-Gleichungen) und ich habe es auch schon für Elektronen diskutiert.
Ende des Exkurses
Betrachtet man die ebenen Wellen als Lösung der Wellengleichung, dann sieht man, dass eine Welle mit sehr großer Wellenlänge eine sehr kleine Energie bekommt (die Energie ist umgekehrt proportional zur Wellenlänge). Das bedeutet, dass es gar keine Energie kostet, das gesamte Gummituch überall (und zwar unendlich langsam, wegen der zeitlichen Änderung) um den gleichen Betrag zu verschieben. Das ist wenig überraschend: Wir haben einen Beitrag der räumlichen und einen Beitrag der zeitlichen Änderung in unserer Lagrangefunktion. Wenn sich weder räumlich noch zeitlich was ändert, dann sind beide Beiträge zur Lagrangefunktion Null. Da diese beiden Terme aber Energieterme sind, ist auch die Energie Null.
Für das Gummituch ist das vielleicht sinnvoll – nicht aber für ein Feld, das irgendwann einmal ein Elementarteilchen wie ein Elektron beschreiben soll. Ein Elektron kann nicht einfach so aus dem Nichts entstehen, weil das Energie kostet, denn ein Elektron hat eine Masse, und Masse ist bekanntlich Energie. (Beim Elektron kommen noch Dinge wie Ladungserhaltung usw. hinzu, aber das spielt hier keine Rolle.) Also sollte auch unser Elektronenfeld nicht einfach von Null verschieden sein können, ohne dass das Energie kostet.
Bei einem masselosen Feld, wie zum Beispiel dem Feld der Photonen, ist das anders. Das sieht man auch daran, dass die zugehörige Gleichung eine Gleichung für Potentiale ist – auch in der klassischen Physik darf man deren Nullpunkt ja frei wählen.
Wir sollten also zu unserer Energie noch einen Term hinzunehmen, der dafür sorgt, dass die Energie nur dann gleich Null ist, wenn unser Feld Null ist. Ich nenne ihn erstmal den “Extra-Term”. Der Extra-Term enthält einen Parameter m – wir werden später sehen, dass wir ihn physikalisch tatsächlich mit einer Masse identifizieren können, allerdings erst in der Quantenfeldtheorie. Hier dient er nur dazu, das Feld eindeutig auf “Null” zu setzen. (Kommt euch diese Gleichungs-Bastelei seltsam vor? Alles ein bisschen willkürlich, hier nen Term addiert, da noch was drangepappt, und so weiter. Tatsächlich aber wurden viele zentrale Gleichungen in der Physik zunächst auf diese intuitive Weise gefunden – Schrödinger hat’s so gemacht und Dirac auch. Wie man sich seine Gleichungen bastelt, ist erstmal egal – wichtig ist, dass sie den Vergleich mit der Realität bestehen.)
Der “Extra-Term” sorgt dafür, dass unser klassisches Problem eine eindeutige Lösung mit kleinster Energie hat, nämlich φ=0. Er verändert die ebenen Wellen als Lösung nicht sichtbar (obwohl sich intern ein paar Zahlen ändern), aber wenn man sich ansieht, was passiert, wenn man am Gummituch mit “Extraterm” zupft, dann sieht man schon einen deutlichen Unterschied:
Ohne Extra-Term breitet sich die anfängliche Störung mit gleichbleibender Geschwindigkeit nach außen aus, mit Extra-Term dagegen ist unser Gummituch etwas “träger” und die Anregung lässt eine Störung zurück, die nur langsam abklingt.
Damit bekommen wir für die Lagrange-Funktion
Wobei ich das φ quadriert habe, damit der Term immer positiv ist.
Weil das eine Art “potentielle Energie” ist, bekommt der Term in der Lagrangefunktion ein Minus-Zeichen. (Wer’s nicht glaubt, kann mit ein bisschen Mechanik-Kenntnissen von der Lagrange- zur Hamilton-Funktion übergehen und sich davon überzeugen, dass alles passt.)
Die Größe m ist zunächst mal ein Parameter – noch können wir sie eigentlich nicht mit der Masse identifizieren, weil das von den Einheiten her nicht passt. Ich habe hier mal wieder ?=c=1 gesetzt – wenn man die wieder reinnimmt, dann ist der Term ?² c²m² φ², wenn m die Einheit einer Masse bekommen soll. Da steckt aber ein ? drin, und da wir noch in einer klassischen Theorie sind, dürfen wir das nicht benutzen. (Sagte ich oben schon, dass ich ein bisschen schlampig mit Einheiten umgehe?)
So oder so ergibt sich die Bewegungsgleichung
oft geschrieben als
Für die Lösungen gilt
Wenn ihr euch die Formel für die Lagrangefunktion anguckt, könnt ihr leicht in eine fiese Falle tappen: Das Prinzip der kleinsten Wirkung sagt, dass die Wirkung minimal sein soll – aber dann könnte ich sie doch wegen des negativen Vorzeichens am Extra-Term beliebig klein machen, wenn ich nur φ groß genug wähle. Unser φ geht also immer gegen unendlich???
Nein, tut es nicht. Das Prinzip der kleinsten Wirkung funktioniert ja für gegebene Anfangs- und Endzustände – wenn φ am Anfang und am Ende einen bestimmten Wert haben soll, dann müsstet ihr φ ja stark ändern, um es möglichst groß werden zu lassen, und dann schlagen die Ableitungsterme zu.
Das Ergebnis ist unter dem Namen Klein-Gordon-Gleichung bekannt. Die Klein-Gordon-Gleichung Gleichung wurde ursprünglich von Schrödinger aufgestellt, aber als er versuchte, mit ihr das Elektron zu beschreiben, passte das Ergebnis nicht zu den Beobachtungen, und so drehte er an der Gleichung, bis er die Schrödingergleichung fand.
Moment mal? Haben wir die Klein-Gordon-Gleichung nicht gerade für ein klassisches Gummituch-Feld hergeleitet, ohne jede Quantenmechanik? Wieso hat Schrödinger diese Gleichung als Alternative zur Schrödingergleichung aufstellen wollen? Ist das nicht seltsam?
Ist es. Und wie. Es ist so seltsam, dass ich diesen Widerspruch als “erste Verwirrung der Quantenfeldtheorie” bezeichnen möchte. Was genau dahinter steht – ratet mal, wo ihr das erfahrt…
Abschließend noch eine Frage an euch: Liest hier eigentlich noch irgendjemand mit, der nicht Physik studiert oder studiert hat? Wenn ja, ist das hier noch halbwegs verständlich? Klemmt’s irgendwo? Beschwert euch ruhig in den Kommentaren, dann gebe ich mir Mühe, Unklarheiten zu beseitigen.
Kommentare (54)