Das Ziel, alle einfachen endlichen Gruppen zu klassifizieren, wurde erstmals 1892 von Otto Hölder formuliert. Zu diesem Zeitpunkt kannte man an einfachen Gruppen die alternierenden Gruppen An für n≥5 und die meisten projektiven linearen Gruppen über endlichen Körpern, an sporadischen Gruppen nur die fünf Mathieu-Gruppen. Im 20. Jahrhundert wurden zunächst eine Reihe endlicher einfacher Gruppen vom Lie-Typ entdeckt, in den 60er Jahren dann verschiedene sporadische Gruppen u.a. von Janko und Conway, und in den 70er Jahren schließlich die drei Fischer-Gruppen sowie die Babymonster- und Monster-Gruppe. Damit sollte die Liste der endlichen einfachen Gruppen komplett sein. Der Beweis der Vollständigkeit dieser Liste wurde in den 70er Jahren vor allem von Gorenstein und Aschbacher vorangetrieben und Gorenstein verkündete 1981 auf einem Meeting der American Mathematical Society den Abschluss des Beweises. Einige Schritte waren noch nicht aufgeschrieben und veröffentlicht, dies betraf vor allem die Klassifikation sogenannter quasi-dünner Gruppen, zu der es ein unveröffentlichtes 800-seitiges Manuskript gab. Jean-Pierre Serre vertrat die Ansicht, der Beweis sei lückenhaft, und behielt damit letztlich auch Recht. Anders gelagerte Kritik kam von Michael Atiyah, der offensiv die Meinung vertrat, dass Mathematik schön sein müsse und es häßliche Mathematik nur deshalb gäbe, weil man die wahren Zusammehänge noch nicht erkannt habe. In diesem Sinne kritisierte er den auf viele tausend Seiten angewachsenen Beweis des Klassifikationssatzes.

Die größte der endlichen einfachen Gruppen ist die sogenannte Monstergruppe. Ihre Existenz war 1973 von Fischer und Griess vermutet worden und wurde 1980 von Griess bewiesen. Er konstruierte sie (unter dem Namen „the friendly giant“) als Gruppe gewisser Automorphismen einer kommutativen, nicht-assoziativen Algebra auf einem 196884-dimensionalen komplexen Vektorraum. Diese Zahl 196884 kommt in der Mathematik noch an anderer Stelle vor: in der Theorie der Modulfunktionen.
Die dem Gitter Z+Zτ mit Im(τ)>0 entsprechende elliptische Kurve hat die j-Invariante j(\tau):=12^3\cdot\frac{g_2^3(\tau)}{\Delta(\tau)}. Zwei elliptische Kurven sind genau dann isomorph, wenn sie dieselbe j-Invariante haben; andererseits ist j(τ) invariant unter der Wirkung von SL(2,Z) durch gebrochen-lineare Transformationen auf der oberen Halbebene H2. Die j-Funktion vermittelt also eine Bijektion des Modulraums elliptischer Kurven mit der „Modulkurve“ H2/SL(2,Z). Sie erzeugt den Ring der Modulfunktionen (d.h. der SL(2,Z)-invarianten Funktionen auf der oberen Halbebene) und ihre Potenzreihe in q=e2πiτ ist j(τ)=1/q+196884q+21493760q2+864299970q3+…
Andererseits sind die Dimensionen der irreduziblen Darstellungen der Monstergruppe r1=1,r2=196883,r3=21296876,r4=842609326,… und man stellt fest, dass für die Koeffizienten der j-Funktion gilt 1=r1, 196884=r1+r2, 21493760=r1+r2+r3, 864299970=2r1+2r2+r3+r4.
Die sich daraus ergebende Vermutung, dass alle Koeffizienten der j-Funktion Dimensionen von (reduziblen) Darstellungen der Monstergruppe sind, bezeichnete Conway als “monströsen Mondschein”, also als monströsen Quatsch. Die Erklärung, die McKay und Thompson vorschlugen: es gibt eine gradierte Darstellung, deren Dimensionen die Koeffizienten sind. Zuvor hatten schon Zahlentheoretiker einen Zusammenhang zwischen Modulfunktionen und der Monstergruppe beobachtet. Andrew Ogg hatte mit Serre und Thompson über die hyperbolischen Orbifaltigkeiten H20(p) zu Kongruenzuntergruppen Γ0(p) gearbeitet. Wenn man die Fricke-Involution auf der Kompaktifizierung dieser Orbifaltigkeit wirken läßt, hat der Quotientenraum für genau fünfzehn Primzahlen (p=2,…,31, 41,47,59,71) einen Quotienten vom Geschlecht 0. Diese Primzahlen nennt man supersinguläre Primzahlen, für die entsprechenden Kongruenzgruppen wird der Körper der Modulfunktionen von einer einzigen Funktion erzeugt wird so wie die Modulfunktionen zu SL(2,Z) von j erzeugt werden. Diese supersingulären Primzahlen waren nun gerade die Primteiler der Ordnung der Monstergruppe und Ogg offerierte eine Flasche Whisky für eine Erklärung.

Die auf Hermann Weyl zurückgehende Charakterformel (bzw. die sich aus der Charakterformel ergebende „Nenner-Formel“) hat Ähnlichkeit mit einigen klassischen Produktidentitäten, was von MacDonald und Kac damit erklärt wurde, dass letztere sich als Nennerformeln für gewisse Kac-Moody-Algebren ergeben. Kac-Moody-Algebren sind unendlich-dimensionale Verallgemeinerungen von Lie-Algebren und haben mit diesen viele Eigenschaften gemein. Sie sind von Bedeutung in der Stringtheorie, weil ein Raum quantisierter Strings eine Kac-Moody-Algebra ist. Viele Beispiele solcher Algebren können mit Stringtheorie konstruiert werden. Für eine dieser Algebren, die sogenannte Monsteralgebra, führte die Produktidentität j(p)-j(q)=\frac{1}{p}\Pi_{m>0,n\in{\mathbb Z}}(1-p^mq^n)^{c_{m\cdot n}} für die Koeffizienten ck in der Reihenentwicklung der j-Funktion dann letztlich zum Beweis der Mondscheinvermutung durch Richard Borcherds.

Die Monster-Algebra ist das einfachste Beispiel einer Lie-Algebra physikalischer Zustände eines chiralen Strings auf einer Orbifaltigkeit. Die Orbifaltigkeit wird konstruiert wie folgt. Man betrachtet zunächst das eindeutige gerade unimodulare Gitter II25,1 im (26-dimensionale Stringtheorie beschreibenden) Lorentz-Raum R25,1. Es besteht aus den Punkten mit ganz- und halbzahligen Koordinaten, für die die Summe der Koordinaten durch 2 teilbar ist. Der Vektor v=(0,1,2,…,24,70) hat Lorentz-Norm 0 – es ist eine sehr spezielle Eigenschaft der Zahl 24, dass es diesen ganzzahligen Vektor der Lorentz-Norm 0 gibt – und der Quotient des Unterraums {x: x.v=-1,x.x=2} modulo v ist ein 24-dimensionaler Vektorraum. Sein Schnitt mit II25,1 ist ein 24-dimensionales Gitter, das als Leech-Gitter bezeichnet wird und eine Reihe spezieller Eigenschaften hat. Der Quotient des 24-dimensionalen Vektorraums nach dem Leech-Gitter ist ein 24-dimensionaler Torus, sein Quotient nach der Multiplikation mit -1 ist eine Orbifaltigkeit. Man betrachtet nun ein “physikalisches” System, nämlich die 2-dimensionale konforme Fieldtheorie, die die Bewegung eines Strings auf dieser 24-dimensionalen Orbifaltigkeit beschreibt. Die Symmetriegruppe des Leech-Gitters ist die Conway-Gruppe Co0, aber durch die Betrachtung des Strings bekommt man eine größere Symmetriegruppe, nämlich die Monstergruppe. Damit geben alle Energieniveaus Darstellungen der Monstergruppe. Die Zustandssumme dieses Systems ist die j-Funktion und aus der Stringtheorie weiß man, dass die Koeffizienten der Zustandsssumme gerade die Anzahlen der Zustände in den jeweiligen Energieniveaus sind.
Das ist freilich nur die Heuristik. Borcherds’ Beweis der Mondscheinvermutung vermeidete den Physikerjargon völlig, sprach von Vertexoperatoralgebren statt von Stringtheorie und wird in jedem Fall auch dann mathematisch korrekt bleiben, wenn die Stringtheorie sich als physikalisch falsch herausstellen sollte.
Motiviert von der Stringtheorie waren aber jedenfalls die Axiome einer Vertexalgebra. Zu einem geraden Gitter L assoziiert man eine Vertexalgebra VL, deren zugrundeliegender Vektorraum das Tensorprodukt des Gruppenrings CL mit einer abzählbaren Summe von Kopien des Gitters ist. In der Stringtheorie entspricht das den chiralen Zuständen eines sich in der Raum-Zeit bewegenden Strings, modulo der Periodizitäten des Gitters. Aus der zum 24-dimensionalen Leech-Gitter L assoziierten Vertexalgebra VL kann man eine andere Vertexalgebra konstruieren, auf der die Monstergruppe mit den gewünschten Eigenschaften wirkt: Zu der durch Multiplikation mit -1 gegebenen Involution des Leech-Gitters hat man eine Involution h von VL und einen irreduziblen mit h getwisteten VL-Modul V’L, auf dem sich h heben läßt. Die Fixpunktmenge von h auf der direkten Summe V^\sharp=V_L\oplus V_L^\prime ist die Mondscheinalgebra. (Die Konstruktion dieser “Mondscheinalgebra” wurde von I. Frankel, Lepowsky und Meurman in einem mehr als 500 Seiten langen Buch durchgeführt. Die beiden Summanden entsprechen den beiden konformen Feldtheorien zum Leech-Gitter.) Die Mondscheinalgebra hat Rang 24, ihre gradierte Dimension ist die Reihenentwicklung der j-Funktion und ihre Automorphismengruppe ist die Monstergruppe. Mit Hilfe dieser Mondscheinalgebra konnte Borcherds dann die Monsteralgebra konstruieren, eine verallgemeinerte Kac-Moody-Algebra, auf der die Monstergruppe wirkt und deren Wurzelvielfachheiten die Koeffizienten der j-Funktion sind. (Durch das Leech-Gitter werden die einfachen Wurzeln der unendlich-dimensionalen Monsteralgebra indiziert.) Durch Vergleich mit einer anderen (isomorphen) verallgemeinerten Kac-Moody-Algebra erhielt Borcherds, dass die Weylsche Charakterformel der Monsteralgebra durch die Koike-Norton-Zagier-Identität gegeben ist. Damit und mit fortgeschrittenen Methoden aus der algebraischen Topologie konnte Borcherds die Koeffizienten der McKay-Thompson-Reihe berechnen und letztlich die Mondscheinvermutung beweisen.

Die Wirkung auf der Mondscheinalgebra charakterisiert die Monstergruppe auf eine ähnliche Weise wie die Conway-Gruppe Co0 als Automorphismengruppe des Leech-Gitters charakterisiert wird oder die Mathieu-Gruppe M24 als Automorphismengruppe des Golay-Codes. Richard Borcherds’ Beweis der Mondscheinvermutung nutzte Identitäten, auf die man erst durch die Stringtheorie gekommen war, unendlich-dimensionale Verallgemeinerungen klassischer Identitäten für Lie-Algebren. Die Richtigkeit seines mathematischen Beweises hing aber nicht von der Richtigkeit der physikalischen Theorie ab. Tatsächlich bewies er einen allgemeineren Satz: Für jedes Element g der Monstergruppe und seine Wirkung auf dem gradierten Mondschein-Modul V ist die McKay-Thompson-Reihe T_g(q)=\sum_{n=1}^\infty Spur(g\mid_{V_n})q^n ein Hauptmodul für eine Untergruppe Γ von SL(2,R), für die Γ\H2 eine Fläche vom Geschlecht 0, also eine mehrfach punktierte Sphäre ist. (Ein Hauptmodul für Γ ist im Wesentlichen ein Analogon zur j-Funktion für SL(2,Z): er erzeugt den Ring der Modulfunktionen für Γ.) Mit diesem Ansatz bekam Borcherds dann auch überraschende unendliche Produktzerlegungen für verschiedene Modulfunktionen.