Hausdorff wies darauf hin, dass selbst für meßbare Mengen die relativen Häufigkeiten nicht konvergieren müssen und dass die behauptete Sigma-Additivität nicht gilt. In der über Jahre polemisch geführten Debatte wurde moniert, dass von Mises so allgemeine Auswahlen zugelassen habe, dass seinen Forderungen im Allgemeinen nicht genügt werden könne. (Das ist in Analogie zur Existenz nicht-meßbarer Mengen.) Da er nicht sagte, wie die Schwierigkeit zu beheben sei, blieb der Vorwurf der Inkonsistenz des Kollektivbegriffs zunächst unausgeräumt. Ein Kritiker argumentierte, von Mises‘ Definition sei so, als ob man eine Folge von kleiner werdenden Kreideflecken an die Tafel malen und einen Punkt als Limes dieser Folge definieren wolle. Es gab aber (gerade in der mathematischen Statistik) auch vehemente Unterstützer seines Zugangs, darunter auch Neyman. Von vielen Mathematikern wurde Mises‘ Ansatz jedoch als ein empirischer, naturwissenschaftlicher Ansatz angesehen – nicht als ein Axiomensystem, mit dem Mathematiker arbeiten könnten.
In den 1930er Jahren versuchte dann noch Erhard Tornier, eine natürlichere Definition von Wahrscheinlichkeiten zum Laufen zu bringen. Von der Kollektivtheorie inspiriert wollte er eine Häufigkeitstheorie entwickeln. Er ließ das Regellosigkeitsaxiom weg, das aber gerade deterministische Folgen hatte ausschließen sollen. Eine Folge von Folgen war für ihn ein Häufigkeitsmodell, wenn für alle in geeignetem Sinne innen und außen durch Zylinderfolgen approximierbaren Mengen die Häufigkeit konvergiert. Schon das Beispiel eines einzelnen Münzwurfs, wo alle Folgen die Länge 1 haben und beispielsweise das abwechselnde Werfen von 0 und 1 ein Modell wäre, zeigt die Problematik dieses Ansatzes.

Dementgegen war der maßtheoretische Ansatz zur Wahrscheinlichkeitstheorie schon in Hausdorffs grundlegendem Lehrbuch zur mengentheoretischen Topologie angedeutet worden und in den 1920er Jahren arbeiteten zahlreiche Mathematiker mit Wahrscheinlichkeiten wie mit Maßen. (Als erste Arbeit, die Maße im Sinne einer geometrischen Wahrscheinlichkeitstheorie verwendet, würde man später Filip Lundbergs Dissertation von 1903 über Versicherungsmathematik identifizieren, die freilich als völlig unverständlich galt. Émile Borel hatte 1909 den Begriff normaler Zahlen mit einem wahrscheinlichkeitstheoretischen Ansatz untersucht und bewiesen, dass die nicht-normalen Zahlen eine Nullmenge bilden. Zu jener Zeit hatte Borel solche Interpretationen aber noch als reine Bezeichnungsfragen abgetan und nicht als eigentliche Bedeutung von Wahrscheinlichkeit.) Umgekehrt enthielten die Arbeiten der Lemberger funktionalanalytischen Schule regelmäßig eine wahrscheinlichkeitstheoretische Interpretation maßtheoretischer Resultate.
Aber es gab keine Standardreferenz, keine allgemein als verbindlich angesehene Definition von Wahrscheinlichkeiten. Diese besorgte erst 1933 Kolmogorow mit seinem Lehrbuch “Grundbegriffe der Wahrscheinlichkeitsrechnung”, in dessen Vorwort es hieß: “Der diesen allgemeinen Gesichtspunkten entsprechende Aufbau der Wahrscheinlichkeitsrechnung war in den betreffenden Kreisen seit einiger Zeit geläufig; es fehlte jedoch eine vollständige und von überflüssigen Komplikationen freie Darstellung des ganzen Systems.”

Der Kontext mathematischer Wahrscheinlichkeiten ist gemäß dieser Definition ein Wahrscheinlichkeitsraum, bestehend aus einer Menge, einer σ-Algebra von Teilmengen und einem Wahrscheinlichkeitsmaß. Die Mengen entsprechen Ereignissen in der Realwelt, die Punkte entsprechen Elementarereignissen, einzelnen (möglichen) Beobachtungen. Zufallsvariablen entsprechen Funktionen von realen Beobachtungen.
Der Idee, dass eine Zufallsvariable einfach nur eine meßbare Funktion ohne weitere Konnotation ist, standen viele Wahrscheinlichkeitstheoretiker skeptisch gegenüber. Kolportiert wurde die Frage eines prominenten Statistikers, ob orthogonale Zufallsvariablen mit Mittel Null notwendig unabhängig sind (wie unter der zusätzlichen Annahme einer bivariaten Gaußverteilung) und dessen Überraschung ob des einfachen Beispiels Sinus und Kosinus.

Tatsächlich brauchte es einige Zeit, bis Kolmogorows Ansatz allgemein akzeptiert wurde. Vor allem das mit seinem Ansatz bessere Verständnis von Grenzwertsätzen spielte dabei eine Rolle.
Willy Feller, mit dem Tornier in Kiel zusammengearbeitet hatte, und für dessen Entlassung als Dozent Tornier gleich nach der Machtergreifung sorgte, begann in der Emigration, sich mit Wahrscheinlichkeitstheorie zu beschäftigen. Ursprünglich bei Courant über transzendente Kurven promoviert, war seine erste „Arbeit“ zur neuen Wahrscheinlichkeitstheorie ein Review zu Kolmogorows Buch: „The calculus of probabilities is constructed axiomatically, with no gaps and in the greatest generality, and for the first time systematically integrated, fully and naturally, with abstract measure theory. The axiom system is certainly the simplest imaginable. … The great generality is noteworthy; probabilities in infinite dimensional spaces of arbitrary cardinality are dealt with. … The presentation is very precise, but rather terse, directed to the reader who is not unfamiliar with the material. Measure theory is assumed.“
In Kopenhagen, wo er ab 1934 arbeitete, schrieb Feller dann eine Arbeit, in der er den mathematischen Inhalt und die Bedeutung der “beiden wichtigsten Grenzwertsätze der modernen Wahrscheinlichkeitstheorie” aufklärte, nämlich des zentralen Grenzwertsatzes und des von Kolmogorow bewiesenen Gesetz des iterierten Logarithmus, einer ursprünglich von Hardy und Littlewood bei Arbeiten über die Approximierbarkeit irrationaler Zahlen aufgestellten Vermutung. Für den von Lindenberg 1920 bewiesenen zentralen Grenzwertsatz fand er eine andere hinreichende Bedingung. (Unabhängig fand solche Bedingungen auch Paul Lévy, damals führender Wahrscheinlichkeitstheoretiker in Paris.) Diese und andere Arbeiten wie eben auch das in der Sprache der Maßtheorie formulierte Fundamentallemma der mathematischen Statistik – dessen einfacher Beweis nur im stetigen Fall funktionierte – überzeugten die Mathematiker, dass der maßtheoretische Ansatz zur Wahrscheinlichkeitstheorie der richtige sei.
Später in den USA verfaßte Feller 1950 ein zweibändiges Werk Introduction to Probability Theory and its Applications, das für lange Zeit das populärste Lehrbuch der Wahrscheinlichkeitstheorie wurde: es faßte eine zweihundertjährige Entwicklung zusammen und benutzte kaum über die Oberschule hinausgehende Techniken. Etwa gleichzeitig entstand mit Paul Halmos’ Lehrbuch die erste im Westen erschienene Darstellung der Maßtheorie, angepaßt an die Bedürfnisse von Vorlesungen in Wahrscheinlichkeitstheorie und ohne technische Subtilitäten.
Auch wenn es gerade in Frankreich und den USA noch Wahrscheinlichkeitstheoretiker gab, die den maßtheoretischen Ansatz als gegen die Intuition ansahen, waren die von Kolmogorow eingeführten Axiome spätestens in den 1950er Jahren “das” Axiomensystem der Wahrscheinlichkeitstheorie geworden. Man überließ es nun den Philosophen, seine Beziehung zur Realität zu diskutieren.

1 / 2 / 3

Kommentare (6)

  1. #1 Frank Wappler
    2. Juli 2020

    Thilo schrieb (2. Juli 2020):
    > […] 1933 Kolmogorow mit seinem Lehrbuch “Grundbegriffe der Wahrscheinlichkeitsrechnung” […]
    > Der Kontext mathematischer Wahrscheinlichkeiten ist gemäß dieser Definition ein Wahrscheinlichkeitsraum, bestehend aus einer Menge, einer σ-Algebra von Teilmengen und einem Wahrscheinlichkeitsmaß. Die Mengen entsprechen Ereignissen in der Realwelt, die Punkte entsprechen Elementarereignissen, einzelnen (möglichen) Beobachtungen.

    Da das Wort “Ereignis” zumindest in bestimmten Teilgebieten der Physik für einen ganz bestimmten Begriff benutzt wird (nämlich auch “Koinzidenz” genannt, jeweils identifiziert dadurch “wer daran zusammen teilnahm” und “was dabei jeweils von einem dieser Teilnehmer wahrgenommen wurde”), möchte ich gegenüberstellen:

    Die Menge, aus der jeweils ein Wahrscheinlichkeitsraum besteht, entspricht einer Menge von Ergebnissen von (denkbaren) Messungen in der Realwelt; seine einzelnen Elemente nennt man Ergebnis (oder auch “Messwert”), jeweils ermittelt aus gegebenen Beobachtungsdaten (eines Versuchs).

    > Zufallsvariablen entsprechen Funktionen von realen Beobachtungen.

    Entsprechend werden Zufallsvariablen als Funktionen von Ergebnissen bzw. von Ergebnismengen (“auf einem Maßraum”) aufgefasst.

    p.s.
    ScienceBlogs-Kommentar-HTML-Test:

    “A<sup>0</sup> wird dargestellt als: “A0”.

  2. #2 Fluffy
    2. Juli 2020

    Ignorieren Sie #1

  3. #3 Frank Wappler
    https://You.know.Jerry...I.don-t.know...sometimes...I-d.like.to...you.know...edit.with.ScienceLogs.just.like...you.know...we.might.edit.with... well...whatever...
    3. Juli 2020

    Thilo schrieb (2. Juli 2020):
    > […] 1933 Kolmogorow mit seinem Lehrbuch “Grundbegriffe der Wahrscheinlichkeitsrechnung” […]
    > Der Kontext mathematischer Wahrscheinlichkeiten ist gemäß dieser Definition ein Wahrscheinlichkeitsraum, bestehend aus einer Menge, einer σ-Algebra von Teilmengen und einem Wahrscheinlichkeitsmaß. Die Mengen entsprechen Ereignissen in der Realwelt, die Punkte entsprechen Elementarereignissen, […]

    Dieser Gebrauch des Wortes “Ereignis” ist offenbar spezifisch in der Wahrscheinlichkeitstheorie, und damit verschieden von, oder sogar inkompatibel mit, der Bedeutung dieses Wortes in der Alltagssprache oder in bestimmten anderen Wissenschaften. (Insbesondere besteht eine definierte Beziehung solcher “Ereignisse” zu (einzelnen, oder gewissen Mengen von) “Ergebnissen”; die offensichtlich durch ein Wort benannt sind, das in Alltagssprache und bestimmten anderen Wissenschaften ebenfalls Verwendung findet.)

    Um (zumindest) die Definitions- und Argumentations- bzw. Beweis-Strukturen (Kalküle) der oben beschriebenen Wahrscheinlichkeitsrechnung dennoch auch für Lebens- bzw. Wissenschaftsbereiche zu erschließen, die die Worte “Ereignis” bzw. “Ergebnis” schon begrifflich belegt haben (wobei insbesondere zwischen deren “Ereignissen” und “Ergebnissen” nicht unbedingt eine entsprechende Beziehung besteht wie die genannte Beziehung zwischen “Ereignissen” der Wahrscheinlichkeitstheorie und “Ergebnissen” der Stochastik), um die betreffenden Kalkül-Anwendungen dafür überhaupt konsistent verbalisieren zu können, bietet es sich an, insbesondere das Wort “Ereignis” in der zitierten Formulierung je nach Anwendungsfall geeignet zu ersetzen (und diese Formulierung dadurch zu erläutern) — etwa:

    Die Mengen eines Wahrscheinlichkeitsraumes entsprechen Krankheitsbildern, die Punkte einzelnen Befunden.

    oder

    Die Mengen eines Wahrscheinlichkeitsraumes entsprechen Teilmengen des Wertebereiches eines Messoperators, die Punkte einzelnen Messwerten.

    oder

    Die Mengen eines Wahrscheinlichkeitsraumes besagen z.B., welche Hände deines Gegenspielers dein Blatt schlagen würden, die Punkte entsprechen bestimmten einzelnen solchen Händen.

  4. #4 Karl-Heinz
    3. Juli 2020

    Danke für den interessanten Artikel.
    Wird aber einige Zeit benötigen, bis ich ihn durchgelesen und vollständig verstanden habe. 😉

  5. #5 Fluffy
    4. Juli 2020

    #3
    Anzahl der Zeichen mit Wiederholung: 2345
    Anzahl der Zeichen ohne Wiederholung: 52
    (Leerzeichen und Zeilenumbrüche zusammengefasst)

    Dynamische Entropie : ……S = 4.39 (bit)
    Maximal mögliche Entropie: S = 5.70 (bit)

  6. #6 Frank Wappler
    The Main Event, 2001
    4. Juli 2020

    Fluffy schrieb (#5, 4. Juli 2020):
    > #3
    > Anzahl der Zeichen mit Wiederholung: 2345
    > Anzahl der Zeichen ohne Wiederholung: 52
    > (Leerzeichen und Zeilenumbrüche zusammengefasst) […]

    Fleißig, fleißig, Fluffy!

    Kommentar #3 enthält allerdings u.a. ganze (sogar für manche Tools erkennbare) Zeichenketten, die auf dieser Webseite auch außerhalb von Kommentar #3 auftreten.
    Und sogar ganze Zeichenketten, die außerhalb jedes Kommentars auf dieser Webseite auftreten.

    Zähle doch (bitte) mal die Zeichen (mit bzw. ohne Wiederholung) auf dieser Webseite, die zu gar keinem Kommentar gehören!

    p.s. —
    (Entfällt. (It’s just too much … fluff …)).