For this analysis, we believe the relevant number is not the speed of a single GPU, nor the capacity of the biggest datacenter, but the amount of compute that is used to train a single model — this is the number most likely to correlate to how powerful our best models are.

AlphaGo ist wohl das bekannteste Beispiel für das Leistungswachstum selbsttrainierender Maschinen. Man fragt sich, wie sich dieser Faktor, ob nun 300000 oder 1,5 Millionen, in die Verbesserung der Spielstärke umrechnet.

Über die Schrift hinaus

Es ist noch keine zehn Jahre her, dass manche Publizisten am liebsten jeden an die Wand gestellt hätten, der sich den neuen technologischen Entwicklungen in den Weg stellen wollte. Als etwa im Jahr 2010 Wohnungs-Eigentümer und Mieter die Möglichkeit bekamen, ihre Häuser in Google Street View verpixeln zu lassen, fanden sich 269 Aktivisten unter Führung von Jens Best, die nun diese Häuser gerade fotografieren und ins Netz stellen wollten. So sollte die Freiheit des öffentlichen Raumes verteidigt werden und dafür war Best (nach eigener Aussage damals) sogar bereit, ins Gefängnis zu gehen. (Die Aktion scheint dann aber bald eingeschlafen zu sein.)

Inzwischen geht es jetzt in eine andere Richtung und immer mehr Autoren entwerfen im Zusammenhang mit Google und Facebook das Szenario eines totalen Überwachungsstaates.

950C43B2-BAF6-4593-9841-73F933073D21

Das im Suhrkamp-Verlag erschienene Buch seiner Aufsichtsratsvorsitzenden Ulla Berkewicz unterscheidet sich davon insofern, dass es keine konkreten Szenarien an die Wand malt, sondern die Entwicklung künstlicher Intelligenzen in größere philosophische und geisteswissenschaftliche Zusammenhänge einzuordnen versucht, gründend (laut Verlagswerbung) “auf das vedische, das jüdische und das mathematisch-topologische Wissen” – mit Norbert Wiener und Joseph Weizenbaum (im Buch “Rabbi Wiener” und “Rabbi Weizenbaum”) als Wiedergänger des Rabbi Löw, der im Prag des 16. Jahrhunderts den Golem entwickelt (haben soll).

Das Buch zerfällt in zwei Teile. Der erste ist eine wortgewaltige Abrechnung mit den (nach Meinung der Autorin) ursprünglich aus der Tradition der LSD-Aktivisten und Blumenkinder stammenden Netzaktivisten und Silicon Valley-Pionieren, die sich und ihre Erfindungen einer “neuen kapitalistischen Logik” unterworfen hätten und nun eine neue Übermenschenideologie “esoterisch, rassistisch, amerikanisch konsumtiv” vertreten würden.

Im zweiten Teil, und hier kommt nun der Mathematiker ins Staunen, geht es um Grigori Perelman, der (nach Meinung der Autorin) mit einem “Minimum an blinder Rechnung” auskomme, weil er mit “einem Maximum an sehenden Gedanken” arbeite. Im Buch wird Perelman dann gemeinsam mit der Schriftstellerin Friederike Mayröcker in einem Wiener Cafe die Entzweiung von Logos und Mythos überwinden.
Der Verlag bewirbt diesen zweiten Teil so:

In einer überwältigenden poetischen Phantasie überschreitet in der dreizehnten Stunde einer Faschingsdienstagnacht eine Dichterpartisanin die Schwelle des Erzählens und ein Mathematikrebell die Zählbarkeit der Zahl. Das sprengt eine Potentaten-, Künstler- und Bürgergesellschaft aus ihrem Rahmen, so dass sie den beiden in ihre Vorstellungsfreiheit folgen kann. Die geistes- und naturwissenschaftlichen Grundgedanken für dieses anarchische Spektakel entwickelt eine so provokante wie kompromisslose Prosaschrift, die zeigt, was möglich ist, wenn wir unsere Wahrnehmung nicht auf unsere Sphäre der drei Dimensionen beschränken, sondern unseren Vorstellungen freien Lauf lassen in Bereiche, die von den Begriffen Raum und Zeit nicht begrenzt sind.

Aus Sicht des Mathematikers sind das erstaunliche Behauptungen: im Vergleich zu Beweisen anderer topologischer Sätze ist der Beweis der Poincare-Vermutung doch recht rechenintensiv.
Aber natürlich ist das dichterische Freiheit und so wie Gödel immer herhalten muss für Interpretationen seiner Arbeit, die mit deren tatsächlicher Bedeutung wenig oder nichts zu tun haben, so darf man natürlich auch Perelman als Metapher verwenden.

Ob Maschinen die Macht übernehmen und Kreativität dann noch mit Rechenkraft wird mithalten können, das sollte natürlich auch von “fachfremden” Geisteswissenschaftlern diskutiert werden. Was dieses Buch allerdings zu zäher Lektüre macht, ist die wohl als besonders kreativ empfundene Überfrachtung des Textes mit tausenden vagen Assoziationen zu allen möglichen geistesgeschichtlichen Bezügen. Über weite Strecken liest sich das wie die Arbeit eines Schülers, der seinem Lehrer beweisen will, was er alles schon gelesen und wie viele Fremdwörter er nachgeschlagen hat. Ein willkürlich herausgegriffenes Textbeispiel:

Seit also die exakten Wissenschaften des magischen Agens, die Theogonien und Kosmogonien des Hermes Trismestigos und des Moses Ben Amram, die dem all einen Zweck dienten, das universale Gleichgewicht, die aus der Analogie der Gegensätze resultierende Harmonie zu erhalten oder wiederherzustellen, dem Vergessen anheimgefallen, seit Manipulation mit Hilfe naturgegebener Mittel durch die unberechenbaren Möglichkeiten unserer Vorstellungsfreiheit, unseres baren Selbst, der Manipulation durch Berechenbares gewichen ist, seit kommerzialisierte Zweigwissenschaften mehr öffentlichen Reiz darstellen als ihre exakten Stammschulen, Zombiologie und Technomagie wirtschaften und wüten, Statistik als adäquate Beschreibung von Realität gilt und das Geräusch der Spülmaschine sich anhört, als atme da wer zuverlässig in unsere Gottverlassenheit, sind wir auf dem Abweg, uns selber um uns selbst zu bringen, uns der Struktur des Formalen anzupassen und als “Maschine der Natur” berechenbar zu werden. Müssen wir, wie Erwin Schrödinger, der Quantenheilige, in weiter Voraussicht schrieb, fürchten, “dass wir uns entwicklungsmechanisch dem Ende einer Sackgasse nähern”.

B073204D-8F12-4E8D-A997-D8D0608D71F6

1 / 2

Kommentare (13)

  1. #1 Novidolski
    8. November 2018

    Wachstumsfunktionen sind in der Wirtschaft von Bedeutung. Bei der Finanzierung eines Hauses unterschieden sich zwei Angebote um nur 0,2 %.
    Als ich mit Mark und Pennig nachrechnete, dann betrug
    der Unterschied nach 10 Jahren immerhin 6000 DM.

  2. #2 Mathematiker
    9. November 2018

    Och Novidolsky…..

    Nun, bei 0,2 %, 10 Jahren und 6.000 Mark beträgt Ihre Hyphothek also mindestens 300.000 Mark.

    Tatsächlich beträgt ihre Hyphothek aber mehr. Wissen sie nur nicht, da sie keine Ahnung der Exponentialfunktion haben…..

    Im übrigen lässt sich ihe Beispiels mangels Informationen nicht nachrechnen, aber das ist wohl gewollt. Wissen sie ja selbst, warum nicht, sie sind ja ein klasse Mathematiker und wissen alles, gelle?

  3. #3 Tim
    9. November 2018

    “wortgewaltig” … In der Regel bedeutet das “schlecht geschrieben unter Verwendung zahlreicherer unklarer Begriffe”.

  4. #4 Frank Wappler
    9. November 2018

    Thilo schrieb (8. November 2018):
    > […] Tetration ^ba:=a^{a^{a\ldots}}, wobei (b-1)-mal potenziert wird.

    Die beiden Ausdrücke

    \underbrace{ a^{(a^{(a^{(\ldots)})})} }_{\text{(}b \text{ mal)}}

    und

    \underbrace{ (((a)^{a})^{a})^{(\ldots)} }_{\text{(}b \text{ mal)}}

    sind im Allgemeinen nicht äquivalent, z.B.

    3^{(3^{3})} := 3^{27} \neq (3^3)^3 := 9^3 = 3^6.

    Der entsprechende Wikipedia-Artikel https://de.wikipedia.org/wiki/Potenzturm besagt

    Dabei gilt die Konvention, dass Potenztürme „von oben nach unten“ abgearbeitet werden, also mit der höchsten Potenz beginnend:

    2^{3^{4}} bedeutet daher 2^{(3^4)} = 2^{81} und nicht (2^{3})^4 = 8^4 = 2^12.

    > Wenn man diese Verknüpfung unendlich oft wiederholt, erhält man die Funktion […]

    … offenbar ausdrücklich: x \overset{(\text{o}\rightarrow\text{u})}{\mapsto} \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \, \underbrace{ x^{(x^{(x^{(\ldots)})})} }_{\text{(}b \text{ mal)}} \, \right] .

    (Wobei die »Abarbeitung „von oben nach unten“« ausdrücklich durch “(\text{o}\rightarrow\text{u})” symbolisiert sein soll.)

    > Für alle x im Intervall e^{-e}<x<e^{\frac{1}{e}}

    … der Wikipedia-Artikel usw. legen eher nahe: im geschlossenen Interval e^{-e} \le x \le e^{\frac{1}{e}}

    > nimmt die Funktion einen endlichen Wert an.

    Der Graph aus dem obigen Artikel scheint insbesondere zu zeigen:
    Für den Argument-Wert $x := \sqrt[e]{e}$ nimmt die Funktion den (endlichen Abbildungs-) Wert e an.

    Bedeutet das aber nun ganz ausdrücklich

    \sqrt[e]{e} \overset{(\text{o}\rightarrow\text{u})}{\mapsto} e ??

    Den Eindruck habe ich nicht.
    Denn schon mit dem Parameterwert b := 4 ergibt sich für den den Argument-Wert $x := \sqrt[e]{e}$ bei ausdrücklicher »Abarbeitung „von oben nach unten“« ein Ergebniswert größer als $3 > e$: siehe https://www.wolframalpha.com/input/?i=(((e%5E(1%2Fe))%5E(e%5E(1%2Fe)))%5E(e%5E(1%2Fe)))%5E(e%5E(1%2Fe))

    [Fortsetzung folgt auf eventuelle Nachfrage.]

  5. #5 Frank Wappler
    https://www.wolframalpha.com/input/?i=(((e%5E(1%2Fe))%5E(e%5E(1%2Fe)))%5E(e%5E(1%2Fe)))%5E(e%5E(1%2Fe))
    9. November 2018

    Thilo schrieb (8. November 2018):
    > […] Tetration ^ba:=a^{a^{a\ldots}}, wobei (b-1)-mal potenziert wird.

    Die beiden Ausdrücke

    \underbrace{ a^{(a^{(a^{(\ldots)})})} }_{\text{(}b \text{ mal)}}

    und

    \underbrace{ (((a)^{a})^{a})^{(\ldots)} }_{\text{(}b \text{ mal)}}

    sind im Allgemeinen nicht äquivalent, z.B.

    3^{(3^{3})} := 3^{27} \neq (3^3)^3 := 9^3 = 3^6.

    Der entsprechende Wikipedia-Artikel https://de.wikipedia.org/wiki/Potenzturm besagt

    Dabei gilt die Konvention, dass Potenztürme „von oben nach unten“ abgearbeitet werden, also mit der höchsten Potenz beginnend:

    2^{3^{4}} bedeutet daher 2^{(3^4)} = 2^{81} und nicht (2^{3})^4 = 8^4 = 2^{12}.

    > Wenn man diese Verknüpfung unendlich oft wiederholt, erhält man die Funktion […]

    … offenbar ausdrücklich: x \, \, \overset{(\text{o}\rightarrow\text{u})}{\mapsto} \, \, \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \, \underbrace{ x^{(x^{(x^{(\ldots)})})} }_{\text{(}b \text{ mal)}} \, \right] .

    (Wobei die »Abarbeitung „von oben nach unten“« ausdrücklich durch “(\text{o}\rightarrow\text{u})” symbolisiert sein soll.)

    > Für alle x im Intervall e^{-e}<x<e^{\frac{1}{e}}

    … der Wikipedia-Artikel usw. legen eher nahe: im geschlossenen Interval e^{-e} \le x \le e^{\frac{1}{e}}

    > nimmt die Funktion einen endlichen Wert an.

    Der Graph aus dem obigen Artikel scheint insbesondere zu zeigen:
    Für den Argument-Wert x := \sqrt[e]{e} nimmt die Funktion den (endlichen Abbildungs-) Wert e an.

    Bedeutet das aber nun ganz ausdrücklich

    \sqrt[e]{e} \, \, \overset{(\text{o}\rightarrow\text{u})}{\mapsto} \, \, e ??

    Den Eindruck habe ich nicht.
    Denn schon mit dem Parameterwert b := 4 ergibt sich für den Argument-Wert x := \sqrt[e]{e} bei ausdrücklicher »Abarbeitung „von oben nach unten“« ein Ergebniswert größer als $3 > e$; konkret

    { \left( {\left( {{\sqrt[e]{e}}^{ \sqrt[e]{e} }} \right)}^{ \sqrt[e]{e} }  \right) }^{ \sqrt[e]{e} }  \gtrsim 3.0319294865

    [Fortsetzung folgt auf eventuelle Nachfrage.]

  6. #6 Frank Wappler
    https://www.wolframalpha.com/input/?i=(e%5E(1%2Fe))%5E((e%5E(1%2Fe))%5E(e%5E(1%2Fe))%5E(e%5E(1%2Fe)))
    9. November 2018

    Frank Wappler schrieb (#5, 9. November 2018 ):
    > […] Denn schon mit dem Parameterwert b := 4 ergibt sich für den Argument-Wert x := \sqrt[e]{e} bei ausdrücklicher »Abarbeitung „von oben nach unten“« ein Ergebniswert größer als 3 > e; konkret

    { \left( {\left( {{\sqrt[e]{e}}^{ \sqrt[e]{e} }} \right)}^{ \sqrt[e]{e} }  \right) }^{ \sqrt[e]{e} }  \gtrsim 3.0319294865

    Ah! — da wird doch offenbar, dass in dieser Formel „von unten nach oben abgearbeitet“ würde!
    (Es geht doch nichts über eine ordentliche Kommentarvorschau! …&)

    Dagegen ist

    {\sqrt[e]{e}}^{\left({\sqrt[e]{e}^{\left({\sqrt[e]{e}}^{\sqrt[e]{e}}\right)}}\right)}  \lesssim 1.9895735

    offenbar „von oben nach unten abzuarbeiten“.

    Der im obigen Artikel gezeigte Graph entspricht also tatsächlich der Konvention, dass Potenztürme „von oben nach unten“ abgearbeitet werden; zeigt also tatsächlich die Funktion x \overset{(\text{o}\rightarrow\text{u})}{\mapsto} \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \, \underbrace{ x^{(x^{(x^{(\ldots)})})} }_{\text{(}b \text{ mal)}} \, \right] .

    p.s.
    Bliebe höchstens zu fragen, wo die andere entsprechende “unkonventionelle” Funktion, d.h. mit »Abarbeitung „von unten nach oben“« kovergiert; also die Funktion

    x \, \, \overset{(\text{u}\rightarrow\text{o})}{\mapsto} \, \, \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \,   \underbrace{ (((x)^{x})^{x})^{(\ldots)} }_{\text{(}b \text{ mal)}} \, \right].

  7. #7 Frank Wappler
    https://www.wolframalpha.com/input/?i=(e%5E(1%2Fe))%5E((e%5E(1%2Fe))%5E(e%5E(1%2Fe))%5E(e%5E(1%2Fe)))
    9. November 2018

    Frank Wappler schrieb (#5, 9. November 2018 ):
    > […] Denn schon mit dem Parameterwert b := 4 ergibt sich für den Argument-Wert x := \sqrt[e]{e} bei ausdrücklicher »Abarbeitung „von oben nach unten“« ein Ergebniswert größer als 3 > e; konkret

    { \left( {\left( {{\sqrt[e]{e}}^{ \sqrt[e]{e} }} \right)}^{ \sqrt[e]{e} }  \right) }^{ \sqrt[e]{e} }  \gtrsim 3.0319294865

    Ah! — da wird doch offenbar, dass in dieser Formel „von unten nach oben abgearbeitet“ würde!
    (Es geht doch nichts über eine ordentliche Kommentarvorschau! …&)

    Dagegen ist

    {\sqrt[e]{e}}^{\left({\sqrt[e]{e}^{\left({\sqrt[e]{e}}^{\sqrt[e]{e}}\right)}}\right)}  \lesssim 1.9895735

    offenbar „von oben nach unten abzuarbeiten“.

    Der im obigen Artikel gezeigte Graph entspricht also tatsächlich der Konvention, dass Potenztürme „von oben nach unten“ abgearbeitet werden; zeigt also tatsächlich die Funktion x \overset{(\text{o}\rightarrow\text{u})}{\mapsto} \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \, \underbrace{ x^{(x^{(x^{(\ldots)})})} }_{\text{(}b \text{ mal)}} \, \right] \equiv x^{x{^{x{^{x^{\, \ldots}}}}}}.

    p.s.
    Bliebe höchstens zu fragen, wo die andere entsprechende “unkonventionelle” Funktion, d.h. mit »Abarbeitung „von unten nach oben“« konvergiert; also die Funktion

    x \, \, \overset{(\text{u}\rightarrow\text{o})}{\mapsto} \, \, \underset{b \rightarrow \infty}{\text{lim}} \! \! \left[ \,   \underbrace{ (((x)^{x})^{x})^{(\ldots)} }_{\text{(}b \text{ mal)}} \, \right].

  8. #8 michael
    10. November 2018

    > Bliebe höchstens zu fragen, …

    Laeuft das nicht auf die Berechnung des Grenzwertes von x^(x^n) fuer n gegen unendlich hinaus ? Fuer x=1 ist der Wert jedenfalls 1.

  9. #9 Frank Wappler
    10. November 2018

    Frank Wappler schrieb (#4, #5, 9. November 2018):
    > 3^{(3^{3})} := 3^{27} \neq (3^3)^3 := 9^3 = 3^6.

    Autsch! — Ich bitte um Entschuldigung!, und korrigiere:

    3^{(3^{3})} := 3^{27} \neq (3^3)^3 := 27^3 = 3^9.

    p.s.
    michael schrieb (#8, 10. November 2018):
    > »Abarbeitung „von unten nach oben“« Laeuft das nicht auf die Berechnung des Grenzwertes von x^(x^n) fuer n gegen unendlich hinaus ?

    So weit ich mich auch nochmal aus dem Fenster zu lehnen versuche — ich erkenne leider gerade (auch) nicht, wie sich das anschaulich durch “geschicktes Umstellen und Auflösen der Formel” herleiten ließe.
    (Oder gar, ob das für negative oder komplexe x überhaupt zuträfe. …)

  10. #10 Thilo
    11. November 2018

    Die Potenztürme sind von oben nach unten abzuarbeiten, denn ansonsten hätte man ja tatsächlich einfach x^(x^n).

  11. #11 Frank Wappler
    http://just.because.several.individuals.were.each.by.themselves.incompetent--does.not.rule.out.--that.they.intended.to.conspire
    12. November 2018

    Thilo schrieb (#10, 11. November 2018):
    > Die Potenztürme sind von oben nach unten abzuarbeiten

    Das entspicht offenbar der Definition von “Potenzturm” sowie der Kovention, Ausdrücke der Form

    \underbrace{ x^{(x^{(x^{(\ldots)})})} }_{\text{(}n \text{ mal)}}

    bzw.

    \underbrace{ x^{x^{x^{{\, .}^{{\, .}^{{\, .}^{\, x}}}}}} }_{\text{(}n \text{ mal)}}

    als Notation von Potenztürmen aufzufassen.

    Und diese Konvention lässt sich auch begründen/motivieren: …

    > denn ansonsten hätte man ja tatsächlich einfach x^(x^n).

    Diese einfache Formel (für “das Abarbeiten von unten nach oben”, d.h. für “das unkonventionelle Abarbeiten”) entspricht der von michael (#8, 10. November 2018) angegebenen.

    Mich beschäftigt aber immer noch, wie sie (anschaulich) herzuleiten wäre …
    … oder, mittlerweile, ob sie überhaupt stimmt. Denn im Probe-Fall x = 2, n = 3:

    {(2^2)}^2 = 4^2 = 16 \neq {2^{(2^3)} !

    Ich komme dagegen auf die (allerdings ebenfalls einfache) Formel “x^(x^(n – 1))”, zumindest für positive Werte n.

    Beweis
    Induktionsanfang n = 1:

          f[ \, x \, ] \equiv f[ \, x^1 \, ] \equiv f[ \, x^{(x^{0})} \, ] \equiv f[ \, x^{(x^{(1 - 1)})} \, ].

    Induktionsschritt:
          g[ \, {(x^{(x^{(n - 1)})})}^x \, ] = g[ \, {(x^{((x^{(n - 1)}) \times x)})} \, ] = g[ \, {(x^{(x^{((n+1) - 1)})})} \, ].

  12. #12 Novidolski
    13. November 2018

    Mathematiker,
    die Verzinsung des Kredites unterschied sich um 0,2 %.
    Damit ich mich bei der Exponentialfunktion nicht irre, habe ich mit absoluten Beträgen gerechnet. Und da Sie meine Tilgungrate nicht kennen und auch nicht den Kreditzins
    können Sie nicht auf die Höhe der Hypothek schließen. Zumal Sonderzahlungen extra erlaubt waren.

  13. #13 Novidolski
    13. November 2018

    Nachtrag Mathematiker
    das waren 10 x 12 Berechnungen, diese Mühe habe ich mir gemacht und war selbst überrascht, dass sich die Rückzahlungsbeträge um 6 000 € unterschieden.