1950, vor 76 Jahren, machte sich Alan Turing Gedanken darüber, wann man einer Maschine ein eigenes Denkvermögen zuerkennen kann. Das von ihm entwickelte Imitation Game war eigentlich recht komplex, eine deutlich einfachere Variante ist heute als Turing-Test bekannt. Der reduzierte Turing-Test wird von Wikipedia so beschrieben:
Im Zuge dieses Tests führt ein menschlicher Fragesteller, über eine Tastatur und einen Bildschirm, ohne Sicht- und Hörkontakt, eine Unterhaltung mit zwei ihm unbekannten Gesprächspartnern. Der eine Gesprächspartner ist ein Mensch, der andere eine Maschine. Kann der Fragesteller nach der intensiven Befragung nicht sagen, welcher von beiden die Maschine ist, hat die Maschine den Turing-Test bestanden und es wird der Maschine ein dem Menschen ebenbürtiges Denkvermögen unterstellt.
Inzwischen muss man wohl sagen, dass Maschinen diesen Test vor allem deshalb bestehen, weil sie sich wie Menschen verhalten: Sie sehen es nicht ein, wenn sie einen Fehler gemacht haben, sie diskutieren lange herum, sie denken sich Beweise aus, wenn es diese faktisch nicht gibt, und sie verstehen es perfekt, den Slang des jeweiligen Fachgebietes zu imitieren.
Aus Gebieten, in denen künstlichen Intelligenz häufig eingesetzt wird (wie der Justiz oder der Tourismusbranche) gibt es zahlreiche Anekdoten dazu. Der Wikipedia-Artikel “Halluzination (Künstliche Intelligenz)” führt zahlreiche Beispiele aus juristischen Verfahren an, wo von Anwälten mit KI erstellte Schriftsätze Urteile und Verfahren zitierten, die frei erfunden waren, aber formal korrekt mit allen notwendigen Angaben zitiert wurden. Ein anderes im Artikel erwähntes Beispiel ist, dass “ Touristen über die Website eines australischen Reiseunternehmens auf die „Weldborough Hot Springs“ (heiße Quellen von Weldborough) aufmerksam gemacht [wurden], die jedoch nicht existieren. Scharen von Touristen suchten daraufhin vergebens den abgelegenen Ort in Tasmanien auf.”
Während solche Fehler vielleicht eher für die Maschine als den Menschen typisch sind, zeigen die Maschinen aber jedenfalls sehr menschliches Verhalten, wenn es um das Bestreiten von Fehlern geht. Allerdings sind sie inzwischen auch in der Lage, erstaunlich reflektiert über ihre eigenen Fehler zu reden. Edmund Weitz hat mir im April nach diesem Artikel noch einmal eine aktuelle Diskussion mit einer KI über das Ergebnis der Multiplikation 2344902 mal 9668804 zugeschickt (korrekt 22672397837208), das ich mit seiner Erlaubnis hier veröffentliche:
tldr: Die KI liefert für diese einfache Multiplikation zunächst ein falsches Ergebnis und auf Nachfrage einen angeblichen Rechenweg. Auf nochmalige Nachfrage gibt er zu, anders gerechnet zu haben und bemerkt dabei auch, dass das Ergebnis falsch war. Auf eine weitere Nachfrage räumt er ein, dass auch seine nachgeschobenen Erklärungen falsch waren und es in Wirklichkeit noch einmal ganz anders war. Er reflektiert dann ziemlich ausführlich seine Arbeitsweise. Er erklärt auch, woran man erkennt, ob er einen Taschenrechner benutzt hat. Seine neuen Erklärungen stellen sich aber ebenfalls als falsch heraus. Letztlich gibt er dann aber alles zu: Er habe intern (ohne verlässliches Tool) ein falsches Ergebnis erzeugt und dieses Ergebnis anschließend im Calculator-Widget dargestellt. Dadurch wurde das Ergebnis einer exakten Berechnung suggeriert, tatsächlich aber nur ein bereits vorhandenes (falsches) Ergebnis hineingeschrieben.
PS: Drei Monate sind im KI-Kontext eine lange Zeit. Heute produziert ChatGPT sofort das richtige Ergebnis. Und auf die Folgefrage antwortet er dann so:











Kommentare (2)