Anlässlich der vor kurzem erfolgten Eröffnung des „AfD-Meldeportals“ für unerwünschte Lehrinhalte in meiner Wahlheimat Sachsen-Anhalt gibt es im „Frischen Wind“ heute mal eine kleine Rechenübung aus dem Bereich der Wahrscheinlichkeitslehre (Niveau 11./12. Klasse) für alle subversiven Lehrerinnen und Lehrer da draußen.

Die Besucherschaft eines Musikfestivals besteht zu 90% aus Angehörigen der Mehrheit sowie zu 10% aus Angehörigen einer Minderheit. Am Eingang zum Festgelände werden verdachtsunabhängige Kontrollen nach mitgeführten Drogen durchgeführt. Führt ein für die Kontrolle ausgewählter Besucher oder eine Besucherin tatsächlich Drogen mit sich, werden diese mit an Sicherheit grenzender Wahrscheinlichkeit auch entdeckt. Während nur jeder zehnte Angehörige der Mehrheit kontrolliert wird, muss sich jeder zweite Angehörige der als „krimineller“ geltenden Minderheit einer Kontrolle unterziehen. Tatsächlich ist der Anteil an Drogenkonsumenten in beiden Personengruppen mit 5% exakt gleich hoch.

Am nächsten Tag findet sich in der Presseberichterstattung zum Festival der folgende Satz:

„Obwohl Angehörige der Minderheit lediglich 10% der Besucherschaft ausmachten, waren sie für über 35% der an diesem Abend festgestellten Drogendelikte verantwortlich.“

Ist dieses Ergebnis rechnerisch plausibel?

Die Frage nach der rechnerischen Plausibilität der Zeitungsaussage lässt sich auch so formulieren: Mit welcher Wahrscheinlichkeit gehört eine zufällig kontrollierte Person der Minderheit an, wenn sie eines Drogendelikts überführt wurde? Es darf daher analog zur Logik des Satz von Bayes gerechnet werden (detaillierte Einführung siehe hier, praktisches Anwendungsbeispiel siehe hier). Vereinfacht formuliert ergibt sich bei einer exemplarischen Besucherzahl von 10.000 Menschen:

  • Von 9.000 Angehörigen der Mehrheit führen 450 (5%) Drogen mit sich. Da 10% der Angehörigen der Mehrheit zufällig kontrolliert werden, ist in dieser Gruppe mit etwa 45 erfassten Delikten zu rechnen.
  • Von 1.000 Angehörigen der Minderheit führen 50 (ebenfalls 5%) Drogen mit sich. Da jedoch 50% der Angehörigen der Minderheit zufällig kontrolliert werden, ist in dieser Gruppe mit etwa 25 erfassten Delikten zu rechnen.

Tatsächlich wurden also 25 von 70 (35,7%) der an diesem Abend insgesamt erfassten Delikte von Angehörigen der Minderheit begangen. Die in der Presse getroffene Aussage ist somit zumindest rechnerisch korrekt. Selbstverständlich kann man auf Basis der gleichen Zahlen aber auch zu einem inhaltlich gänzlich anderen Fazit gelangen:

  • Von den 900 (10%) kontrollierten Angehörigen der Mehrheit führten 45 (5%) Drogen mit sich, von den 500 (50%) kontrollierten Angehörigen der Minderheit führten 25 (5%) Drogen mit sich. Der Hang zur Drogenkriminalität ist somit in beiden Gruppen offenbar gleich hoch.

Man sieht schon: Welche Schlüsse man aus den Ergebnissen der verdachtsunabhängigen Kontrollen zieht, hängt wesentlich davon ab, ob sämtliche relevanten Zahlen (d.h. auch die Anzahl der ohne einen Drogenfund kontrollierten Personen sowie deren Aufteilung auf Mehrheit und Minderheit) vorliegen, oder ob lediglich eine selektive Auswahl (“x Delikte insgesamt, davon y% verübt durch Angehörige der Minderheit”) weitergegeben und/oder bewertet wird. Der sich aus letzterem ergebende Teufelskreis ist offensichtlich: Eine als höher wahrgenommene Neigung zu kriminellem Verhalten wird letztlich zu einem noch stärkeren Kontrolldruck und damit zur wiederholten Selbstbestätigung dieser verzerrten Wahrnehmung führen.

Und ja – das ist ein echtes Problem: In den USA werden beispielsweise Afro-Amerikaner deutlich häufiger als weiße Amerikaner wegen des möglichen Besitzes von Marihuana kontrolliert, obwohl alle vorliegenden Zahlen darauf hinweisen, dass die Nutzung von Marihuana unter weißen und Afro-Amerikanern ähnlich weit verbreitet ist. Im Ergebnis ist die Wahrscheinlichkeit dafür, dass ein Afro-Amerikaner wegen eines Marihuana-Delikts vor Gericht verurteilt wird, fast vier Mal so hoch wie die Wahrscheinlichkeit dafür, dass ein weißer Amerikaner für das gleiche Vergehen belangt wird.

Kommentare (27)

  1. #1 Uli Schoppe
    12. November 2018

    Danke für den interessanten Einblick, da macht man sich (oder jedenfalls ich..) sonst keine Gedanken drüber!

  2. #2 CM
    12. November 2018

    Das ist ein viel-zitiertes Beispiel, welches schön umformuliert wurde. Ich hoffe es wird von Lehrern (wo auch immer aufgegriffen).

    Da ich selber Lehre mache, möchte ich aber darauf hinweisen, dass da

    Ist dieses Ergebnis rechnerisch plausibel?

    mit “ja” beantwortet werden kann (s. Ausführung), bei machem Schüler die (unterliegende) Botschaft nicht ankommt. Vielleicht zweigeteilt: “Ist dieses Ergebnis rechnerisch plausibel? Wie könnte man es besser darstellen und warum bzw. welche Zahlen bleiben ungenannt?”

    Subtilität ist halt nicht jedermanns Sache …

  3. #3 schorsch
    12. November 2018

    Man darf aber nicht vergessen, dass es sich bei einem Drogendelikt bei der einen Gruppe um ein Wohlstandsdelikt handelt, bei der anderen Gruppe aber um ein Einstiegsdelikt, welches regelmäßig zu weit gemeinschädlicheren Delikten führt.

    Insofern ist die Ungleichbehandlung durchaus plausibel.

  4. #4 Wunderlich
    Berlin
    12. November 2018

    Und das weiß der Schorsch genau woher?

  5. #5 Jürgen Schönstein
    12. November 2018

    Der Begriff “verdachtsunabhängig” hat allerdings einen Orwell’schen Beigeschmack. Denn ganz offenbar werden die zwei Personengruppen unterschiedlich dieser Missetat “verdächtigt”, weshalb es für nötig erachtet wird, die Minderheit deutlich schärfer zu kontrollieren.

  6. #6 Curious.Sol
    12. November 2018

    @schorsch (#3): In dem Blogbeitrag geht es nicht um die Ungleichbehandlung an sich. Im Übrigen sind Sie uns jetzt den empirischen Nachweis für Ihre Behauptung schuldig. Ich meine damit keine reinen Korrelationen, sondern den Nachweis für gerichtete statistische Zusammenhänge.

  7. #7 Christian Reinboth
    12. November 2018

    @Jürgen Schönstein: Im Prinzip gebe ich Dir da natürlich Recht – gemeint ist hier ja aber (und das wird hoffentlich auch so verstanden), dass es keine konkreten Verdachtsmomente sind, die eine Kontrolle auslösen (dann wäre die Trefferquote ja zusätzlich noch an die Güte der Detektion gebunden), sondern dass die Leute mehr oder weniger zufällig aus der Reihe der Wartenden gezogen werden – mit dem beschriebenen Bias, dass es Angehörige der Minderheit aufgrund bestehender Vorurteile eben deutlich häufiger trifft…

  8. #8 Christian Reinboth
    12. November 2018

    @CM: Guter Hinweis – sollte die Aufgabe irgendwann mal Eingang in eine meiner Aufgabensammlungen finden, werde ich die Fragestellung definitiv noch irgendwie ergänzen, um entsprechenden Fehlinterpretationen vorzubeugen. Eigentlich geht es mir ja aber auch gerade darum zu zeigen: Ja, die Zahlen stimmen und es wurde auch korrekt gerechnet – aber das Ergebnis führt einen trotzdem massiv in die Irre…

  9. #9 PDP10
    12. November 2018

    @schorsch:

    Man darf aber nicht vergessen, dass es sich bei einem Drogendelikt bei der einen Gruppe um ein Wohlstandsdelikt handelt, bei der anderen Gruppe aber um ein Einstiegsdelikt, welches regelmäßig zu weit gemeinschädlicheren Delikten führt.

    Insofern ist die Ungleichbehandlung durchaus plausibel.

    Verstehe ich nicht.

    Das wären bei einem Event – sagen wir mal in London (oder Frankfurt oder New York oder so) – also zB. die 10% Banker, die man bei solchen Veranstaltungen natürlich verschärft kontrolliert, weil man von denen weiß, dass die alle Koksen?

    Oder wie war das gemeint?

  10. #10 joselb
    12. November 2018

    Oder anders gesagt: „Obwohl Angehörige der Minderheit lediglich 10% der Besucherschaft ausmachten, stellten sie mehr als ein Drittel der Kontrollierten, bei denen keine Drogen gefunden wurden.“

  11. #11 Uli Schoppe
    13. November 2018

    @joselb
    YMMD !

  12. #12 CM
    13. November 2018

    Na ja, für Fortgeschritte wären dann abhängige Wahrscheinlichkeiten einzubauen und für ganz gefuchste auch so was wie inverses Sampling + beta-Verteilung: Wieviele Proben müsste man unter der Menge der Minderheit ziehen um eine Prävalenz, zunächst zu x geschätzt, mit einem ausreichend kleinen Fehler besser zu schätzen / zu verifizieren?

    😉

  13. #13 Alb
    13. November 2018

    @joselb
    mehr als die Hälfte!

  14. #14 Zufall
    Ludwigshafen
    14. November 2018

    Ihr konstruiertes Beispiel beruht auf der Annahme, dass der Anteil der Drogenkonsumenten in beiden Gruppen mit jeweils 5% gleich hoch ist.

    Hier ein Beispiel unter der Annahme, dass dieser Anteil in der 90%-Mehrheit z.B. nur 3% beträgt und in der 10%-Minderheit z.B. 30%.

    Kontrolliert werden in beiden Beispielen genau 1.400 von den 10.000 Personen:

    Mit “Racial Profiling”:

    Entdeckt in Gruppe A: 9.000 * 10% * 3% = 27 Personen
    Entdeckt in Gruppe B: 1.000 * 50% * 30% = 150 Personen

    Ohne “Racial Profiling”:

    Entdeckt in Gruppe A: 9.000 * 14% * 3% = 38 Personen
    Entdeckt in Gruppe B: 1.000 * 14% * 30% = 42 Personen

    Ohne “Racial Profiling” werden also 87 Personen nicht entdeckt.

    D.h. mit “Racial Profiling” ist die Entdeckung von Straftätern in diesem Beispiel > 100% erfolgreicher als ohne – bei vorgegebenem gleichen Kontrollaufwand.

  15. #15 Zufall
    14. November 2018

    Korrektur:
    Ohne “Racial Profiling” werden in dem Beispiel sogar 177 – 80 = 97 Straftäter nicht entdeckt.

  16. #16 user unknown
    https://demystifikation.wordpress.com/2015/03/19/40-000-jahre-sticky-fingers
    14. November 2018

    Was ist daran subversiv?

  17. #17 CM
    14. November 2018

    @user unkown: In der letzten Zeit keine Zeitung gelesen? 😉 Gut war der Artikel in der letzten ZEIT: https://www.zeit.de/2018/26/afd-lehrer-neutralitaetsgebot-beschwerde (online leider hinter paywall), der neue Spiegel bringt auch einen einschlägigen Artikel oder einfach googeln: “Lehrer Neutralitätsgebot”.

    Insofern verstehe ich das “subversiv” in der Einleitung als milde Ironie.

  18. #18 user unknown
    https://demystifikation.wordpress.com/2018/11/04/frauengeschichtsforschung/
    15. November 2018

    @CM:
    Ich sehe nicht, wie dieses neutrale Beispiel das Neutralitätsgebot unterläuft. Ist die AfD jetzt an der Regierung?

  19. #19 Christian Reinboth
    15. November 2018

    @Zufall: “Ihr konstruiertes Beispiel beruht auf der Annahme, dass der Anteil der Drogenkonsumenten in beiden Gruppen mit jeweils 5% gleich hoch ist.”

    Das stimmt. Leider tritt genau dieses Problem in der Realität auf: Minderheiten werden härter auf Delikte kontrolliert, obwohl eigentlich bekannt ist, dass diese nicht in stärkerem Maße von Minderheiten begangen werden. Dies wiederum führt zu der oben beschrieben Verzerrung und bestärkt damit den Teufelskreis aus Vorurteilen -> härteren Kontrollen -> mehr Erfassungen -> Verstärkung von Vorurteilen etc. pp. Ein Beispiel hierfür hatte ich weiter oben verlinkt:

    https://www.aclu.org/report/report-war-marijuana-black-and-white?redirect=criminal-law-reform/war-marijuana-black-and-white

  20. #20 Zufall
    15. November 2018

    Aus der Gesamtfragestellung lässt sich für den Mathe-Unterricht der 12. Klasse eine schöne tatsächlich “subversive” Optimierungsaufgabe erstellen:

    “Ermittle den optimalen Grad des “Racial Profiling” in Abhängigkeit von den (unbekannten, oder ggf. geschätzten) Anteilen der Drogenkonsumenten in beiden Gruppen bei vorgegebenem Kontrollaufwand und vorgegebenen Gruppengrößen.”

    Die Bezeichnung “Racial Profiling” ist natürlich ideologisch motiviert. Stattdessen könnte für die effektive Fahndungsarbeit der Polizei auch eine neutral-sachliche Bezeichnung wie z. B. “Group-specific Profiling” – “GSP” – verwendet werden.

    Es geht darum, wie man verdachtsunabhängig optimal ermittelt, bei durch irgendein beliebiges Merkmal unterscheidbaren Gruppen, wenn dieses Merkmal unterschiedlich mit einem anderen Merkmal korreliert ist.

    Mit dieser optimierten Methode des “GSP” bei gegebenem Aufwand z. B. doppelt so viele Vergewaltiger, Mörder etc. aus dem Verkehr zu ziehen, ist ethisch mit Sicherheit besser, als aus ideologischen Gründen darauf zu verzichten.

    Die korrelierten Merkmale hängen natürlich nicht von der “Rasse” ab, was auch immer darunter verstanden werden soll. Schon aus diesem Grund ist der ideologische Begriff “Racial Profiling” falsch und viel zu eng gefasst. Mit GSP – gefällt mir immer besser die eben ausgedachte Abkürzung – kann beliebig auf die jeweilige Straftat optimiert werden.

    Z. B. sollte man bei einer Rasterfahndung nach einem Selbstmord-Attentäter durchaus zwischen Christen und Moslems unterscheiden dürfen, die Wahrscheinlichkeit dürfte in der 90%-Gruppe Christen durchaus nicht dieselbe sein wie in der 10%-Gruppe Moslems. Usw. beliebig viele Beispiele … das kann auch Alter, Geschlecht, Nationalität, Religion, Kulturzugehörigkeit etc. sein, definitionsabhängig, auch die äußere Erscheinung kommt in Betracht.

    Klar, ist nicht das eigentliche Thema des Artikels, in dem es korrekt um irreführende Schlussfolgerungen aus falsch angewandtem “Racial Profiling” geht. Falsch angewandt ist “Racial Profiling” wenn das gesuchte Merkmal in beiden Gruppen gleich verteilt ist. Das darf aber nicht einfach vorausgesetzt werden, weil es meistens sicher falsch ist, sondern eine ggf. tatsächlich unterschiedliche Verteilung muss auf andere Weise ermittelt werden.

  21. #21 Uli Schoppe
    15. November 2018

    Na da war das Beispiel mit den Bankern und dem Koks ja ziemlich passend. Besser verstärkt kontrollieren den Haufen.

  22. #22 Dr. Webbaer
    15. November 2018

    Wenn zufällig, also keiner besonderen Maßgabe folgend kontrolliert wird und dann i.p. Herkunft kategorisiert wird, unterscheiden sich die ermittelten Ergebnisse, und zwar i.p. Herkunft meinend.
    So anscheinend der Befund.

    Mehr ist eigentlich nicht los, ansonsten wäre Maßgabe als Beleg beizubringen besonders zu Untersuchende als aufgegeben erklärt, von politischer Seite womöglich, biologische und unveränderliche Vorgabe meinend.

    Der Satz von Bayes ist nicht geeignet gegenrednerisch und anscheinend politisch bemüht beizubringen, wenn keine Voreinstellung bei den Untersuchenden belegt oder bewiesen ist.
    Es bliebe ansonsten Geschwätz.

    MFG + schönes Wochenende schon einmal,
    Dr. Webbaer

  23. #23 Zufall
    15. November 2018

    Ja, das Banker-Koks-Beispiel trifft es exakt.

    Ein anderes Beispiel zur Veranschaulichung der praktischen Notwendigkeit von “GSP”, ohne die bedenkliche “Racial”-Komponente, stattdessen mal genauso bedenkliches “Religious Profiling”:

    1000 Personen, 900 Laien (=Gruppe A) und 100 Priester (=Gruppe B) besuchen einen Kirchentag. Die Wahrscheinlichkeit für Kinderpornographie auf dem persönlichen Mobiltelefon betrage bei den Priestern 10%, bei den Laien 1% (wurde anderweitig ermittelt).

    Die Scharia-Religionspolizei hat den Auftrag und die Kapazität die Mobiltelefone von 100 Personen zu kontrollieren (ist natürlich nur eine Fiktion).

    Wieviele soll sie optimaler Weise aus Gruppe A und wieviele aus Gruppe B kontrollieren?

    Die Antwort liegt auf der Hand, dazu muss man nicht rechnen. Logischerweise alle 100 aus Gruppe B, dann hat man wahrscheinlich 10 Täter erwischt.

    Jeden den man stattdessen aus Gruppe A kontrollieren würde, verringert den Fahndungserfolg.

    Fazit: Kontrolliere immer NUR die Gruppe – bei vorgegebenem Kontrollaufwand – für die bereits im Vorfeld die höhere Tatwahrscheinlichkeit ermittelt wurde (Beweis als Übung … ;-)) Wie wird die Tatwahrscheinlichkeit im Vorfeld ermittelt? Das ist eine Fragestellung aus der Stichprobentheorie … anderes Thema.

    Ist das gerecht? Wenn man Opfer schützen und Täter finden will … anscheinend ja.

  24. #24 user unknown
    15. November 2018

    @Zufall:
    Das würde funktionieren, wenn die Prämisse stimmen würde, und wenn man es mit Automaten, nicht Menschen zu tun hätte.

    Beim Konzertbeispiel: Wenn 3 Konzerte so abgelaufen sind, wird der Konsument A beim vierten den Stoff seinem Freund B mitgeben, der nicht kontrolliert wird, und das spricht sich rum und die Erfolgsquote sinkt herab auf nahe Null.

    Außerdem: Wenn die Drogenkonsumenten nicht 100:0 verteilt sind nach Merkmal A:B, dann verletzt die Kontrolle aller mit Merkmal A das Gerechtigkeitsgefühl und das Vertrauen auf die Fairness und Farbenblindheit der Exekutive. Die Kosten für diesen Vertrauensverlust sind vielleicht höher, als das Erreichen einer optimalen Fangquote.

  25. #25 Dr. Webbaer
    16. November 2018

    Sogenanntes religiöses Profiling wird nicht benötigt, wenn eine sog. Religion die Altersgrenze 9 Jahre kennt.
    Stattdessen darf offen kommuniziert werden, dass Anhänger des gemeinten theozentrischen Kollektvismus neben sexueller Übergrifflichkeit auch sozusagen systembedingt politische Gewalt anwenden könnten.

    Bedingte Wahrscheinlichkeit ist in diesem Zusammenhang ein nicht zu bearbeitendes Problem.

  26. #26 Zufall
    16. November 2018

    @user unkown

    Stimmt. Lernen wurde in diesem einfachen Modell nicht berücksichtigt. Die Polizei sollte natürlich immer wieder genauso dazulernen wie die Kriminellen, d. h. die geschätzten Wahrscheinlichkeiten für das Kriminalitätsmerkmal müssten immer wieder durch neue – statistisch korrekt erhobene – Stichproben aktualisiert werden. In der nächsten Stufe ginge es dann um die Identifizierung dieser Komplizen-Gruppe der Freunde, die sie oben ansprechen, anhand anderer Merkmale, so dass diese ebenfalls häufiger kontrolliert würden. Durch eine entsprechende lernende Statistik-Software sicher leicht zu lösen. Das geht alles schon mit derzeitiger KI und bräuchte noch nicht einmal diese.

    Bei Ihrem Argument zur Verletzung des Gerechtigkeitsgefühls und dem daraus resultierenden Vertrauensverlust bin ich mir nicht sicher, ob ich dem auch zustimmen kann. Wer genau verliert das Vertrauen worauf und warum? Für die Opfer der Straftaten (z. B. die Kinder auf den Mobiltelefonen der Priester und z. B. deren Eltern) wäre es objektiv ungerecht, wenn viele Täter nur deshalb nicht entdeckt würden, weil in Gruppen gefahndet wird, bei denen die Erfolgswahrscheinlichkeit viel geringer ist.

    Natürlich fühlen sich die kontrollierten Personen aus der Minderheitengruppe ungleich behandelt. Ungleich ist aber nicht dasselbe wie ungerecht, denn es gibt eine rationale ethische Begründung für diese Ungleichbehandlung. Was ist ethisch vertretbarer: einige Unschuldige mehr zu kontrollieren, oder darauf zu verzichten und deshalb einige Schuldige mehr nicht zu entdecken?

    Kommt auf die gesellschaftliche Bewertung der Straftat an. Drogenkonsum wird allgemein eher als jedermanns eigene Angelegenheit und höchstens geringfügige Straftat bewertet. Drogenhandel ist jedoch das Gegenteil von geringfügig. Es sollte als Delikt dem Serienmord gleichgesetzt werden, und hier sollte optimal in den richtigen Zielgruppen gefahndet werden. Wenn dies aus ideologischen Gründen (Kurzformel: “Gleichheit ist Gerechtigkeit”) nicht geschieht, dann verletzt genau das das Gerechtigkeitsempfinden von möglicherweise immer noch der Mehrzahl der Menschen und führt zu einem gesellschaftlich wesentlich kostspieligeren Vertrauensverlust bei den weniger-kriminellen Mehrheiten in der Gesellschaft.

  27. #27 user unknown
    https://demystifikation.wordpress.com/2017/03/08/internet-of-sphinx/
    17. November 2018

    In der nächsten Stufe ginge es dann um die Identifizierung dieser Komplizen-Gruppe der Freunde, (…). Durch eine entsprechende lernende Statistik-Software sicher leicht zu lösen. Das geht alles schon mit derzeitiger KI und bräuchte noch nicht einmal diese.

    Ja, sicher.

    Für die Opfer der Straftaten (z. B. die Kinder auf den Mobiltelefonen der Priester

    Also dieses alberne Beispiel, Smartphonekontrolle bei Priestern auf dem Kirchentag – da möchte man sich gar nicht zu äußern, so lebensfremd ist das.

    Aufgrund der Zugehörigkeit zu einer Gruppe mit erhöhter Kriminalität das Smartphone kontrollieren – das kommt ja einer Hausdurchsuchung gleich. Anlasslos. In Ihrem Staat möchte ich nicht leben.

    Es (Drogenhandel) sollte als Delikt dem Serienmord gleichgesetzt werden,

    Ja, die Opfer von Serienmördern freuen sich auch immer so, wenn sie endlich einen gefunden haben und zahlen dem auch noch Geld dafür!

    Sie haben da ein wenig die Maßstäbe verloren, fürchte ich.