Selfmade Sprachforschung: Von der DNS zur DNA

Ich habe ein wenig “Sprachforschung” auf Amateurniveau betrieben. Finde es aber so interessant, dass ich das hier gerne mal präsentiere, um es zur Diskussion zu stellen. Irgendwie habe ich das Gefühl, ich habe da was gefunden (und alle Sprachforscher setzen wahrscheinlich zum facepalm an ;-)

Wer als Journalist regelmäßig über Bio-Themen schreibt, steht immer wieder vor demselben kleinen biestigen Problem: Schreibe ich DNS oder DNA in meinem Artikel?

In einem deutschsprachigen Artikel einer deutschen Tageszeitung sollte man eigentlich DNS verwenden, zumal man möglichst früh im Text das Akronym erklären muss, was man normalerweise macht, indem man in Klammern gesetzt schreibt: DNS (Desoxyribonukleinsäure) oder “die Desoxyribonukleinsäure (DNS)”.

Wählt man die DNA – das Akronym für den englischen Begriff deoxyribonucleic acid – hat man das Problem, dass das deutsche Wort nicht zur Abkürzung passt, was man zum Beispiel so umgeht: DNA (dt. DNS, Desoxyribonukleinsäre) oder irgendwie so. DNA ist inzwischen aber so geläufig, dass häufig auch gar nicht mehr erklärt wird, dass es eigentlich DNS heißen müsste.

Zuletzt vor einigen Jahren passierte mir folgendes: Ich hatte mich in einem Artikel für MaxPlanckForschung für die DNS-Variante entschieden, doch die Redakteurin änderte es in DNA (“Der Wissenschaftler hat es gegengelesen und wollte das so.”). Durchaus verständlich, denn der Forscher war kein deutscher Forscher, im Labor wurde englisch gesprochen.

Doch bei mir ließ diese Veränderung Spuren. Ich war überrascht, dass die Redakteurin so bereitwillig die DNS “preis” gab. Andererseits: Irgendwie klingt DNA – und ich tippe darauf, dass es am ‘A’ liegt – weniger sperrig, sanfter, es ist leichter auszusprechen. Dass ‘S’ macht die DNS irgendwie unattraktiver.

Irgendwie machte mich das neugierig: War das wohl schon immer so? Was wird wohl häufiger benutzt: DNS oder DNA? Oder gibt es gerade einen evolutionären Schritt, bei dem das leichtfüßigere Wort DNA, die alte, sperrigere DNS langsam aber sicher verdrängt, bis es niemand mehr nutzt? Gab es vielleicht eine Zeit, in der vor allem DNS verwendet wurde und seltener die DNA und umgekehrt? Angesichts der stetig wachsenden Bedeutung des Englischen in der Wissenschaft und aber auch in den Medien würde ich erwarten, dass vor einigen Jahren/Jahrzehnten die DNS noch eher verwendet wurde als die DNA.

Viele Fragen, nur: Wie kann man das untersuchen?

Zum Beispiel, indem man die Häufigkeit der beiden Begriffe über die Zeit verfolgt.

Damals, als ich den Artikel schrieb, war gerade der Google Ngram Viewer an den Start gegangen. Ein Tool, mit dem man genau das machen konnte: Die Häufigkeit eines Wortes über die Zeit verfolgen. Datenquelle sind die von Google eingescannten Bücher bei Google Books. Also tat ich genau das: Ich ließ mir den Verlauf der Häufigkeit von DNS und DNA über die Zeit anzeigen.

Und das kam dabei zu meinem Erstaunen heraus:

Das sieht schon nach einem Muster aus: Es geht so richtig los in der ersten Hälfte der 50er Jahre – 1953 veröffentlichten Watson und Crick die Struktur der DNS im Fachmagazin Nature. Der nächste Schwung folgt nach ihrem Nobelpreis 1962, wobei sich in den Folgejahren die DNA der DNS annähert, aber eigentlich durchgehend (bis auf ein Jahr, wenn man sich die Grafik ohne Glättung anschaut) bis etwa zum Jahr 1974. Dann kommt es zur Transition, dem Übergang. Ab da wird das englische Akronym in deutschen Büchern in Google Books immer häufiger verwendet (mit zeitweiligen Einbrüchen in der Häufigkeit), während die deutsche Variante langsam schwindet unter ein Niveau vor den 60er Jahren.

Gegen Ende der 90er nimmt die Häufigkeit von DNS dann allerdings nochmal deutlich zu. Eine mögliche Erklärung: DNS wird ja auch im Computerbereich verwendet (man kennt schon mal den DNS-Server), offenbar nimmt der Anteil der DNS aus der Computerbranche stetig zu und erhöht dadurch erheblich die Häufigkeit des deutschen Akronyms. Beleg: Wenn man sich die Bücher von Google-Books zum Beispiel für die Jahre 2005 bis 2008 anzeigen lässt, finden sich vor allem Bücher aus diesem Bereich. Dasselbe für die Jahre 2004 bis 2006 und 2007 bis 2008 für die DNA durchgeführt ergibt eigentlich nur Biologiebücher.

Nun gut. Schon mal nicht schlecht.

Nur: Es wäre besser ich hätte eine weitere Quelle.

Seit kurzem gibt es die.

Und sie ergab genau folgendes Bild:

Ich war einigermaßen baff. Das sieht gar nicht so anders aus. Bis etwa Mitte/Ende der 70er Jahre vor allem DNS, danach vor allem DNA. Fast das gleiche Bild. Das Muster bestätigt sich: Während in den zwei bzw. drei Jahrzehnten nach der Entdeckung der Helix-Struktur durch Watson und Crick vor allem das deutsche DNS benutzt wurde, übernahm ab Ende der 70er Jahre die DNA die Vorherrschaft. Seit etwa den 80er Jahren wird offenbar in deutschen Schriftgut die DNA der DNS bevorzugt.

Interessant.

Jetzt muss ich natürlich erstmal noch erklären, woher die zweite Grafik stammt. Sie beschreibt die Häufigkeit eines Wortes pro Monat in der Wochenzeitung die ZEIT  im Zeitraum 1946 bis 2012 und ZEIT Online, also nahezu alle ZEIT-Ausgaben und der Webcontent.

Dass man das ZEIT-Archiv auf diese Weise durchsuchen kann, ist erst gerade seit ein paar Stunden möglich: Denn am Freitag erst hat die ZEIT eine API (Application Programming Interface, englisch für Programmierschnittstelle) zur Verfügung gestellt, die es Programmierern ermöglicht, Tools zu erstellen, um irgendwelche Dinge mit dem ZEIT-Archiv anzustellen. In dem Fall haben die Webevangelisten (oder ist es nur einer, nämlich Thomas Pfeiffer?) die API benutzt, um ein dem Google Ngram Viever ähnliches Tool zu entwickeln, dass es aber auch erst seit ein paar Stunden gibt. Aufmerksam wurde ich darauf, als ich Wolfgang Blaus Tweet las:

Und so konnte ich meine These testen, dass seit den 80er Jahren die DNA die DNS allmählich verdrängt.

Irgendwie toll.

Zusatz: Es gibt natürlich noch einiges zu Bedenken:

1. Das ist alles noch sehr roh raw und dirty. Ich kann die Datengrundlage der Google Books nicht einschätzen. Ich weiß auch nicht, wofür die Akronyme DNA und DNS außer der beschriebene Fälle noch genutzt wird (im Kultur- und Designbereich spricht man ja inzwischen auch immer häufiger von einer DNS oder DNA, das müsste man vielleicht mal noch rausfiltern).

2. Der Viewer der Webevangelisten ist noch eine beta-Version. Und offenbar gibt es einen Bug, der die Daten von 2005 bis 2008 falsch darstellt. Die werden das sicher noch checken, dann stelle ich die Anfrage nochmal.

3. Es ist jetzt 1:45 Uhr in der Nacht und ich fange an wirres zeug zu schreiben. Irgendwas genauer analysieren mag ich jetzt auch nicht mehr.

Jetzt ist das erstmal in der Welt, mal sehen, was drauß wird. Nachträge folgen.

Kommentare

  1. #1 MartinB
    25. November 2012

    Toller Zufall – es ist ein paar Tage her, da habe ich mich gefragt, warum es früher DNS hieß und heute DNA heißt – nun weiß ich zumindest, dass der Eindruck nicht falsch war.
    Eine These, die einen Teil zur Erklärung beitragen mag: Mit dem Auftauchen von Computern wurde es einfacher, Grafiken zu übernehmen – wenn eine englischsprachige Grafik DNA schreibt, muss ich das nicht ändern, wenn es im Deutschen auch so heißt.

  2. #2 Marcus Anhäuser
    25. November 2012

    Mhm, das könnte eine Erklärung im Wissenschaftsbereich sein, im normalen Journalismus eher nicht, weil Grafiken aus der Wissenschaft da selten übernommen werden.

    Auf Twitter meinte eine Kollegin, dass es es mit dem ‘A’ einfach besser klingt.

    Ih weiß nicht, ob es so etwas wie Spracheffizient als Erklärungsmodell gibt, aber das könnte auch eine Rolle spielen: Es sagt sich einfach leichter.

    Und noch eine These: Der Ausbildungshintergrund der Journalisten und vor allem Redakteure hat sich vielleicht gewandelt, heute haben die eher naturwissenschaftlichen Hintergrund (es gibt unendlich viele Biologen unter den Wissenschaftsjournalisten) und die sind in der Lehre und in der Forschung auf DNA geprägt, also anders sozialisiert als vielleicht frühere Journalisten, die eher Geisteswissenschaffler waren oder gar keine akademische Ausbildung hatten.

  3. #3 MX
    25. November 2012

    Ob vielleicht auch die Entwicklung von Anwendungen (DNA-Tests etc.) eine Rolle spielt, in denen DNA im Namen vorkommt?

  4. #4 Marcus Anhäuser
    25. November 2012

    Mhm, das ist eine recht junge Entwicklung, die Transition war aber ja schon viel früher in de 80er Jahren, wende ich da mal ein.

    Was ma vielleicht beachten muss: Bei Google Books sind auch viele Lehrbücher dabei, das könnte also durch Entwicklungen innerhalb der Wissenschaft erklärt werden, bei der ZEIT sollte das aber keine Rolle spielen, oder?

  5. #5 Thierbach
    25. November 2012

    Zweifelsohne handelt es sich hier um einen Fall ausgleichender Gerechtigkeit: das acid-Säure-Abkürzungsproblem gab/gibt es nämlich noch einmal: in der deutschsprachigen Abkürzung LSD, die unverändert ins Englische übernommen wurde. ;)

  6. #6 Gerald Fix
    25. November 2012

    Was spricht dagegen, dass DNA durch Standardübersetzungen amerikanischer Fernsehkrimis populär wurde?

  7. #7 MX
    25. November 2012

    @ Thierbach: Das ist auch gut so: LSA = D-Lysergsäureamid (wird zur Synthese von LSD verwendet). Sonst wüssten die englischen LSD-Köche am Ende nicht, ob sie schon fertig sind.

  8. #8 rolak
    25. November 2012

    Nee, MX, die Säure/Acid-Änderung würde ja den Wechsel LSD→LAD bewirken, vom Dinglichen zum Männlichen.

  9. #9 MX
    25. November 2012

    @ rolak: Das wäre zwar korrekt, aber was sagt uns Selfmade-Sprachforschern das? Dass der Feminismus der Transformation von LSD zu LAD im Wege stand? ;-)

  10. #10 rolak
    26. November 2012

    ..eher daß das TLA-Gebiet ziemlich dicht besiedelt ist.

  11. [...] zur API der Zeit: Markus Annhäuser hat mal grob geprüft, seit wann und warum man eigentlich DNA oder DNS [...]

  12. #12 Jürgen Schönstein
    26. November 2012

    Ich habe mal in den Ngram-Viewer das Stichwort “Genmanipulation” eingegeben – und siehe da, es taucht in der deutschen Literatur just ab 1974 auf (also jenem Jahr, in dem die DNA die DNS überholt hat).

    • #13 Marcus Anhäuser
      29. November 2012

      Ich habe das gleiche mal mit “Gentechnik” gemacht, und ab etwa Mitte der 80er Jahre läuft das einerseits ehr schön parallel mit der DNA – nur zwischen 1995 und 2000 diametral gegeneinander, warum auch immer.

  13. #14 Ute
    Ulm
    27. November 2012

    Sehr gut beobachtet. DNS und DNA – haben wir beides vor 20 Jahrem in der Schule gelernt. Die deutsche Begifflichkeit Desoxyribonukleinsäure kann ich nach wie vor im Schlaf aufsagen, was ich von der englischen (Deoxyribonucleic acid) nicht behaupten kann, die ich eben gegoogelt habe, obwohl wir hierzulande tatsächlich DNA abkürzen, aber Desoxyribonukleinsäure aussprechen.

  14. #15 rolak
    27. November 2012

    DNA abkürzen, aber Desoxyribonukleinsäure aussprechen

    Nichts besonderes, :Ute Hier im Rheinland schreiben wir ‘Kartoffel-Salat’ und sagen ‘Ääpeles-Schloot’ ;-)

    Mitte der 70er, als sich -wie ich hier erfuhr, nicht nur in meiner Wahrnehmung- ‘DNA’ nach vorne kämpfte, war ich auch noch ziemlich verblüfft über die Zweigleisigkeit. Mittlerweile stört mich dergleichen überhaupt nicht mehr.

  15. #16 Ace Kaiser
    28. November 2012

    Ich bin jetzt kein Englisch-, oder Denglisch-Hasser, aber ich freue mich sehr, dass dieses Thema mal angesprochen wird. Denn oft habe ich das Gefühl, dass die Leute mit DNS nichts anfangen können und gar nicht wissen (wollen), dass sie mit DNA Englisch sprechen.
    Dabei wäre ich damit schon vollkommen zufrieden, wenn sie wüssten, dass das A am Ende das englische Acid meint, nicht die deutsche Säure. Aber ich befürchte, das Wort Desoxyribonucleinsäure ist vielen Medien und Menschen nicht geläufig…. ^^°°°

  16. [...] PLAZEBOALARM untersucht der Medizinjournalist Marcus Anhäuser die Verdrängung der Abkürzung DNS (für Desoxyribonukleinsäure) durch die englische Abkürzung [...]

  17. #18 Kristin Kopf
    http://www.sprachlog.de
    2. Dezember 2012

    Sehr schöne Recherche, hat mir gut gefallen! Ich musste übrigens sofort an eine weitere Möglichkeit denken, das ZEIT-Archiv zu durchsuchen, nämlich DWDS. Weil ich neugierig war, ob die Ergebnisse identisch sind, habe ich die Suche dort einmal durchgeführt (einmal DNS, einmal DNA, dann die Ergebnisse exportiert und Dubletten entfernt – weil die Daten etwas unsauber waren, viele Passagen kamen trotz Einfachnennung des Suchbegriffs mehrfach vor; ebenfalls entfernt habe ich die Einträge, bei denen “Server” in direkter Nähe vorkam).
    Ich habe das Ergebnis einmal hier hochgeladen.
    Interessanterweise ähnelt es der Ngrams-Recherche sehr stark, wenn man das Smoothing drüberlaufen lassen würde, wäre es wahrscheinlich noch näher dran.
    Was mich sehr wundert, ist, dass die Zahlen aus dem ZEIT-Korpus bei DWDS so viel höher sind als die aus dem Archiv via API – da muss irgendwas mit den Daten im Argen liegen.

  18. #19 Kristin Kopf
    http://www.sprachlog.de
    2. Dezember 2012

    Nachtrag: Jetzt habe ich gesehen, dass die API-Zahlen gar nicht absolut, sondern (wie Google Ngrams) relativ zu allen Textwörtern des jeweiligen Zeitraums sind. Mein letzter Satz ist also hinfällig.

  19. #20 Marcus Anhäuser
    2. Dezember 2012

    Hallo Kristin,
    Du siehst mich begeistert. Könnte man mit DWDS auch andere Zeitungen zum Vergleich checken, also etwa SZ oder FAZ? Bei den relativen und absoluten Angaben beim ZEIT-Tool bin ich mir nicht ganz sicher, aber unter der Grafik steht es wären absolute Zahlen, Häufigkeit pro Monat … Die Statistik aus der DWDS sieht verblüffend ähnlich der Statsitik aus dem Ngram Viewer aus, toll.

  20. #21 Kristin Kopf
    http://www.sprachlog.de
    2. Dezember 2012

    Hi Marcus, leider nein – DWDS beinhaltet zwar noch weitere Zeitungen, allerdings reicht keine ausreichend weit zurück.
    Die mit der nächstgrößten diachronen Tiefe ist aber trotzdem interessant: Der Tagesspiegel (1997-2005) zeigt interessanterweise für diesen Zeitraum ganz andere Ergebnisse.

  21. #22 Marcus Anhäuser
    3. Dezember 2012

    Mhm, das läuft beim Tagesspiegel ja komplett anders herum: 2 Erklärungen: viel mehr Computerthemen als Biothemen und/oder das Redaktionsbuch sieht ausdrücklich die ‘DNS’-Variante bei Biothemen vor.

  22. #23 Belles Lettres
    8. Januar 2013

    Die IT-DNS begünstigt nicht dissimilierend die Gen-DNA gegenüber der DNS, denn es handelt sich um fachsprachliche Ausdrücke, deren Sprechergruppen sich nicht überschneiden. Die IT-DNS konterminiert allerdings die Google-Suche: Die rote Kurve schnellt genau dort in die Höhe, wo das Internet aufkam. Man müsste alle IT-DNS-Belege aussortieren und zudem alle Newskaskaden, wo eine Agenturmeldung eine Schar von Zeitungsartikeln gebiert, deren Beleg ein Klon der Agenturmeldung ist.

    Daß es sich um ein Akronym handelt, spielt nur bei der ersten Wortbildung eine Rolle. Sobald DNS als Wort /de-en-es/ existiert, ist es ein Wort wie jedes andere. Das Lexikon im Gehirn kennt keine Akronyme, sondern nur Lexeme.

    Das DWDS-Korpus hat wohl dasselbe Problem wie Google, weswegen man Korpusanalysen in der historischen Sprachwissenschaft nicht mal mit der Kneifzange anfassen würde.

    Die Schwierigkeit bei DNS>DNA liegt darin, daß der Ausdruck sowohl fach- als auch allgemeinsprachlich verwendet wird. Dort kann man Internationalisierung annehmen, hier findet man es in Krimis, wo es sich wie bei CSI meist um Übersetzungen aus dem Englischen handelt, und Zeitungsartikeln wie über Jörg Kachelmann.

    Es ist besser, so etwas an wenigen Belegen zu untersuchen und sie philologisch in die Tiefe zu prüfen, als Massenanalysen vorzunehmen.

  23. #24 Marcus Anhäuser
    9. Januar 2013

    @Belles Lettres
    “Es ist besser, so etwas an wenigen Belegen zu untersuchen und sie philologisch in die Tiefe zu prüfen, als Massenanalysen vorzunehmen.”

    Naja, ich sage mal so: Um das grobe Muster überhaupt erst einmal zu erkennen, fand ich die Massenanalyse erste einmal hilfreich. Wie will man sonst einen Überblick bekommen. Es ist ein erster Hinweis, denn man ja jetzt vertiefen kann.

    “Die IT-DNS konterminiert allerdings die Google-Suche: Die rote Kurve schnellt genau dort in die Höhe, wo das Internet aufkam.”

    Verstehe ich nicht: Die rote Kurve bildet doch die DNA-Häufigkeit ab, die blaue Kurve steht für die DNS. Oder habe ich was nicht verstanden.

  24. #25 simop
    5. März 2013

    Als aus dem IT-Bereich stammender und Biologie-affiner Mensch habe ich im Anbetracht der Diskussion versucht, meine eigene Verwendung von DNS und DNA zu hinterfragen:
    Im Bio-LK lernte ich DNS einschließlich des allseits bekannten Zungenbrechers Desoxyribonucleinsäure. So habe ich es auch jahrelang verwendet.
    Irgendwann hörte ich immer wieder DNA als Synonym – blieb aber bei meinem DNS.
    Dann trat plötzlich der DNS-Server in meine Welt. Plötzlich war das Akronym missverständlich (ok, meist aus dem Kontext gut zu erkennen – alleinstehend jedoch missverständlich) – und ich ertappe mich, seit dieser Zeit Schritt für Schritt zu DNA gewechselt zu sein. Ob Medien, Krimis etc. eine Rolle spielen? Keine Ahnung. Sicher aber genau diese Doppelung der Begriffe, wobei gerade der Domain Name Server und Service für mich die wichtigere Rolle spielen – so dass sie von mir sozusagen mental das “Nutzungsrecht” an diesem Akronym bekamen.

    • #26 Marcus Anhäuser
      6. März 2013

      @simop, dein Verhalten ist vielleicht auch eine Erklärung dafür, dass DNA DNS im biologischen Bereich verdrängt. Interessant.