Ich habe ein wenig “Sprachforschung” auf Amateurniveau betrieben. Finde es aber so interessant, dass ich das hier gerne mal präsentiere, um es zur Diskussion zu stellen. Irgendwie habe ich das Gefühl, ich habe da was gefunden (und alle Sprachforscher setzen wahrscheinlich zum facepalm an ;-)
Wer als Journalist regelmäßig über Bio-Themen schreibt, steht immer wieder vor demselben kleinen biestigen Problem: Schreibe ich DNS oder DNA in meinem Artikel?
In einem deutschsprachigen Artikel einer deutschen Tageszeitung sollte man eigentlich DNS verwenden, zumal man möglichst früh im Text das Akronym erklären muss, was man normalerweise macht, indem man in Klammern gesetzt schreibt: DNS (Desoxyribonukleinsäure) oder “die Desoxyribonukleinsäure (DNS)”.
Wählt man die DNA – das Akronym für den englischen Begriff deoxyribonucleic acid – hat man das Problem, dass das deutsche Wort nicht zur Abkürzung passt, was man zum Beispiel so umgeht: DNA (dt. DNS, Desoxyribonukleinsäre) oder irgendwie so. DNA ist inzwischen aber so geläufig, dass häufig auch gar nicht mehr erklärt wird, dass es eigentlich DNS heißen müsste.
Zuletzt vor einigen Jahren passierte mir folgendes: Ich hatte mich in einem Artikel für MaxPlanckForschung für die DNS-Variante entschieden, doch die Redakteurin änderte es in DNA (“Der Wissenschaftler hat es gegengelesen und wollte das so.”). Durchaus verständlich, denn der Forscher war kein deutscher Forscher, im Labor wurde englisch gesprochen.
Doch bei mir ließ diese Veränderung Spuren. Ich war überrascht, dass die Redakteurin so bereitwillig die DNS “preis” gab. Andererseits: Irgendwie klingt DNA – und ich tippe darauf, dass es am ‘A’ liegt – weniger sperrig, sanfter, es ist leichter auszusprechen. Dass ‘S’ macht die DNS irgendwie unattraktiver.
Irgendwie machte mich das neugierig: War das wohl schon immer so? Was wird wohl häufiger benutzt: DNS oder DNA? Oder gibt es gerade einen evolutionären Schritt, bei dem das leichtfüßigere Wort DNA, die alte, sperrigere DNS langsam aber sicher verdrängt, bis es niemand mehr nutzt? Gab es vielleicht eine Zeit, in der vor allem DNS verwendet wurde und seltener die DNA und umgekehrt? Angesichts der stetig wachsenden Bedeutung des Englischen in der Wissenschaft und aber auch in den Medien würde ich erwarten, dass vor einigen Jahren/Jahrzehnten die DNS noch eher verwendet wurde als die DNA.
Viele Fragen, nur: Wie kann man das untersuchen?
Zum Beispiel, indem man die Häufigkeit der beiden Begriffe über die Zeit verfolgt.
Damals, als ich den Artikel schrieb, war gerade der Google Ngram Viewer an den Start gegangen. Ein Tool, mit dem man genau das machen konnte: Die Häufigkeit eines Wortes über die Zeit verfolgen. Datenquelle sind die von Google eingescannten Bücher bei Google Books. Also tat ich genau das: Ich ließ mir den Verlauf der Häufigkeit von DNS und DNA über die Zeit anzeigen.
Und das kam dabei zu meinem Erstaunen heraus:
Das sieht schon nach einem Muster aus: Es geht so richtig los in der ersten Hälfte der 50er Jahre – 1953 veröffentlichten Watson und Crick die Struktur der DNS im Fachmagazin Nature. Der nächste Schwung folgt nach ihrem Nobelpreis 1962, wobei sich in den Folgejahren die DNA der DNS annähert, aber eigentlich durchgehend (bis auf ein Jahr, wenn man sich die Grafik ohne Glättung anschaut) bis etwa zum Jahr 1974. Dann kommt es zur Transition, dem Übergang. Ab da wird das englische Akronym in deutschen Büchern in Google Books immer häufiger verwendet (mit zeitweiligen Einbrüchen in der Häufigkeit), während die deutsche Variante langsam schwindet unter ein Niveau vor den 60er Jahren.
Gegen Ende der 90er nimmt die Häufigkeit von DNS dann allerdings nochmal deutlich zu. Eine mögliche Erklärung: DNS wird ja auch im Computerbereich verwendet (man kennt schon mal den DNS-Server), offenbar nimmt der Anteil der DNS aus der Computerbranche stetig zu und erhöht dadurch erheblich die Häufigkeit des deutschen Akronyms. Beleg: Wenn man sich die Bücher von Google-Books zum Beispiel für die Jahre 2005 bis 2008 anzeigen lässt, finden sich vor allem Bücher aus diesem Bereich. Dasselbe für die Jahre 2004 bis 2006 und 2007 bis 2008 für die DNA durchgeführt ergibt eigentlich nur Biologiebücher.
Nun gut. Schon mal nicht schlecht.
Nur: Es wäre besser ich hätte eine weitere Quelle.
Seit kurzem gibt es die.
Und sie ergab genau folgendes Bild:
Ich war einigermaßen baff. Das sieht gar nicht so anders aus. Bis etwa Mitte/Ende der 70er Jahre vor allem DNS, danach vor allem DNA. Fast das gleiche Bild. Das Muster bestätigt sich: Während in den zwei bzw. drei Jahrzehnten nach der Entdeckung der Helix-Struktur durch Watson und Crick vor allem das deutsche DNS benutzt wurde, übernahm ab Ende der 70er Jahre die DNA die Vorherrschaft. Seit etwa den 80er Jahren wird offenbar in deutschen Schriftgut die DNA der DNS bevorzugt.
Interessant.
Jetzt muss ich natürlich erstmal noch erklären, woher die zweite Grafik stammt. Sie beschreibt die Häufigkeit eines Wortes pro Monat in der Wochenzeitung die ZEIT im Zeitraum 1946 bis 2012 und ZEIT Online, also nahezu alle ZEIT-Ausgaben und der Webcontent.
Dass man das ZEIT-Archiv auf diese Weise durchsuchen kann, ist erst gerade seit ein paar Stunden möglich: Denn am Freitag erst hat die ZEIT eine API (Application Programming Interface, englisch für Programmierschnittstelle) zur Verfügung gestellt, die es Programmierern ermöglicht, Tools zu erstellen, um irgendwelche Dinge mit dem ZEIT-Archiv anzustellen. In dem Fall haben die Webevangelisten (oder ist es nur einer, nämlich Thomas Pfeiffer?) die API benutzt, um ein dem Google Ngram Viever ähnliches Tool zu entwickeln, dass es aber auch erst seit ein paar Stunden gibt. Aufmerksam wurde ich darauf, als ich Wolfgang Blaus Tweet las:
Und so konnte ich meine These testen, dass seit den 80er Jahren die DNA die DNS allmählich verdrängt.
Irgendwie toll.
Zusatz: Es gibt natürlich noch einiges zu Bedenken:
1. Das ist alles noch sehr roh raw und dirty. Ich kann die Datengrundlage der Google Books nicht einschätzen. Ich weiß auch nicht, wofür die Akronyme DNA und DNS außer der beschriebene Fälle noch genutzt wird (im Kultur- und Designbereich spricht man ja inzwischen auch immer häufiger von einer DNS oder DNA, das müsste man vielleicht mal noch rausfiltern).
2. Der Viewer der Webevangelisten ist noch eine beta-Version. Und offenbar gibt es einen Bug, der die Daten von 2005 bis 2008 falsch darstellt. Die werden das sicher noch checken, dann stelle ich die Anfrage nochmal.
3. Es ist jetzt 1:45 Uhr in der Nacht und ich fange an wirres zeug zu schreiben. Irgendwas genauer analysieren mag ich jetzt auch nicht mehr.
Jetzt ist das erstmal in der Welt, mal sehen, was drauß wird. Nachträge folgen.
Kommentare (28)