Seit seiner Gründung ist das CERN sehr umtriebig in Sachen Datenverarbeitung. Das ist im Bereich Teilchenphysik eine Notwendigkeit. Hier werden pro Sekunde gewaltige Mengen Daten erzeugt, die aufgenommen sortiert und durchforstet werden müssen.
Uns jungen Physikstudenten (lang, lang ist’s her) wurde damals am DESY in Hamburg gesagt, dass dort pro Sekunde so viele Daten verarbeitet werden, wie in der gleichen Zeit durch das gesamte Festnetztelefonnetz Deutschlands gehen. In diesem Datenwust ein einzelnes Teilchen zu finden, gleicht der Suche nach der Nadel im Heuhaufen.
Aber zunächst einmal muss man der Datenflut Herr werden. Da pro Experiment buchstäblich tausende Physiker gleichzeitig tätig sind, ist es auch kein Wunder, dass Tim Berners-Lee im Jahr 1990 überlegte, wie man die Informationen und die Arbeit dieser paar tausend Experten so organisiert, dass nicht ständig das Rad neu erfunden wird.
Er stellte das Projekt “Hypertext” vor, um Informationen leichter verfügbar zu machen und untereinander zu vernetzen (Tim Berner Lees Proposal).
ich zitiere einmal in Auszügen:
CERN is a wonderful organisation. It involves several thousand people, many of them very
creative, all working toward common goals.
…
A problem, however, is the high turnover of people. When two years is a typical length of stay, information is constantly being lost. … Often, the information has been recorded, it just cannot be found.
…
If a CERN experiment were a static once-only development, all the information could be
written in a big book. As it is, CERN is constantly changing as new ideas are produced, as new technology becomes available, and in order to get around unforeseen technical problems.
…
The problems of information loss may be particularly acute at CERN, but in this case (as in certain others), CERN is a model in miniature of the rest of world in a few years time.
Deutsche Übersetzung:
CERN ist eine wundervolle Organisation. Sie umfasst mehrere tausend Leute, viele von ihnen sind sehr kreative Köpfe und arbeiten auf ein gemeinsames Ziel hin.
…
Ein Problem allerdings ist die hohe Fluktuationsrate an Leuten. Die typische Verweildauer beträgt zwei Jahre, dabei gehen ständig Informationen verloren. … Oft wurden die Informationen gespeichert, sie können nur nicht wieder aufgefunden werden.
…
Wenn CERN ein statisches einmaliges Experiment wäre, könnte die gesamte Information in einem einzigen großen Buch festgehalten werden. Tatsächlich aber verändert sich das CERN ständig, da neue Ideen produziert, neue Technologien entwickelt und unerwartete technische Probleme gelöst werden.
…
Das Problem des Informationverlustes mag am CERN besonders akut sein, aber in diesem Fall (und in vielen anderen) ist das CERN ein Miniaturmodell der Welt in ein paar Jahren.
Diese Zeilen sind ein Stück Zeitgeschichte. Denn damit wurde das World Wide Web, so wie wir es kennen, geboren. Es diente anfangs “lediglich” dazu, die Arbeit am CERN besser zu organisieren. Und was wurde daraus?
Alleine Amazon machte nur im Jahre 2004 6,9 Milliarden Dollar Jahresumsatz. Davon kann das CERN ein paar Jahre Experimente betreiben. Wenn also die Leute online darüber schimpfen, dass die Forschung am CERN mal völlige Geldverschwendung ist, dann kann ich nur schlussfolgern, dass diese Menschen nicht wissen, dass sie gerade ein Medium benutzen, das es ohne das CERN vielleicht noch gar nicht gäbe.
Seit kurzem steht das CERN vor einer neuen Herausforderung in Sachen Datenverarbeitung. Denn die Datenmenge wird mit Inbetriebnahme des LHC noch einmal explodieren.
Das CERN erwartet, dass das LHC in einem Jahr soviele Daten erzeugen wird, dass würde man diese alle auf CDs brennen und stapeln, dieser Turm 20 Kilometer hoch wäre. Die Antwort auf diese technische Herausforderung ist Grid@CERN
Ein einzelner Rechner und selbst ein Superrechner wird niemals ausreichen, um alle Daten zu speichern und zu verarbeiten. Aber das Internet erlaubt auch hier eine Lösung. Dadurch ist es möglich viele tausend Rechner weltweit miteinander zu vernetzen und die Arbeit und die Datenmengen zu verteilen. SETI@Home sucht nach einem ähnlichen Prinzip nach künstlichen Signalen außerirdischen Ursprungs. Man kann ein kleines kostenloses Programm runterladen und den Rechner nach Signalen in Radioteleskopdaten suchen lassen. Über 3 Millionen Nutzer hat das Projekt laut eigener Aussage. 3 Millionen die zusammen über das Internet einen Supercomputer bilden.
Was ist jetzt das neue an GRID?
Es ist schon mal gut, dass man die Daten aufteilen kann, aber die müssen auch transferiert, hinterher gesammelt, verglichen und die Rechnungen auf den einzelnen Rechnern miteinander koordiniert werden. Bei den Datenmengen, die man am LHC erwartet, muss das Ganze möglichst effizient gesteuert und die Übertragungsrate erhöht werden, um nicht in Verzug zu geraten. Und mit ein “bisschen” schneller meine ich, dass wir von einer Datenübertragung von 1 Gigabit pro Sekunde reden. Bislang gilt 10 Megabit pro Sekunde als ziemlich schnell. Da ist also mindestens ein Faktor 100 dazwischen. Außerdem soll durch eine effiziente Steuerungen Verzögerungen im Netzwerk möglich vermieden werden.
Das Projekt umfasst also ein neues schnelleres Netzwerk, eine angepasste Steuerungssoftware und maßgeschneiderte Anwendungen, mit denen der Nutzer letztendlich arbeitet, alles aus einem Guss. Getestet wurde das Ganze auch schon im Rahmen des DataGrid-Pojektes. Dafür wurden 10 000 Prozessoren verteilt auf 15 Standorte in Europa zusammengeschaltet. Als zugrundeliegendes Netzwerk wurde GEANT verwendet, ein europäisches Hochgeschwindigkeitsnetzwerk der nächsten Generation.
Wenn man bedenkt, wie das jetzige Internet eingeschlagen und die Welt verändert hat, dann dürfen wir gespannt sein, was passiert, wenn GRID aus dem Forschungsbetrieb in den Alltag kommt.
Vermutlich wird damit folgendes passieren:
- Irgendetwas mit Sex. Der Mensch ist halt so gestrickt.
- Kommunikation. Echte ruckelfreie Videotelefonie bietet sich da an.
- Dicht gefolgt von irgendetwas mit Unterhaltung. Spielfilme online sehen, noch realistischere Spiele.
- Irgendjemand wird sicherlich auch das neue Netz dazu nutzen, andere Leute zu betrügen oder zu belästigen. Leider ist der Mensch auch so gestrickt.
- Irgendwann unter ferner liefend werden Bildung und Forschung kommen. Wie z.B. Online-Kurse besuchen, mit dem Netzwerk wissenschaftliche Daten untersuchen, medizinische Aufnahmen von Tumoren und ähnliches visualisieren.
Disclaimer: Ich bin sicherlich kein Informatiker oder Hardwarespezialist. Aber das Thema interessiert mich schon. Da ich mich hier nicht so auskenne, ist es notgedrungen stark verkürzt und wenn ich irgendwo völligen Blödsinn erzählt haben sollte, bitte darauf hinweisen und ich korrigiere es! Danke 😉
Kommentare (26)