Seit seiner Gründung ist das CERN sehr umtriebig in Sachen Datenverarbeitung. Das ist im Bereich Teilchenphysik eine Notwendigkeit. Hier werden pro Sekunde gewaltige Mengen Daten erzeugt, die aufgenommen sortiert und durchforstet werden müssen.

Uns jungen Physikstudenten (lang, lang ist’s her) wurde damals am DESY in Hamburg gesagt, dass dort pro Sekunde so viele Daten verarbeitet werden, wie in der gleichen Zeit durch das gesamte Festnetztelefonnetz Deutschlands gehen. In diesem Datenwust ein einzelnes Teilchen zu finden, gleicht der Suche nach der Nadel im Heuhaufen.

Aber zunächst einmal muss man der Datenflut Herr werden. Da pro Experiment buchstäblich tausende Physiker gleichzeitig tätig sind, ist es auch kein Wunder, dass Tim Berners-Lee im Jahr 1990 überlegte, wie man die Informationen und die Arbeit dieser paar tausend Experten so organisiert, dass nicht ständig das Rad neu erfunden wird.

Er stellte das Projekt “Hypertext” vor, um Informationen leichter verfügbar zu machen und untereinander zu vernetzen (Tim Berner Lees Proposal).

ich zitiere einmal in Auszügen:

CERN is a wonderful organisation. It involves several thousand people, many of them very
creative, all working toward common goals.

A problem, however, is the high turnover of people. When two years is a typical length of stay, information is constantly being lost. … Often, the information has been recorded, it just cannot be found.

If a CERN experiment were a static once-only development, all the information could be
written in a big book. As it is, CERN is constantly changing as new ideas are produced, as new technology becomes available, and in order to get around unforeseen technical problems.

The problems of information loss may be particularly acute at CERN, but in this case (as in certain others), CERN is a model in miniature of the rest of world in a few years time.

Deutsche Übersetzung:
CERN ist eine wundervolle Organisation. Sie umfasst mehrere tausend Leute, viele von ihnen sind sehr kreative Köpfe und arbeiten auf ein gemeinsames Ziel hin.

Ein Problem allerdings ist die hohe Fluktuationsrate an Leuten. Die typische Verweildauer beträgt zwei Jahre, dabei gehen ständig Informationen verloren. … Oft wurden die Informationen gespeichert, sie können nur nicht wieder aufgefunden werden.

Wenn CERN ein statisches einmaliges Experiment wäre, könnte die gesamte Information in einem einzigen großen Buch festgehalten werden. Tatsächlich aber verändert sich das CERN ständig, da neue Ideen produziert, neue Technologien entwickelt und unerwartete technische Probleme gelöst werden.

Das Problem des Informationverlustes mag am CERN besonders akut sein, aber in diesem Fall (und in vielen anderen) ist das CERN ein Miniaturmodell der Welt in ein paar Jahren.

Diese Zeilen sind ein Stück Zeitgeschichte. Denn damit wurde das World Wide Web, so wie wir es kennen, geboren. Es diente anfangs “lediglich” dazu, die Arbeit am CERN besser zu organisieren. Und was wurde daraus?

Alleine Amazon machte nur im Jahre 2004 6,9 Milliarden Dollar Jahresumsatz. Davon kann das CERN ein paar Jahre Experimente betreiben. Wenn also die Leute online darüber schimpfen, dass die Forschung am CERN mal völlige Geldverschwendung ist, dann kann ich nur schlussfolgern, dass diese Menschen nicht wissen, dass sie gerade ein Medium benutzen, das es ohne das CERN vielleicht noch gar nicht gäbe.

Seit kurzem steht das CERN vor einer neuen Herausforderung in Sachen Datenverarbeitung. Denn die Datenmenge wird mit Inbetriebnahme des LHC noch einmal explodieren.

Das CERN erwartet, dass das LHC in einem Jahr soviele Daten erzeugen wird, dass würde man diese alle auf CDs brennen und stapeln, dieser Turm 20 Kilometer hoch wäre. Die Antwort auf diese technische Herausforderung ist Grid@CERN

Ein einzelner Rechner und selbst ein Superrechner wird niemals ausreichen, um alle Daten zu speichern und zu verarbeiten. Aber das Internet erlaubt auch hier eine Lösung. Dadurch ist es möglich viele tausend Rechner weltweit miteinander zu vernetzen und die Arbeit und die Datenmengen zu verteilen. SETI@Home sucht nach einem ähnlichen Prinzip nach künstlichen Signalen außerirdischen Ursprungs. Man kann ein kleines kostenloses Programm runterladen und den Rechner nach Signalen in Radioteleskopdaten suchen lassen. Über 3 Millionen Nutzer hat das Projekt laut eigener Aussage. 3 Millionen die zusammen über das Internet einen Supercomputer bilden.

Was ist jetzt das neue an GRID?

Es ist schon mal gut, dass man die Daten aufteilen kann, aber die müssen auch transferiert, hinterher gesammelt, verglichen und die Rechnungen auf den einzelnen Rechnern miteinander koordiniert werden. Bei den Datenmengen, die man am LHC erwartet, muss das Ganze möglichst effizient gesteuert und die Übertragungsrate erhöht werden, um nicht in Verzug zu geraten. Und mit ein “bisschen” schneller meine ich, dass wir von einer Datenübertragung von 1 Gigabit pro Sekunde reden. Bislang gilt 10 Megabit pro Sekunde als ziemlich schnell. Da ist also mindestens ein Faktor 100 dazwischen. Außerdem soll durch eine effiziente Steuerungen Verzögerungen im Netzwerk möglich vermieden werden.

Das Projekt umfasst also ein neues schnelleres Netzwerk, eine angepasste Steuerungssoftware und maßgeschneiderte Anwendungen, mit denen der Nutzer letztendlich arbeitet, alles aus einem Guss. Getestet wurde das Ganze auch schon im Rahmen des DataGrid-Pojektes. Dafür wurden 10 000 Prozessoren verteilt auf 15 Standorte in Europa zusammengeschaltet. Als zugrundeliegendes Netzwerk wurde GEANT verwendet, ein europäisches Hochgeschwindigkeitsnetzwerk der nächsten Generation.

Wenn man bedenkt, wie das jetzige Internet eingeschlagen und die Welt verändert hat, dann dürfen wir gespannt sein, was passiert, wenn GRID aus dem Forschungsbetrieb in den Alltag kommt.

Vermutlich wird damit folgendes passieren:

  • Irgendetwas mit Sex. Der Mensch ist halt so gestrickt.
  • Kommunikation. Echte ruckelfreie Videotelefonie bietet sich da an.
  • Dicht gefolgt von irgendetwas mit Unterhaltung. Spielfilme online sehen, noch realistischere Spiele.
  • Irgendjemand wird sicherlich auch das neue Netz dazu nutzen, andere Leute zu betrügen oder zu belästigen. Leider ist der Mensch auch so gestrickt.
  • Irgendwann unter ferner liefend werden Bildung und Forschung kommen. Wie z.B. Online-Kurse besuchen, mit dem Netzwerk wissenschaftliche Daten untersuchen, medizinische Aufnahmen von Tumoren und ähnliches visualisieren.

Disclaimer: Ich bin sicherlich kein Informatiker oder Hardwarespezialist. Aber das Thema interessiert mich schon. Da ich mich hier nicht so auskenne, ist es notgedrungen stark verkürzt und wenn ich irgendwo völligen Blödsinn erzählt haben sollte, bitte darauf hinweisen und ich korrigiere es! Danke 😉

Kommentare (26)

  1. #1 isnochys
    September 11, 2008

    Naja, in Firmen sind heute schon 1 Gbit Netzwerke üblich.
    Und das Cern hat sicher eien guten Beitrag geleistet, allerdings sollte man das nicht allzu überbewerten.
    Denn Grundlage dafür hat immernoch das Militär gelegt;)

  2. #2 isnochys
    September 11, 2008

    Mist, schonwieder den Hacken vergessen

  3. #3 Ludmila
    September 11, 2008

    @isnochys: Klar hat die Grundlage, das US-Militär gelegt. Aber was nützt Dir die beste Hardware ohne die richtige Software? Insofern finde ich es schon spannend, dass aus einer an sich recht simplen und naheliegenden Idee “wir vernetzen jetzt das Wissen miteinander, damit es nicht verloren geht” so etwas wie das Internet geworden ist, was nun mal unser Leben revolutioniert hat.

    Also zumindest meins 😉

  4. #4 isnochys
    September 11, 2008

    ich denke Star Trek und Porn hatten einen grösseren Einfluß auf die Entwickling des Netzes
    *gg*

    Aber du hast Recht, die ersten Strukturen sind am CERN entstanden.
    Nur würde ich das nicht so hervorheben, denn das sind Sekundäreffekte.
    Des CERN soll bestehen, weil man damit Elementarteilchen angucken will. und nicht als Innovationsmotor.
    Denn sonst muß ja am LHC auch was großes, wie html entstehen;)

  5. #5 Ludmila
    September 11, 2008

    @isnochys: Aber das ist doch etwas, was vielen nicht klar ist. Wenn man sehr viele kluge Leute auf einen Haufen bringt und die spannende neue noch nie gesehene Dinge machen lässt, dass dabei immer irgendetwas rumkommt. Und sei es, dass die die Ausbildung bekommen um hinterher was Tolles zu erfinden.

    Grundlagenforschung ist ein Innovationsmotor.

    Wenn das bekannt wäre, dann würden wir vielleicht viel weniger diese leidige: Wozu-soll-das-alles-gut-sein-Debatte führen.

  6. #6 isnochys
    September 11, 2008

    “Aber muß man dann 3 Milliarden dafür ausgeben? dafür sollten doch ein paar Tagungen ausreichen..”
    Das kommt dann meist als zweites Argument;)

    Achja, es kommt immer auf die Physiker an.
    Ich hatte Glück und mein Semester war eher von Partys und eben colen Jungs, wie mir, geprägt.:))
    Aber auf so einer echten Physikerparty..*bbrr*
    graus!
    :)))

  7. #7 Dagor
    September 11, 2008

    Ahhh, Seeeeex. Aber mich würde mal im ernst intessieren, ob das GRID tatsächlich als Modell für ein zukünftiges Internet taugt und warum es bis heute noch nicht wirklich zur Anwendung gekommen ist. In Science war ja zu lesen, dass die lieben Leute am CERN eigentlich damit gerechnet hatten, dass das GRID heutzutage schon kommerziell produziert wird.

  8. #8 Joerg
    September 11, 2008

    Wenn man ansieht, dass pro Jahr in Deutschlan 64 Milliarden für Alkohol und Tabak ausgegeben werden und wahrscheinlich noch größere Summen für Kampfflugzeuge und Kampfschiffe, muss man sich fragen, was erreicht werden könnte, wenn mehr als solch eine völlige Pipisumme von 1 Milliarde pro Jahr (international verteilt natürlich) ans CERN fließen würde.
    Ich hab mich schon gewundert, dass der LHC tatsächlich 6 Moate Strahlzeit hat, war nicht LEP durch die Stromrechnung auf weniger Zeit begrenzt? Sehr peinlich…

  9. #10 isnochys
    September 11, 2008

    Ich dachte auch, dass der LHC nur 6 Monate Strahlzeit hat, denn dann beginnt wieder die dunkle Jahreszeit, da braucht das europäische Netz den Strom zum Christbaumbeleuchten
    🙂

  10. #11 Ronny
    September 11, 2008

    Kleines witziges Detail am Rande. Die Erfinder des Inet und GRID haben es nicht geschafft den Livestream aufreht zu erhalten. Ich weiß, dass das größtenteils nicht in deren Hand lag, aber ich konnte mir ein schmunzeln nicht verkneifen als ich um 10:00 die Meldung bekam: Livestream ? Sorry, geht nicht :))

  11. #12 isnochys
    September 11, 2008

    Die Sache mit dem Livestream war mir dann doch zu supekt.
    Was will ich denn schon sehen?
    Dass ein Lämpchen von rot auf grün umspringt?
    Ist ja nicht so, dass der Beschleuniger plötzlich zu leuchten, qualmen oder rauchen anfängt
    🙂

  12. #13 whamburg
    September 11, 2008

    @Ronny: Internet != Web! Am CERN wurde “nur” das Web erfunden, das Internet war schon vorher da, nur nicht so bunt.
    @Ludmilla: Wirklich nur ein Gbit/s? Im LAN ist das Allerweltstechnik. Im WAN ist das zwar schnell, aber das Wissenschaftnetz vom DFN (XWIN) arbeitet IMHO deutschlandweit mit 10Gbit/s.

  13. #14 Ronny
    September 11, 2008

    @whamburg,
    oh mann, seid nicht immer so pingelig ! (lol)
    Ok, TCP/IP kam woanders her, aber WWW kommt aus Cern, oder ?

  14. #15 Ludmila
    September 11, 2008

    @Whamburg: Das sind die Daten, die ich von der CERN-Seite über GEANT habe, wo 2004 getestet wurde. In der CT war mal die Rede von 100 000mal schneller als das jetzige Internet, aber die bezogen sich auf die Times und diese Seite ist nicht mehr online, so dass ich nicht weiß, was deren Quelle eigentlich war. Es muss aber mal was in der Science gestanden haben, muss ich mal nachschlagen. Nur nicht gerade jetzt.

    Kann sein, dass das veraltet ist. Wie gesagt, ich hab recht kurz recherchiert, wegen extremen Zeitmangel.

    @Dagor: Na ja, das Projekte dieser Größenordnung immer wieder um Jahre verschoben werden, ist irgendwo auch Alltag. Wobei man schon sagen muss, dass sie sich ranhalten müssen. Das CERN wird ja nicht das einzige Institut sein, das an so etwas arbeitet. Aber jetzt mit dem Start von LHC wird das Ganze schon forciert werden. Muss man ja, weil man sonst untergeht.

  15. #16 Tempura
    September 11, 2008

    Das Web kam vom Cern, Hypertext aber nicht. Die Grundlagen hinter dem Web wurden schon lange vorher erdacht und vereinzelt sogar umgesetzt. Das Web war einfach nur erfolgreicher, da einfacher und Dezentral. Es war einfach die Zeit dafür.

  16. #17 whamburg
    September 11, 2008

    @Ronny: Internet ist nicht nur TCP/IP, vor Web(aka WWW) gab es u.a. Email, IRC, finger, gopher uvm. Aber eines stimmt schon, ohne Web wäre das Internet ärmer und lange nicht so ubiquitär. Leute, die andere über Internet betrügen wollten gab es auch schon vorm Web(https://de.wikipedia.org/wiki/Vorschussbetrug), nämlich per Email. Ja das WWW kam vom CERN, genauer steht es hier: https://de.wikipedia.org/wiki/Web#Geschichte.
    @Ludmilla: 2004 ist veraltet! Schlimmer als ein neuer Computer, den man gerade gekauft hat. 😉 Wenn ich sehe was sich die letzten 20Jahre in der Computerei getan hat, wird mir leicht schwindlig. Na ja, man muß da ja nicht jeden Hype mitmachen. 😉 Vom GEANT gibt es schon GEANT2. siehe auch: https://de.wikipedia.org/wiki/GEANT
    Es würde mich wundern, wenn das LHC nicht mit voller Breite an das DFN angeschlossen würde. Das würde auch den Rechnercluster in Karlsruhe entwerten, der extra dafür gebaut wurde.

  17. #18 whamburg
    September 11, 2008

    @Dragor: So einfach ist das nicht. GRID wird nicht das neue Internet. GRID nutzt das Internet. GRID löst auch nicht alle Probleme. Als Einstieg empfehle ich auch wieder wikipedia. https://de.wikipedia.org/wiki/Grid-Computing

  18. #19 Ludmila
    September 11, 2008

    @whamburg: Ich hab es mir fast gedacht. 2004 kam mir auch arg lang vor, aber auf die Schnelle hab ich auf den CERN-Seiten jetzt nichts aktuelleres gefunden. Ich nehm mal an, dass die gerade anderes zu tun haben, als ihre PR-Webseiten für GRID upzudaten.

    Aber gerade heute habe ich von den Leuten vom Rechenzentrum hier gehört: GRID-Computing war gestern, heute ist CLOUD-Computing angesagt. Wobei ich jetzt auch nicht so genau weiß, inwiefern das jetzt so superneu ist. Hörte sich für mich so an, wie das, was SETI@Home und andere seit Jahren machen.

  19. #20 whamburg
    September 11, 2008

    @Ronny: “oh mann, seid nicht immer so pingelig !”
    Hier steht scienceblogs ganz oben. Hier ist man pingelig, ist systemimmanent. 😉 Mich ärgert nur immer, wenn man das Web mit dem Internet gleichsetzt. Ist altersbedingt. 😉 Ich war schon vorm WWW drin, das ist auch altersbedingt.

  20. #21 isnochys
    September 11, 2008

    Doch, das Internet ist fast nur TCP, daneben gibts auch noch UDP.
    Email, gopher, etc. sind in Anwendungsschicht und eben nicht in TRansport/Network Layer..
    wenn wir shcon bei pingelig sind
    :))
    https://de.wikipedia.org/wiki/OSI-Modell

    (Bin gespannt, wieviele Fehler ich im Kommentar hier versteckt hab:)

  21. #22 whamburg
    September 11, 2008

    @Ludmilla: Also, ob nun “Cloud”, “Grid” oder “verteiltes Rechnen” macht doch nur marginalen Unterschied(von außen gesehen). Mir wird in meinem Fach einfach zu viel Bullshit-Bingo(https://de.wikipedia.org/wiki/Bullshit-Bingo) gespielt. Nach dem Prinzip “Alter Wein in neue Schläuche!” wird ein Hype nach dem anderen kreiert. Es gibt IMHO keine Systemarchitektur, die für alles gut ist, so etwas wie die Weltformel in der Physik. Und oft werden systembedingte Schwächen mit Rechenpower übertüncht. Die Steuerung eines verteilten Systems ist eben nicht trivial und IMHO auch nicht unabhängig vom zulösenden Problem. Dies macht einen universellen verteilten Rechner z.Z. etwas unwahrscheinlich. Nichtsdestotrotz kann man mit solchen Systemen ganze Klassen von Problemen gut “erschlagen”.

  22. #23 whamburg
    September 11, 2008

    @isnochys: Würfel doch nicht alles durcheinander! Als Internet versteht man doch nicht die ISO Schicht 5. TCP/IP != TCP! TCP/IP meint meist alle ISO Schichten siehe auch: https://de.wikipedia.org/wiki/TCP/IP-Referenzmodell

  23. #24 isnochys
    September 11, 2008

    Zitat:
    “Internet ist nicht nur TCP/IP, vor Web(aka WWW) gab es u.a. Email, IRC, finger, gopher uvm.”

    Das Internet ist doch zu 90% TCP/IP
    🙂
    Da dies alle Schichten umfaßt und nicht nur WWW, email, ftp, ssh, etc.
    🙂

  24. #25 whamburg
    September 12, 2008

    @isnochys: Das hab ich jetzt auch schon bemerkt, irgendwo hab ich da daneben gelegen. 😉 Sorry! Also nochmal, WWW != Internet; TCP != TCP/IP; WWW != TCP/IP; aber Internet und TCP/IP ist wohl als synonym zu betrachten. Weniger schreiben mehr denken! Nochmal sorry!

  25. #26 Ronny
    September 23, 2008

    @whamburg, ok, du hast recht, wir sollten pingelig sein, also wie bei jedem meiner Projekte am Anfang: Begriffsbestimmung, sonst reden alle aneinander vorbei.

    Soweit ich informiert bin ist der unterste Layer die MAC Adresse (ethernet), darauf setzt IP auf und darauf die ganzen Dienste wie HTTP, UDP, NAT, FTP, TCP usw.
    Was da jetzt genau als ‘Internet’ bezeichnet wird ist mir nicht klar.

    Was hat CERN da jetzt erfunden ? HTTP ? TCP ? Der MAC Adresslayer kommt ja von den Militärs. Wäre typisch, fire and forget (lol).