Wenn das Wort “Big” als Adjektiv in der politischen Diskussion auftaucht, meint es selten etwas Gutes: Big Brother, Big Oil, Big Government, Big Business – all dies beschreibt Konzepte, die uns etwas kleiner meist lieber wären. Als also das MIT heute ankündigte, dass dank großzügiger (und keineswegs uneingennütziger) Förderung durch den Chiphersteller Intel ein neues Forschungs- und Entwicklungsprogramm namens Big Data@CSAIL eingerichtet werde (CSAIL steht für Computer Science and Artificial Intelligence Lab), wurde ich erst mal ein bisschen unruhig. Das neue Institut wird nämlich nicht gerade ein Musterbeispiel unabhängiger Forschung sein, da – wie der Intel-Vorstand Justin Rattner unumwunden erklärt – diese so genannten Intel Science and Technology Centers dazu dienen, das Wachstum von Intel zu fördern und daher direkt an Intel berichten werden. Aber sei’s drum, als Mitarbeiter des MIT (der auch Studenten des CSAIL unterrichtet) kann ich andererseits nur sagen, dass die 2,5 Millionen Dollar jährlich sicher immer willkommen sein werden.
Aber worum geht’s eigentlich bei Big Data? Darum, dass unsere Kapazitäten, Daten zu sammeln, bei weitem unsere Kapazitäten zu Daten Verarbeiten überschreiten: Pro Jahr werden in den Servern der Welt runde 1,8 Zettabytes gespeichert (1 Zettabyte = 1021 Bytes, also eine Billion Gigabytes); aber mit den herkömmlichen Methiden des Datamining oder gar der normalen Datenverarbeitung ist solchen Volumina nicht beizukommen. Dazu brauche es spezielle Computerarchitekturen, die sich auch noch auf solche Megadimensionen skalieren lassen, ebenso wie eigens zu solchen Zwecken entwickelte Algorithmen, versichert Sam Madden, ein MIT-Computerwissenschafter, der das neue Programm leiten wird.
Ich habe hier alle relevanten Pressemitteilungen verlinkt; allzu sehr will ich mich als MIT-Mitarbeiter hier nicht aus dem Fenster hängen. Um ganz ehrlich zu sein, war am Ende doch vor allem der eine Gedanke bei mir stecken gelieben: Ich hatte bisher auch immer gefürchtet, dass Big Data als Inkarnation von Big Brother längst Realität sei. Die Datensammelwut der Regierungen, aber auch von Privatfirmen wie Facebook und Google, ist ja legendär – heißt das also, dass die bisher noch gar nicht so recht wissen, wie sie mit all dem Zeugs wirklich etwas anfangen können?
Kommentare (5)