Vier Forscher von der Carnegie Mellon University in Pittsburgh haben sich einem interessanten Problem gestellt – wie teile ich eigentlich eine Stadt in Bezirke ein? Natuerlich gibt es traditionelle Grenzen von Stadtteilen, aber die sind meist alt hergebracht. Und die ‘echten’ Grenzen herauszufinden ist alles andere als einfach, denn existieren nur in den Koepfen der Menschen, die dort wohnen. Und die dort herauszubekommen, erfordert lange Interviewkampagnen, eine Methode die skaliert.

Stattdessen machen sich die Forscher die moderne Welt und moderne Technik zunutze – Foursquare. Foursquare nimmt man als App mit und kann dann ‘einchecken’, wo man sich aufhaelt. Man kann es der Welt mitteilen oder einfach das Signal speichern, weil Signale speichern Nutzen bringen kann. Jetzt erlaubt Foursquare nicht direkt Zugriff auf diese Daten, aber indirekt laesst sich wenigstens ein Teil davon ueber Twitter-Meldungen abgreifen, und so kam eine Datenbank von 18 Millionen Check-Ins zustande.

In ihrem Paper besprechen die Forscher die Methode, mit der sie aus diesen Daten eine neue Unterteilungen von Staedten gefunden haben – die sie ‘Livehoods’ taufen. Wer nicht an der Methode interessiert ist, sollte direkt zur zugehoerigen Webseite gehen – Livehoods.com und mit den Karten spielen. Wer mich besuchen moechte, kann sich ja schonmal mit Oakland Downtown anfreunden.

Aber wenigstens ich finde die Methode ziemlich spannend. Sie basiert auf einem Graph aller Orte – wobei jeder Knoten ein Ort ist und mit den geographisch am naechsten liegenden 10 Orten durch eine Kante verbunden wird. Jede Kante erhaelt dann ein Gewicht zugeteilt, das groesser ist, wenn diese Orte sich sozial naeher sind. Das wiederum findet man dadurch heraus, die Aehnlichkeit der Check-Ins zu untersuchen: Werden zwei benachbarte Orte von den gleichen Menschen besucht? Dann liegen sie sich sozial nahe.

Auf diesen Graph laesst man dann einen (spektralen) Cluster-Algorithmus los, um Orten, die geographisch nahe liegen und sozial zusammengehoeren in einer Gruppe, einem Livehood, zu sammeln. Die Website bietet ziemlich viel Informationen dazu, man kann sich die Orte anschauen, die Charakteristiken der Livehoods und verwandte Livehoods identifizieren.

Ich hoffe, dass die Forscher schon eine Firma gegruendet haben um diese Daten zu Geld zu machen, Marketing-Firmen werden fuer solche neuen Demographien sicher klingende Muenze hergeben…

Aber darueber hinaus bleibt nochmal auszubauen, was ich eben nur hingeworfen habe: Dass Dienste wie Foursquare als Erzeuger von Signalen wichtig sind, und ungeahnte Moeglichkeiten eroeffnen. Foursquare hat als solches erstmal scheinbar wenig Wert: Man kann ein bisschen Punkte sammeln, aber so richtig Moeglichkeiten eroeffnen sich begrenzt. Aber wenn man erstmal etwas Signale gesammelt hat, bieten sich mehr Wege, etwas damit anzufangen. Und genauso, wie Internetwerbung besser wird, wenn man Signale bereit stellt, werden lokale Signale in Zukunft eine immense Rolle darin spielen, neue und bessere Dienste bereitzustellen.

Die Forscher ueberprueften ihre Ergebnisse daheim in Pittsburgh dann auch noch mit 27 intensiven Interviews. Dabei untersuchten sie beispielsweise ein Paar sehr unterschiedlicher Stadteile, an deren Grenze ein Whole Foods Market eroeffnet worden war (eine sehr beliebte und teure Kette “besserer” Nahrungsmittel). Waehrend die meisten Livehood-Eingrenzungen auf Zustimmung stiessen, kam es hier zu Dissenz: Die Interviewten glaubten naemlich eher, dass sich hier die Grenze zwischen den Stadtteilen aufloeste, wahrend der Algorithmus hier einen neuen, dritten Bezirk einfuehrte, die die Stadtteile weiter voneinander trennte.

In einem anderen Beispiel wurde ein Stadtteil in vier Livehoods aufgeteilt – was auf breite Zustimmung bei den Interviewten stiess.

Und, wie immer, muessen auch die Grenzen der Methode erwaehnt werden. Ganz klar ist die Datenbasis gepraegt von jungen Menschen die Foursquare benutzen UND dann ihre Check-Ins per Twitter an die Welt schicken. Das zu aendern, wird aber alles andere als einfach sein.

Kommentare (4)

  1. #1 emteg
    05/12/2012

    Ich hab den Dienst in Ermangelung eines Smartphones noch nicht benutzt, vielleicht kommt daher meine Frage: was bedeutet in diesem Kontext das Wort “Signal”?

  2. #2 gumboNet
    05/13/2012

    Das “Signal” soll in diesem Zusammenhang wohl fuer die gespeicherten GPS Standortdaten stehen.
    Interessant bei Foursquare ist, dass man die Koordinaten nicht selbst speichert, was seit 20 Jahren ja ein altes paar Schuhe ist – stattdessen speichert der “Dienst” diese Daten um sie fuer sich zu Nutzen (Stichwort: location-based marketing).
    Das Ganze ist natuerlich nicht, wie im Post beschrieben “ziemlich spannend”, sondern trivial und alt.

    Das Prinzip ist simpel: die Foursquare “App” zeichnet Locations (also Koordinaten von GPS, WLAN- und Mobilfunkbasierter Ortung) auf, und erlaubt es den Benutzern diese zu veroeffentlichen (intern behaelt Foursquare die Daten natuerlich schoen fuer sich selbst).
    Veroeffentlicht wird allerdings nicht die tatsaechliche Position (die Foursquare bekannt ist), sondern die “Location”, also der oeffentliche Platz, bzw. das Gebaeude, in der Naehe, das der Anwender seinen “Freunden” mitteilen moechte.

    Damit wird auch gleich das Dilemma der Auswertung dieser oeffentlichen Daten offensichtlich: Die Personen die im McDonalds neben der Nobeldisco sitzen teilen ggf. lieber die prestigetraechtigere Location mit. Zudem liegt einmal mehr eine falsche Kausalitaet zu Grunde: es wird angenommen Personen wuerden ihre sozialen Verbindungen an Hand der Oertlichkeiten an denen sie sich befinden waehlen. Naeher am Alltag ist wohl, dass die Personen Oertlichkeiten an Hand ihrer sozialen Verbindungen waehlen.

    Auch wenn Joerg Rings hofft die Forscher wuerden ihre Ergebnisse in ein Geschaeftsmodell umsetzen ist das doch eher unrealistisch. Die wertvollen Daten fuer social und location-based marketing sammelt Foursquare. Die sehr viel spaerlicheren und vor allem ungenaueren oeffentlichen Daten die hier ausgewertet werden sind von dem her wesentlich unattraktiver und nicht zuletzt auch in erster Linie dem Darstellungsdrang der Personen, die die Daten tatsaechlich veroeffentlichen, unterworfen. Ich denke jedem Leser sind im Bekanntenkreis ausreichend Personen mit entsprechendem Selbstdarstellungsdrang bekannt und damit auch wie sehr sich die Realitaet oft von der Darstellung unterscheidet (selbst im persoenlichen Level, nicht zu sprechen von einer Internetplattform).

  3. #3 Jörg
    05/13/2012

    @emteg: Im Gegensatz zu Selbstdarstellern ihrer Ahnungslosigkeit wie gumbo sehe ich ein Signal als ein kleines Stück Daten, das du öffentlich machst, um entweder einen Dienst benutzen zu können (wie Googlemail) oder schlichtweg etwas über dich mitzuteilen, was auch immer dabei herauskommen mag. Facebook kann dir bessere Werbung zeigen – und wenn man schon Werbung ansehen muss, warum dann nicht relevante?
    Foursquare stellt sehr wohl Daten zur Verfügung. Aber natürlich nicht die ganzen Check-Ins, das wäre ja rein technisch schon nicht machbar, man braucht ja schon gehörige Infrastruktur und neue Technologie um die nur zu speichern und zu filtern. Aber Informationen über Orte kann man über die API bekommen und darauf eigene Dienste aufbauen.

  4. #4 SimbaOderNala
    05/15/2012

    Ich finde den Artikel ebenfalls zu optimistisch. Was ich überhaupt nicht verstehe: wenn foursqaure nur dazu gut ist, einen “ping” auszusenden, wo wollen die mir dann werbung einblenden? Ebenso diese livehood seite da? Das macht doch keinen Sinn.

    Einfach nur eine weitere unnötige Datenkrake …