Demografie: Wissenschaftler ermitteln Migrationsströme aus E-Mails
Anhand der E-Mails von 23 Millionen Yahoo-Nutzern haben zwei Wissenschaftler ermittelt, wohin Menschen auswandern. Dabei förderten sie bemerkenswerte Details zutage.
Migrationsforschung anhand von E-Mails betreibt Emilio Zagheni vom Max-Planck-Institut für demografische Forschung (MPIDR) in Rostock. Er hat analysiert, von wo E-Mails auf der Welt versandt wurden, und daraus ermittelt, wohin die Schreiber ausgewandert sind.
Anonymisierte Auswertung
You are where you E-mail - in etwa: Man ist, wo von aus man Mails verschickt, lautet der Titel der Studie, die Zagheni zusammen mit Ingmar Weber von Yahoo Research verfasst hat. Die beiden haben die Kommunikation von 43 Millionen Mailkonten, die bei dem Anbieter Yahoo registriert sind, ausgewertet - anonymisiert, versteht sich: Die beiden Wissenschaftler konnten weder sehen, wer die Mail verschickt hatte, noch was im Betreff oder im Inhalt stand.
Grundlage für die Auswertung waren die persönlichen Daten der Nutzer - namentlich Geburtstag und das Geschlecht - sowie alle Mails, die von den betreffenden Konten zwischen September 2009 und Juni 2011 verschickt wurden. Bei diesen waren das Datum sowie die IP-Adresse von Bedeutung: Aus Letzterer ermittelten die Forscher, aus welchem Land die Mail jeweils verschickt wurde.
Neuer Absendeort
Stellten Zagheni und Weber fest, dass sich der Ort, von dem aus ein Nutzer seine Mail verschickte, dauerhaft verändert, klassifizierten sie diesen Nutzer als Migranten. Auf diese Weise konnten sie die Wanderungsströme aus fast jedem und in fast jedes Land der Welt ermitteln. Für die USA habe sich die Auswanderung nach Geschlecht und Alter zum ersten Mal beziffern lassen.
Das Auswertung der Daten zeigt, dass die Finanzkrise zu mehr Mobilität bei den Menschen geführt hat. Die Bewegung hat eine klare Tendenz: Die Abwanderung aus den USA ebenso wie aus den meisten anderen entwickelten Ländern habe seither zugenommen, fanden die Demografen heraus. Zu den wenigen Ausnahmen zählten die Schweiz und Taiwan. Im Verhältnis wanderten mehr Frauen als Männer ab - ein Trend, der bis dato unbekannt war.
Einheitliche und schnell verfügbare Daten
Aus herkömmlichen Datenquellen ließen sich solche Migrationsströme nur schwer und nicht aktuell ermitteln, sagt Zagheni. So gebe es bislang keine offizielle Übereinkunft, wann eine Person als Migrant betrachtet werde. Offizielle Angaben seien zudem oft veraltet, weil sich Einwanderer oft erst spät oder gar nicht in der neuen Heimat anmeldeten. Entsprechend seien Schätzungen internationaler Migration "oft veraltet und stimmen kaum miteinander überein." Anders die Internetdaten, die die Basis für ihre Arbeit bildeten: "Sie sind für alle einheitlich und schnell verfügbar"", sagt Zagheni.
Um die Daten auszuwerten, haben die beiden Forscher auch ein mathematisches Modell erstellt, mit dessen Hilfe sie Fehler aus der E-Mail-Statistik herausgerechnet haben. So seien bei den E-Mail-Nutzern nicht alle Bevölkerungsgruppen gleichmäßig vertreten - Ältere schrieben beispielsweise weniger Mails als Jüngere. Sie berechneten Korrekturfaktoren und behoben diese Verfälschungen. Um diese Faktoren zu bestimmen, verglichen sie ihr Modell mit Migrationsdaten aus Europa, die relativ valide sind.
Twitter auswerten
"Was wir herausgefunden haben, ist nur die Spitze des Eisbergs"", erklärt Zagheni. Er ist überzeugt, dass sich mit einer vergrößerten Datenbasis, etwa vom Microblogging-Dienst Twitter, sowie durch verfeinerte, mathematische Korrekturen noch ganz andere Dinge berechnen ließen - etwa die Bevölkerungswanderungen in einer Krisenregion.
Es wäre nicht das erste Mal, dass Twitter-Daten für wissenschaftliche Zwecke benutzt werden: 2010 stellten US-Forscher eine Methode vor, mit der sie in den Jahren 2008 und 2009 eine Milliarde der Kurznachrichten automatisiert auf Aussagen über Politik oder Wirtschaft auswerteten. Die Ergebnisse verglichen sie mit Umfragen von Meinungsforschungsinstituten und stellten dabei zum Teil sehr hohe Übereinstimmungen der Ergebnisse fest.
Also wenn ich die Zahl 2009/2010 hernehme: waren das bei der Spitzengruppe (25-29) 1,5...
warum sollte man bei nem email-dienst wahrheitsgemäße angaben machen?
Ich vermute mal die haben die Daten nicht auf einen Rutsch bekommen sondern nach und...