Die Datenbanken von Unternehmen sind voll von unstrukturierten, gigantischen Mengen von Daten. „Diese Daten sind sehr schmutzig“, sagt Ralf Herbrich, Managing Director im Amazon Development Center auf der Veranstaltung der Yandex Data Factory in Berlin zum Thema Machine Learning und Big Data. Die Herausforderung für Unternehmen besteht darin, diese immensen Datenberge zu säubern, also mithilfe von immer leistungsfähigeren Rechnern verwertbar zu machen. Amazon sucht nach Mustern im Online-Kaufverhalten seiner Kunden und liefert passende Empfehlungen auf der Basis der Interessen seiner Kunden.

Aus den enormen Datenströmen im Internet lassen sich Trends herauslesen und Modelle ableiten. Auf der Big Data-Konferenz im Radisson Blue Hotel am vergangenen Donnerstag tauschten renommierte Vertreter aus Wissenschaft und Industrie ihre Erfahrungen aus und stellten in Fallstudien und Diskussionsrunden ihre Geschäftsmodelle und Forschungsergebnisse vor.

Der Begriff Big Data ist seit etwa drei Jahren im Vokabular der Medien geläufig. Seine Bedeutung hat sich stets verändert. Nach anfänglichen Bestreben, gigantische Datenmengen zu strukturieren und auszuwerten, nimmt nun die nächste zweite Phase von Big Data ihren Lauf: Die Verknüpfung mehrerer Datensätze und maschinelles Lernen.

Darin liegt ein großer Mehrwert für Unternehmen: Die Daten, die dem einem Unternehmen fehlen, um Kundenverhalten zu filtern, Bewegungsprofile zu erstellen oder maßgeschneiderte Werbung zu platzieren können in den Datenbanken eines potenziellen Partnerunternehmens liegen. Durch Kooperationen entstehen Synergien. Maschinen lernen, Entscheidungen zu treffen und Vorhersagen zu machen. Oft ist in diesem Zusammenhang die Rede von einer neuen industriellen Revolution.

Twitter und Bloomberg enthüllen Trends an der Börse
Eine Kooperation zwischen Bloomberg und Twitter sorgt derzeit für Aufsehen: Daten des Kurznachrichten-Netzwerkes werden in die Finanzplattform von Bloomberg integriert. Das Bloomberg-Terminal ist ein Service für Unternehmen, die Zugang zu den Echtzeit-Analysen aus den Finanzmarkt-Daten der Nachrichtenagentur haben wollen. Seit 2013 dürfen US-Unternehmen Neuigkeiten über die sozialen Medien verbreiten. Aufgrund des viralen Charakters der sozialen Medien können solche Ankündigungen auch die Finanzmärkte beeinflussen.

Wenn Konversationen auf Twitter über eine bestimmte Firma plötzlich stark ansteigen, alarmiert Bloomberg die Trader darüber. Das ist möglich, indem ein Tool in den Tweets nach sogenannten Cashtags sucht, das sind Wörter, die im Zusammenhang mit Geldbeträgen, Investitionen und dem Finanzhandel verwendet werden. Wenn Bloomberg bei Twitter nun einen Trend erkennt, nimmt es anhand der verwendeten Wörter in den Tweets auch eine Stimmungsanalyse vor, also eine Bewertung der Informationen in positive und negative Signale. Der Computer lernt die Sprache der Trader. Zusätzlich wird dieser Trend noch mit den historischen Daten zu diesem Thema auf Twitter grafisch in Zusammenhang gesetzt. Das Ziel: Je mehr Daten Finanzunternehmen sammeln, desto besser können sie auch Aktienkurse voraussagen. Mit der Präzision der Analyseinstrumente steigt auch die Genauigkeit der Vorhersage.

Neue Geschäftsideen entstehen
Für Twitter ergibt sich somit eine neue Möglichkeit, mit den eigenen Daten an den Finanzmärkten Geld zu verdienen. Wer den Big Data Trend verschläft, läuft Gefahr in die Kategorie der „Dinosaurier-Industrie“ abgeschoben zu werden. Für Pioniere auf diesem Gebiet entstehen indes neue Geschäftsmodelle, die sich rasant verbreiten können. Neben Amazon, TripAdvisor, INTEL, AIG und der Allianz stellten auch Boeing und die Deutsche Telekom ihre Innovationen auf der Yandex-Veranstaltung vor:

  • Der Flugzeughersteller Boeing entwickelt ein Echtzeit-Wartungssystem seiner Flugzeuge, das noch während eines Langstreckenfluges alle technischen Komponenten auf ihre korrekte Funktionsweise hin analysiert und den Technikern am Boden kontinuierlich Statusberichte sendet, so dass nach einer Landung eine Reparatur ohne Zeitverlust erfolgen kann. Durch den Export dieser Technologie an andere Flugzeugbauer verspricht sich Boeing neue Erträge. Abstürze seien zwar ohnehin eine Seltenheit, aber „eine Verknüpfung aller Datensätze aus Flugsimulationen und Flugschreibern auf der ganzen Welt könnte sogar das Risiko des menschlichen Versagens kalkulierbar machen“, sagte Sergey Kravchenko, Vize-Präsident von Boeing in Russland/CIS.

  • Das Unternehmen Motionlogic ist ein Spin-Off der Deutschen Telekom und analysiert die Bewegungsprofile der Bürger. Das geschieht anhand der Analyse anonymer Signalisierungsdaten, die aus der Verbindung der Smartphones innerhalb einer beliebigen Fläche zwischen mehreren Funkmasten generiert werden. Durch die Bewegungsprofile kann das Unternehmen Verkehrstrends beobachten. Für einen Verkehrsdienstleister zählt das Unternehmen die Fahrgäste in Regionalzügen – Daten, die dem Verkehrsdienstleister bislang nicht zur Verfügung standen. „Es ist perspektivisch unser Ziel, die Zahl der Passagiere in öffentlichen Bussen zu bestimmen“, sagt Norbert Weber, Senior Business Development Manager, während eines Vortrages zur Optimierung des Verkehrs. Die Daten werden mühelos mit soziodemografischen Variablen verbunden, wie zum Beispiel mit der Altersgruppe, dem Geschlecht oder der Postleitzahl der Menschen, die sich jeden Tag von A nach B bewegen. Diese Daten sind für potenzielle Werbekunden wichtig, denn sie verraten viel über Zielgruppen und Präferenzen. Der Vorteil: Im Gegensatz zu Datensätzen, die auf GPS-Daten beruhen, sind die Analysen der Bewegungsströme von der Telekom-Tochter umfassender und die Stichproben wesentlich größer. Außerdem sind die Daten jederzeit verfügbar, denn auch nachts wählt sich das Smartphone in das Funknetz der Telekom ein, selbst wenn GPS und Internet ausgestellt sind.

  • Das soziale Netzwerk Meetup nutzt unter anderem öffentlich zugängliche Daten aus Facebook-Profilen, um herauszufinden, welche Gemeinsamkeiten Menschen haben. Wer sich registriert, erhält Empfehlungen zu lokalen Gruppen, in denen Gleichgesinnte organisiert sind. Das soziale Netzwerk zählt über 23 Millionen Mitglieder in über 180 Ländern.

Einhaltung der Privatsphäre ist ein „Problem“
Doch alle noch so innovativen Geschäftsmodelle bieten noch keine hinreichende Lösung für das Problem der schwindenden Privatsphäre im Netz. Während Konzerne in anderen europäischen Ländern viel uneingeschränkter mit der Verwendung ihrer Nutzerdaten umgehen können, ist in Deutschland das Bewusstsein für den Verlust der Privatsphäre stark ausgeprägt. „Die Presse ist ein wichtiger Stakeholder in dem Bereich“, sagt Andreas Braun, Chef der Allianz Global Data and Analytics. Wenn Big Data uneingeschränkt im Bereich der Krankenversicherung Anwendung finden würde, wären manche Kunden möglicherweise nicht mehr versicherbar, so der Big Data-Experte. Die meisten Kunden wüssten, welche Daten sie preisgeben. Braun ist dafür, das Prinzip Privacy-by-Choice weiter voranzutreiben. Private Daten müssten geschützt bleiben. Die Kunden sollten aber selbst entscheiden können, wie viele und welche Daten sie preisgeben. Zahlreiche Krankenversicherungen bieten ihren Kunden zum Beispiel Vergünstigungen oder Prämien an, wenn sie an Bonus- und Fitnessprogrammen teilnehmen oder ihre Vitaldaten freiwillig mit Fitness-Apps preisgeben.

„Die Nutzererfahrung ist der Schlüssel, um das Problem mit der Privatsphäre zu lösen“, ergänzt Martin Szugat, Geschäftsführer beim Unternehmen Datentreiber und Vorstand bei der Predictive Analytics World Germany-Konferenz in Berlin. Die Menschen müssten ihre Daten freiwillig weggeben wollen. Noch bringe Big Data mit seinen Marktanalysen fast ausschließlich Vorteile für Unternehmen – nicht in erster Linie für die Kunden.

Maschinen lernen immer schneller. Für Unternehmen ist das ein echter Game Changer im Marketing. Kaum eine Branche kann es sich leisten, sich dieser Technologie zu verschließen, wenn sie nicht zu innovationsresistenten Dinosauriern gehören will.

Große Nachteile entstehen hingegen beim User. Die Einhaltung der Privatsphäre ist „ein Problem“, darüber herrschte Einigkeit auf der Big-Data-Konferenz in Berlin. Niemand kann kontrollieren, ob Daten über Landesgrenzen hinweg tatsächlich nur in anonymisierter Form und ausschließlich für Marketingzwecke ausgetauscht werden. In Zeiten, in denen regelmäßig Datenleaks öffentlich gemacht werden und der Bevölkerung die Sensibilität ihrer Daten zunehmend bewusst wird, müssen Industrie und Wissenschaft bei allem Potenzial dieser Technologie um das Vertrauen der Kunden und Internetuser kämpfen.