Big Data im Onlinemarketing: In verknüpften Daten liegt wertvolles Wissen

Das Thema „Big Data“ ist in aller Munde und keine Branche und kein Entscheider kann sich diesem Thema entziehen. In diesem Beitrag möchte ich der Frage nachgehen, welche Bedeutung und welche Möglichkeiten Big Data im Onlinemarketing hat.

Drei Vs beschreiben grob die Big-Data-Definition: Velocity, Variety, Volume. Variety: alle Strukturen von Daten (beschreibende Daten, zusammenhängende Texte, Maschinen- und Logdaten, Multimedia-Content), Velocity: sehr kurze Latenzzeit der Datenverarbeitung (Echtzeit oder in der Nähe davon), Volume: alle Daten aus mehreren Quellen und langen Zeitreihen.

Onlinemarketing unterliegt genau diesen drei Vs: Es werden Massen an Daten produziert, Informationen bestehen aus strukturierten Daten und Freitext (Facebook, Twitter, E-Mail) und die Reaktionszeit in der Interaktion mit einem User sollte kleiner 1 Sekunde sein. Aus Sicht der Online-Marktteilnehmer ergeben sich unterschiedliche Szenarien, zwei möchte ich näher beleuchten.

1. Big Data für/und operative Onlinebusiness-Performance
Große Community-Portale, E-Business-Plattformen mit einer hohen Anzahl an Shoppern und Warenvielfalt oder Performance-Optimierungs-Provider (Recommendation, Bidding, Re-Targeting) unterliegen der Anforderung, ihre Dienste quasi in Echtzeit bereitstellen zu müssen. Hieraus haben sich im Wesentlichen zwei neue Ansätze in Bezug auf das Datenmanagement in den vergangenen Jahren entwickelt.

  • Hadoop mit dem MapReduce-Konzept (Initiator Google), speichert riesige Datenmengen (TB bis PB) verteilt und ermöglicht schnellen Zugriff durch massive Parallelverarbeitung
  • Spaltenbasierende Datenbanken (NoSQL-freier Zugriff auf jeden Datenpunkt), welche Daten bis zu Faktor 1000 schneller abfragen können als klassische relationale Datenbanken. Spaltenbasierende Datenbanken kombiniert mit der zunehmenden Hauptarbeitsspeichergröße im Rechner nennen sich In-Memory-Datenbank (IMDB) und ist die „Formel 1“ in der Datenverwaltung

Beispiele:
Ein Online-Reiseportal konnte nur mit dem Einsatz einer Realtime-Datenbank beliebige Reisekonfigurationen innerhalb einer Sekunde berechnen. Zur individuellen Personalisierung des Contents während einer Onlinesession werden Daten aus User-Eingaben, Facebook, Twitter, CRM-System, Webanalyse und externen Daten gesammelt, um in Echtzeit den Content dem User-Verhalten/Profil entsprechend auszusteuern – ohne eine Hadoop-Datenverwaltung wäre dies nicht möglich.

2. Big Data für Analyse bis Prognose (Predictive Analytics)
Analyse aus Daten beginnt mit Entscheidungen aus dem Bauchgefühl und findet die Perfektion in lernenden Prognosesystemen. Reports und OLAP (Datenwürfel) geben Antwort auf das „Heute“ und „Gestern“. „Bares Geld“ liegt aber in dem versteckten Wissen und der Vorhersage in den verknüpften Daten. Mit „Advanced Analytics“ werden z.B. Zusammenhänge aus Ursache und Wirkung, Ähnlichkeitsmuster und Hypothesen analysiert oder Prognosen für zukünftige Ereignisse (Reagiert der Käufer?) berechnet.

Statistische Verfahren, Datamining und Prognose-Algorithmen sind die Werkzeuge hierfür. Welche Rolle spielt hier nun Big Data? Die o.g. Hardware- und Softwareinnovationen ermöglichen, dass Daten der im Onlinemarketing beteiligten Systeme ohne hohen Aufwand verknüpft werden können. Denn bisher werden meistens nur die Daten in den Datensilos von Webanalyse, Kampagne, E-Mail und Webshop einzeln analysiert, aber nicht miteinander verknüpft. Viele Fragen können nicht beantwortet werden. Sind die Daten aber in einer In-Memory-Datenbank verknüpft, ergeben sich bisher nicht möglich gewesene Analysemöglichkeiten. Denn um signifikante Muster in Daten zu entdecken, eignen sich große Datenmengen besser als kleine. Die gefundenen Muster und Prognosen dienen der Optimierung sämtlicher Onlinemarketing-Investments.

Synop Systems bietet für solche Zwecke eine In-Memory-Datenanalyse-Software an, welche In-Memory-Datenbank, Data Discovery, Datamining und Prognose in einem Tool verbindet. Der Synop Analyzer ermöglicht über Schnittstellen, die Daten aus den o.g. Systemen automatisiert in die In-Memory-Datenbank verknüpft zu importieren.

Die interaktive Datenvisualisierung (Data Discovery) ermöglicht es dem Analyseanwender, im Onlinebereich in wenigen Minuten Fragen zu beantworten und neue Zusammenhänge in den Daten zu entdecken. Die Frage, welche werthaltigen Kunden aus welchen Kampagnen der letzten zwei Jahre über welche Medien und Quellen und mit welchem Budget gewonnen werden konnten, lässt sich nun in wenigen Schritten beantworten. Kennt man die Zusammenhänge, lassen sich Erfolge systematisch wiederholen. Der Synop Analyzer kann auch zur Erstellung von Regeln (Mustern) eingesetzt werden, um z.B. die Banner-Schaltung in einem Onlineportal auf das aktuelle Kundenprofil auszusteuern. Hierbei kommen die High-Perfomance-Datamining-Module zum Einsatz, welche Muster und Prognosen (Scores) auf Millionen oder Milliarden von Daten in wenigen Sekunden berechnen können.

Diese Regeln werden ständig neu trainiert, sodass die Aussteuerung der Banner sich dem veränderten Verhalten des Visitors adaptiert, und dies unter Betrachtung aller Daten. Der auf Java basierende Synop Analyzer bietet offene Schnittstellen an, um sämtliche Prozesse zu automatisieren oder eigene Analyse-Apps zu entwickeln. Die Software, made in Germany, ermöglicht den kostenmäßigen Einstieg dort, wo andere mit dem Tagessatz beginnen.

Fazit:
Onlinemarketing ist einer der „Mitbegründer“ der Big-Data-Architekturen und -Tools. Die Innovationen in Hardware und Software ermöglichen zwischenzeitlich In-Memory-Analyse für den Mittelstand. In verknüpften Daten liegt wertvolles Wissen. Synop Analyzer kann ohne große Investitionen und Expertise dieses Wissen aus den Daten gewinnen, um Onlinemarketing effizienter und effektiver zu machen.

Autor: Volker Marquardt

Volker Marquardt, ist seit 2012 Gesellschafter und Geschäftsführer der Synop Systems. Davor war er in verschiedenen verantwortlichen Vertriebs- und Business Development-Positionen in Software- und Beratungsunternehmen. Hierdurch hat er sich ein breitbandiges Wissen in den Themen Data Mining, Big-Data-Analytics, Marketing-Automation, analytisches CRM, E-Commerce, Business Intelligence, Risk Management, Call-Center und Electronic Test Automation erarbeitet.