Lösungen, Cloud

Gehört Big Data in die Cloud?

Artikel von,
HP Blogger
,

Haben Sie die IT-Vorhersagen für 2012 gelesen? Während es im vergangenen Jahr von allen Seiten "Cloud Computing" schallte, ist dieses Jahr "Big Data" das beherrschende Thema. Sieht so aus, als ob die Cloud mittlerweile zum alten Eisen gehört.

Lassen Sie uns zunächst einmal die Terminologie definieren, damit wir nicht über verschiedene Dinge reden. Laut Wikipedia bezeichnet Big Data besonders große Datenmengen, die mit Hilfe von Standarddatenbanken und Daten-Management-Tools nicht oder nur unzureichend verarbeitet werden können. Problematisch sind hierbei vor allem die Erfassung, die Speicherung, die Suche, Verteilung, Analyse und Visualisierung großer Datenmengen. Das Volumen dieser Datenmengen geht in die Terabytes, Petabytes, Exabytes und Zettabytes.

Nach aktuellen Berechnungen verzehnfacht sich die verfügbare Datenmenge circa alle fünf Jahre. Dieser Trend wird noch verstärkt durch die zunehmende maschinelle Erzeugung von Daten - etwa über Protokolle von Telekommunikationsverbindungen (CDR) und Web-Zugriffen (Weblogs) oder auch das automatische Erfassen von RFID-Lesern, Kameras, Mikrofonen und sonstigen Sensoren. Weitere Beispiele für Big Data gibt es in der Finanzindustrie (Finanztransaktionen, Börsendaten), bei E-Commerce, Social Media und anderen Internet-Auftritten, dem Energiesektor oder dem Gesundheitswesen. In der Wissenschaft fallen ebenfalls große Datenmengen an, etwa in der Geologie und Genetik sowie bei der Klimaforschung und der Kernphysik.

Management der Daten

Nun, das wäre geklärt. Tatsächlich wuchs das digitale Universum 2011 um 1,8 Zettabytes an Daten, Tendenz steil steigend - für 2015 sind 8 Zettabytes vorhergesagt, für 2025 35 Zettabytes (nebenbei habe ich beim Verfassen dieses Blogeintrags die Bezeichnung Zettabyte neu gelernt). 70 Prozent dieser Daten werden durch Individuen erzeugt, 85 Prozent davon bestehen aus unstrukturierten Daten. Wir nennen das „menschliche Information“. In jeder Sekunde kommen 97.000 Tweets hinzu, in jeder Minute 12 Millionen Texte, jeden Tag 294 Millionen E-Mails.

Wussten Sie, dass ein einziger kommerzieller Flug über die USA 240 Terabytes (TB) an drahtlosen Daten erzeugt? Es geht heute nicht mehr primär darum, Daten zu sammeln, sondern sie zu speichern. In einem gerade laufenden Experiment bündeln wir mit drahtlosen Sensoren alle 15 Minuten 1,35 TB an Daten. Mit einer stabilen 56-MB-Funkverbindung benötigen wir ungefähr 42 Stunden, um diese Daten zu sammeln, entsprechend werden neue Übertragungsmechanismen und -verfahren dafür benötigt. Interessant, dass wir in den vergangenen zehn bis 15 Jahren von einem Zustand, in dem wir zu wenige Daten für die Entscheidungsfindung zur Verfügung hatten, zum totalen Datenüberfluss gekommen sind. Auch heute können wir oft keine Entscheidungen fällen, weil wir die Daten nicht mehr vom Hintergrundrauschen unterscheiden können.

Ob es nun um Disaster Recovery, Back-up, leistungshungrige Analytics oder Kalkulationen geht – oft werden die benötigte Zeit und Kosten für die Speicherung der Daten in der Cloud nicht berücksichtigt. Es stellt sich dabei unmittelbar die Frage, ob die Daten überhaupt in der Cloud gespeichert werden müssen, oder ob ein hybrider Ansatz, bestehend aus einer Kombination aus Enterprise IT-Ressourcen (also eine Private Cloud oder Legacy) und Public Cloud, nicht die bessere Lösung wäre. Lassen Sie uns ein Beispiel heranziehen, in dem Daten aus Social Networks, die sich bereits in der Cloud befinden, mit Enterprise-Informationen verknüpft werden.

Verstehen Sie Ihren Kunden

Wenn Sie wissen wollen, was die Welt über Ihr Produkt, Ihre Marke oder Ihren Service denkt, dann sollten Sie Tweets, Blogs und Foren im Auge behalten. Früher haben sich die Leute an der Bar über schlechten Service ausgekotzt, heutzutage tun sie das auf Twitter. Wenn Sie weiterhin wettbewerbsfähig bleiben wollen, können Sie diese Tatsache nicht ignorieren.

Eine größere Umfrage unter Business- und IT-Entscheidern, die wir initiiert haben, zeigte uns, dass im Großunternehmen typischerweise nur fünf Prozent aller zur Verfügung stehenden Informationen genutzt werden, dass 48 Prozent der Organisationen keine effektive Informationsstrategie verfolgen, und dass lediglich zwei Prozent immer rechtzeitig die nachgefragten Informationen an das Business liefern können.

Die angesprochenen Social-Media-Daten gehören per Definition in die Cloud. Üblicherweise wollen Unternehmen diese Daten mit ihren selbstgesammelten Informationen über die Kunden abgleichen und verknüpfen. Genau das hat zufällig das "Project Fusion" von HP getan. Durch die Verbindung von Social-Media-Daten mit bestehenden Kundeninformationen lässt sich das Verhalten von Käufern vorhersagen. Offensichtlich sträuben sich manche großen Firmen dagegen, sämtliche Kundendaten in die Cloud zu verschieben, entsprechend wichtig ist es, Daten aus unterschiedlichen Quellen integrieren zu können.

HPs Ansatz

HP ist sich der Tatsache voll bewusst, wie wichtig es ist, nicht nur strukturierte Daten, sondern auch die immensen Berge an menschlichen Daten durchsuchen zu können. Durch die Kombination aus Verticas Analytic Platform für strukturierte Daten und Autonomys bedeutungsbasiertem Ansatz kann HP Ihnen eine Lösung anbieten, die sie über das tatsächliche Geschehen auf dem Laufenden hält. Die Kombination multipler Informationsquellen versetzt Sie in die Lage, die Daten dort zu belassen, wo sie sich eben befinden, und gleichzeitig alle verfügbaren Informationen daraus zu extrahieren. Das bezeichnen wir als die Ära der menschlichen Informationen.

Also, Big Data mag ein Hype sein, aber die Daten sind nun mal da, Unternehmen müssen sich das vergegenwärtigen. Werkzeuge dafür existieren bereits heute, wie wir mit dem Projekt Fusion bewiesen haben, aber da wird noch viel mehr kommen. Sie sollten das dringend im Auge behalten, so können Sie sich einen deutlichen Vorteil gegenüber den Wettbewerbern erarbeiten. Und wenn Sie es nicht tun, wird es Ihr Wettbewerber machen. Das wäre doch schade, oder? 

 

Diesen Beitrag können Sie auch in einer für Smartphones optimierten Version lesen. Besuchen Sie dafür die mobile Version des ECF - am Fuße der Seite können Sie bequem wieder in den Vollmodus zurückkehren.

(3) (3)

Diskussion
Möchten Sie dazu einen Kommentar abgeben? Anmeldung oder Registrierung.