Daten Wissenschaft & Technik

Daten werden immer wichtiger. Werfen wir einen Blick auf einige Beispiele, um ein Gefühl dafür zu bekommen, inwieweit sich Daten in Zukunft ändern werden:

1. Die Menschen erzeugen täglich 2,5 Trillionen Bytes an Daten [1].

Das sind 2,5 mit 30 Nullen, und das passiert jeden Tag!

2. 90% aller auf dem Planeten verfügbaren Daten, wurden in den letzten 2 Jahren generiert [1].

Das bedeutet, dass wir ein exponentielles Datenwachstum bei weitem überschritten haben und wirklich in das datengesteuerte Zeitalter eingetreten sind.

3. Von diesen Daten bleiben 95% nicht analysiert [1].

Viele Unternehmen wissen, dass sie Daten sammeln müssen, aber sie wissen nicht, was sie damit tun sollen. In diesen 95 % der nicht analysierten Daten könnten sich sehr wertvolle Informationen verbergen, wie z. B. Ihre ideale demografische Zielgruppe, ein unterbewertetes Produkt von Ihnen oder eine potenzielle Einhornidee.

4. Bis 2020 wird fast die gesamte Datenverarbeitung durch automatisierte Prozesse erfolgen [1].

All diese Daten können nicht mehr von den Menschen selbst analysiert werden. Was in Zeiten von SAP und Excel noch funktioniert hat, ist manuell nicht mehr möglich. Deshalb müssen neue Werkzeuge, neue Technologien und neue Prozesse implementiert werden, um diese enorme Datenmasse zu bewältigen.

[1] Quelle

Wie profitiert meine Firma von der Data Science?

Gerade in Zeiten, in denen immer mehr Unternehmen in die digitale Welt übergehen, ist es von entscheidender Bedeutung, den Wechsel in das datengesteuerte Zeitalter zu vollziehen. Natürlich mag dies viele traditionelle Unternehmen verunsichern, aber Klagen hilft inmitten dieses Übergangs in eine neue Welt nicht weiter.
Ihr Unternehmen wird die Wahl haben, entweder ein eigenes Datenteam und eine eigene Datenarchitektur aufzubauen oder Dienstleistungen und Outsourcing zu nutzen, um seine Daten endgültig zu verarbeiten.
Aber um Ihnen einen kleinen Hoffnungsschimmer zu geben: Die Nutzung dieser Daten kann Ihre Verkäufe und Einnahmen in einer nie dagewesenen Weise steigern. Neue Märkte und Kunden werden verfügbar, neue Möglichkeiten zusammen mit einer globalen Reichweite stehen Ihnen zur Verfügung. Ein Upgrade eines Prozesses wird den Umsatz nicht mehr um 1% steigern, es könnte Ihre Ergebnisse um 10 x10 steigern. Lesen Sie weiter, um herauszufinden, wie Ihr Unternehmen diesen Übergang bewältigen kann.

Der Unterschied zwischen Data Science und Data Engineering

Sowohl Techniken als auch Ansätze zum Umgang mit dieser riesigen Datenmenge lassen sich unter “Data Science” und “Data Engineering” zusammenfassen. Die Data Science befasst sich mit dem analytischen Teil des Prozesses, d.h. dem Schritt der Datenvorbereitung, der Extraktion und der Ableitung von Ergebnissen aus gegebenen Daten.

Data Engineering hingegen befasst sich mit dem technischen Hintergrund, vor dem ein Data Scientist arbeitet. Dazu gehören zum Beispiel die Optimierung oder der Einsatz von Datenbanken, spezielle Big Data Frameworks, Prozessoptimierung oder auch die Datenvorverarbeitung.

Data Science

Data Science ist ein “Konzept zur Vereinheitlichung von Statistik, Datenanalyse, maschinellem Lernen und den damit verbundenen Methoden”, um “tatsächliche Phänomene zu verstehen und zu analysieren” mit Daten. [2]](https://www.springer.com/de/book/9784431702085)

Data Engineering

Data Engineering befasst sich mit der Einrichtung und Nutzung von Werkzeugen, die für die Arbeit eines Data Sciencelers erforderlich sind. Dazu gehören zum Beispiel die Speicherung von Daten, Parallelverarbeitung und andere Dinge in Werkzeugen wie Hadoop, Spark und ähnlichen.

Erhöhte Einnahmen durch Daten

Daten werden immer wichtiger, aber immer noch bleiben 95% der Daten von Unternehmen ungenutzt. Sie könnten sich sagen: “Natürlich gibt es viele Möglichkeiten, die ich mit meinem Unternehmen verfolgen könnte, warum Daten? - aber eine Sache, die bei Daten nicht unterschätzt werden sollte, ist, dass es sich nicht nur um eine kleine Verbesserung Ihres Produkts handelt, das eine Umsatzsteigerung von 0,X % erzielt, sondern eher um einen Übergang Ihres Unternehmens in das datengesteuerte Zeitalter, mal X-ing Ihres Umsatzes.

Beispiel 1: Ford-Automobil

Schauen wir uns als Beispiel den Automobilkonzern Ford an. Im Jahr 2006 betrug ihr Jahresverlust 12,6 Milliarden USD. Danach wurde ein Data Scienceler hinzugezogen, um das Unternehmen in den nächsten drei Jahren zu einem datengesteuerten Unternehmen umzugestalten. Das Ergebnis waren 2,3 Millionen verkaufte Autos im Jahr 2009, und bis Ende des Jahres ist das Unternehmen im grünen Bereich.

E. McNulty, 5 Wege, wie ein Data Scienceler Ihrem Unternehmen einen Mehrwert hinzufügen kann (2014)](https://dataconomy.com/2014/11/5-ways-a-data-scientist-can-add-value-to-your-business/)

Beispiel 2: Verbesserungen in der Lieferkette

Das Timing der Supply-Chain-Ressourcen kann der entscheidende Faktor für einen Gewinn oder Verlust sein. Um die Fabrik bereit zu haben, wenn eine Lieferung eintrifft, oder um zu vermeiden, dass Mitarbeiter untätig sind, sind einige Faktoren, die mit Hilfe der Data Science optimiert werden können.

Die Pitt Ohio Freight Company nutzte die Data Science, um die Ankunft ihrer Fahrer mit einer Genauigkeitsrate von 99% zu schätzen, was ihre Kunden so sehr steigerte, dass sie durch wiederholte Bestellungen weitere 50.000 USD pro Jahr gewannen. (Quelle: Pitt Ohio Freight Company T. Capone, Wie die Data Science Ihrem Unternehmen helfen kann, mehr Einnahmen zu erzielen (2018)](https://conceptainc.com/blog/how-data-science-can-help-your-enterprise-generate-more-revenue/))

Beispiel 3: Programmatische Werbung

Durch die Nutzung der Informationen, die ein Unternehmen über zukünftige oder bestehende Kunden hat, können neue Einnahmequellen für bisher unentdeckte Zielgruppen oder eine bessere Ausrichtung der Werbeausgaben erschlossen werden. Herkömmliche Anzeigen haben eine schlechte Zielgruppenansprache, da alle Personen, die z.B. an einem Plakat vorbeifahren, die Anzeige sehen könnten oder auch nicht, egal ob sie passt oder nicht. Dies ist zum einen recht teuer, da Werbetafeln viel Geld kosten, und aufgrund der Tatsache, dass die durchschnittliche Person von Hunderten von Anzeigen pro Tag mit Spam-Mails überschwemmt wird, ist ihre Aufmerksamkeitsspanne heutzutage wirklich begrenzt. Was wäre, wenn wir unsere Anzeige einfach den Personen zeigen könnten, die am ehesten zu unseren Kunden gehören, und sie mit personalisierten Informationen ansprechen würden, die ihren Bedürfnissen entsprechen?

Dies ist das klassische Beispiel für das “Schießen mit einer Kanone auf einen Vogel”. Werbetafeln sind so, als würde man mit einer Kanone auf einen kleinen Spatz schießen, um ihn zu fangen. Ich meine, es funktioniert, aber es gibt auch viel Geld für Kanonen aus, könnte eine Menge anderer Tiere verletzen und ist ein enormer Aufwand. Warum nicht Köder verwenden, die speziell auf Spatzen zielen, um nur Spatzen zu fangen, und zwar präzise?

“The Economist”, ein etabliertes Print- und Online-Medium, nutzte programmatische Werbung, um potenzielle unsichere Leser dazu zu bewegen, endlich zu abonnieren. Ihre anfängliche Hoffnung war es, 650'000 neue Kunden zu gewinnen. Sie benutzten eine Kombination von Informationen, die sie bereits hatten, plus abgeleitete Informationen aus der Geolokalisierung, IP’s und verschiedene andere Informationen, um Anzeigen “gespiegelten Kunden” zu zeigen, d.h. potentiellen neuen Kunden, die den bestehenden ähnlich sind. Sie identifizierten ihre Hauptsegmente in ihren Publikationen, wie “Finanzen”, “Politik”, “Karriere” und andere, und produzierten passende Inhalte, die dann den segmentierten gespiegelten Kunden gezeigt wurden.

Die Ergebnisse dieser Kampagne waren erstaunlich. Das Ziel von 650'000 Kunden wurde 5 Mal gesetzt, mit 3,6 Millionen neuen Kunden. Ihr neu gewonnener Lebenszeitwert wird auf £11.970.000 (14,8 Millionen USD) geschätzt, was einem Return of Invest (ROI) von 10:1 entspricht. Darüber hinaus wurde das Bewusstsein für “The Economist” um fast 65% gesteigert.

[Quelle]

Werden Sie jetzt ein datengesteuertes Unternehmen

Kontaktieren Sie uns jetzt für eine kostenlose 15-minütige Beratung darüber, wie Sie Data Science in Ihrem Unternehmen anwenden können.

Eine Auswahl unserer Datendienste:

  • Daten-Seen
  • Datenanalyse / BI-Tools
  • Datenmigration
  • ETL (Extrahieren, Transformieren, Laden)
  • Datenstrategie-Beratung
  • Einrichtung der Datenumgebung (Spark, Hadoop, Jupyter Notebooks, …)
  • Serverlose Datenbanken (SQL, NoSQL, …)
  • Datenvisualisierung (2D, 3D, VR, AR)
  • Modell-Tuning
  • Data Warehouses, Data Marts, Datenpolitiken (HIPAA, GDPR, …)
Was ist ein Data Lake?

Datenseen sind für Ihre Big-Data-Landschaft unverzichtbar. Um alle Ihre Datenquellen, seien es SQL-Datenbanken, Bilder, Textdaten, E-Mail, SAP und andere, zu zentralisieren, muss eine Zwischenschicht zwischen Ihrem Data Science Team und den Daten selbst eingerichtet werden.
Diese Schicht verwaltet die Kommunikation zwischen diesen verschiedenen Datenstrukturen, die Zugriffskontrolle (wer darf worauf zugreifen), die Lifetime-Policies (wie lange werden Daten gespeichert, Datenkataloge) und die Sicherheit dieser Interaktionen (Protokollierung des Zugriffs, Sicherheitsmaßnahmen, zeitlich begrenzter Zugriff, …).
Das Ziel ist es, grundsätzlich ein “Front-End” für alle Ihre Datenbedürfnisse zu etablieren. Die Mitarbeiter werden nur auf die Daten zugreifen können, zu denen sie berechtigt sind, wobei der Zugriff bei Bedarf für die Forensik protokolliert wird, und können sie in ihre Datenanalyse-Tools “laden”. Ein zentralisierter gibt sowohl einen Überblick über die vorhandenen Daten und vermeidet den Aufbau mehrerer Datensilos” oder unnötiger Duplikate in Ihrem Unternehmen.

Was ist Datentechnik?

Data Scienceler sollten sich auf ihre datenanalytischen Prozesse konzentrieren. Aber angesichts des 80/20-Dilemmas der Data Science verbringen Data Scienceler 80% ihrer Zeit mit der Datenvorbereitung, anstatt ihre Algorithmen anzuwenden (https://www.infoworld.com/article/3228245/the-80-20-data-science-dilemma.html). Wenn Jupyterhub & andere Tools korrekt auf einem Datensee eingerichtet werden, kann diese Zeit drastisch reduziert werden, was die Verwendung der richtigen Tools, die Reduzierung der Latenzzeit und die Verwendung der richtigen Speicherversion für den passenden Anwendungsfall einschließt.

Was ist ETL / Datenverarbeitung?

Ein weiterer zeitaufwendiger Schritt in der Data Science ist es, die Daten in ihrer Rohform (z.B. SQL-Daten) zu nehmen und sie in eine Form vorzubereiten, die sie nutzbar macht. Dies wird als ETL bezeichnet, was die Abkürzung für Extrahieren, Transformieren, Laden ist. Ein gutes grosses Datensystem automatisiert diese Schritte so gut wie möglich, z.B. dass zur Vorbereitung der Daten für die Data Scienceler am Morgen riesige cloudgesteuerte Maschinen in der Nacht hochfahren, die Rohdaten nehmen, sie aufbereiten und speichern, damit sie am Morgen analysiert werden können.

Was sind serverlose Datenbanken?

SQL-Datenbanken können schwierig zu verwalten sein. Außerdem setzen viele Unternehmen keine effektiven Backup-Lösungen für den Fall eines Serverausfalls ein. Mehr als oft können unerwartete Verkehrsspitzen ein Produkt zum Absturz bringen, da klassische SQL-Server nicht mit der benötigten Nachfrage skalieren. Dies lässt sich durch den Einsatz von Cloud- oder Hybrid-Cloud-Szenarien (vor Ort und in der Cloud) leicht vermeiden.

Was sind Speed-First-Websites?

Unser Fokus bei der Erstellung von Websites liegt auf Geschwindigkeit. Die BBC berichtete, dass 10 % der Kunden für jede Sekunde, die ihre Website zum Laden braucht, verloren gehen.
https://www.creativebloq.com/features/how-the-bbc-builds-websites-that-scale
Darüber hinaus verlassen 53% der mobilen Nutzer die Website, wenn der Ladevorgang länger als 3 Sekunden dauert (https://www.marketingdive.com/news/google-53-of-mobile-users-abandon-sites-that-take-over-3-seconds-to-load/426070/).
Natürlich sind auch das Aussehen und das Design einer Website wichtig, aber in den letzten Jahren ist das Aussehen wichtiger geworden als die Ladezeiten. Das Problem ist, dass, wenn die Website langsam lädt, der Benutzer Ihre Website nicht einmal sehen wird. Daher ist es von größter Wichtigkeit, Websites zu beschleunigen, da sie nicht nur von den Kunden bevorzugt werden, sondern auch bei Google-Suchen einen höheren Rang einnehmen. Wir können dies durch den Einsatz verschiedener serverloser Architekturen, Inhaltsbereitstellungssysteme und spezieller Einstellungen zur Beschleunigung der Inhaltsbereitstellung erreichen.

Sie haben eine ähnliche Idee oder wir haben Ihr Interesse geweckt? Kontaktieren Sie uns jetzt für eine gratis 15-minütige Beratung!