Alle 14 Tage aktuelle News aus der IT-Szene >
Gastbeitrag: Zeitreihen spielen zunehmend eine wichtige Rolle für viele datengestützte Entscheidungen und Aktionen besonders im digital transformierten Unternehmen. Sie entstehen im Bereich von Telemetriedaten in der Produktion, Bedarfszahlen in der Lieferkette, als Metriken im IT-Betrieb und als Clickstream im Webshop. Zeitreihen werden im datengetriebenen Unternehmen genutzt, um Trends zu erkennen und schneller bessere Entscheidungen zu treffen. Von Andreas Juffinger.
Foto: AWS Der Autor Andreas Juffinger ist Senior Solutions Architect bei Amazon Web Services (AWS) Datengetriebene Unternehmen setzen Daten ein, um einerseits ihre betriebliche Effizienz und andererseits ihre Produkt- und Servicequalität zu erhöhen. Vor allem helfen Zeitreihen dabei, schnellere und bessere Entscheidungen zu treffen und neue Trends früher zu erkennen. Traditionell wurden Geschäfts-, Produktions- und Vertriebskennzahlen in relationalen oder analytischen Datenbanken verarbeitet, diese Technologien stoßen bei großen Datenmengen aus dem Bereich Telemetrie, IT Operations und Clickstream nicht nur an ihre technischen Grenzen, sondern auch and die Grenzen der Wirtschaftlichkeit. Aufgrund ihrer Funktionsweise eignen sich relationale Datenbanken nur bedingt für die Verwaltung von flexiblen Daten, sie setzen ein starres Datenmodell voraus, zudem sind sie komplex und teuer in der Skalierung. In einer sich stetig verändernden Welt mit großen Datenmengen sind diese Systeme daher nicht mehr optimal. Gibt es Alternativen?
NoSQL Datenbanken sind eine solche Alternative, da insbesondere Zweckgebundene NoSQL Datenbanken wie Amazon Timestream und Amazon DynamoDB bei Skalierung und dynamischen Datenmodellen ansetzen. Als eventuell konsistente Datenbanken skalieren sie sehr kosteneffizient. Eventuelle Konsistenz bedeutet dabei, dass in einem sehr beschränkten Zeitraum Konsistenz nicht garantiert ist, Datenpunkte die quasi gleichzeitig mit der Abfrage geschrieben werden, werden nur eventuell berücksichtigt, alle älteren Daten werden aber konsistent mit einbezogen. Für analytische Zwecke und Zeitreihenanalyse im nicht Real-Time Bereich stellt diese Unschärfe aber kein Problem dar. Des Weiteren sind die zwei genannten Systeme in Bezug auf das Datenmodell sehr flexibel und erlauben, dass komplett unterschiedlich Datensätze ohne Anpassungen in einer Tabelle gespeichert werden können.
Aufgrund ihrer Flexibilität und Skalierbarkeit sind NoSQL Datenbanken mittlerweile weit verbreitet und Firmen wie TrendMiner, Software AG's Industry 4.0 Platform und CleanAir im Bereich von Luftqualitätsmessung, setzen erfolgreich auf diese Technologien [3]. Zweckgebunden Datenbanken sind so gebaut, dass sie für eine spezielle Klasse von Problemen wesentlich kosteneffizienter betrieben werden können. Amazon Timestream kann zum Beispiel Terabytes an Zeitreihen Daten verarbeiten und Kunden wie D2L, ein global führendes Unternehmen in der Bildungstechnologie, spricht von mehr als 80 Prozent Kostenersparnis im Vergleich mit relationalen Datenbanken.
Während schon seit Jahren 74 Prozent aller Unternehmen gerne datengetrieben wären, sagen laut einer Forrester-Studie nur 29 Prozent, dass sie gut darin sind, die Daten zu analysieren und Aktionen daraus abzuleiten. Zweckgebundene NoSQL Datenbanken erlauben es, dabei kosteneffizient mit den sich ständig ändernden Daten des digitalen Unternehmens umzugehen und diese Daten nutzbar zu machen. Moderne Daten-Architekturen, oder auch Lakehouse-Architekturen, sehen daher die Integration von unterschiedlichen zweckgebundenern Datenbanken und Analysewerkzeugen sowie die Nutzung von maschinellem Lernen vor. Der zuverlässige Betrieb von unterschiedlichen Datenbanken ist jedoch kompliziert, aufwendig und teuer. Amazon Web Services stellt die oben genannten NoSQL Datenbanken als serverlose und verwaltete Dienste bereit, der Kunde muss sich weder um Hardware, Installation, Wartung, Skalierung oder Verfügbarkeit kümmern und kann sich so auf die Anwendungsentwicklung konzentrieren. Zweckgebundene NoSQL Datenbanken können heute also von allen Unternehmen genutzt werden, um Zeitreihen im großen Stil zu verarbeiten und somit die Grundlage für schnellere und bessere Entscheidungen zu schaffen.
Dieser Beitrag ist der vierte Teil unserer AWS-Serie zum Thema Digitalisierung. Die vorigen Beiträge lesen Sie hier: