Alle 14 Tage aktuelle News aus der IT-Szene   >   
Konica Minolta-Studie zeigt Stand der digitalen Transformation in europäischen Unternehmen 16. 05. 2022
Umfrage enthüllt Herausforderungen und zeigt, wie Outsourcing die Digitalisierung fördern kann.
IBM transformiert Betriebsabläufe mit RISE with SAP 12. 05. 2022
Der IT-Konzern migriert mit Hilfe des Digitalisierungsansatzes von SAP mehr als 375 TB Daten in die Cloud.
Phios expandiert nach Österreich 11. 05. 2022
Stefan Vögel wird Geschäftsführer der Wiener Niederlassung.
Digital Impuls Awards 22 für Brantner und Nagarro 10. 05. 2022
Die Auszeichnung prämierte die besten Innovations- und Transformationsprojekten aus mehr als 140 Einreichungen.
Data Governance mit Fokus auf den Menschen 09. 05. 2022
Die Österreichischen Data Governance Konferenz der ADV stellte auch heuer wieder das „Öl des 21.Jahrhunderts“ in den Fokus.
Integration als Schlüssel zum Erfolg 06. 05. 2022
Die neue Version der Business-Software geht den Weg zu einer gemeinsamen Technologieplattform für die schnelle Anwendungsintegration.
CIS bietet TISAX-Level-2-Assessments an 05. 05. 2022
Vermehrte Ransomware-Attacken in der Automotive-Branche: Neues Assessment zum Schutz der Informationssicherheit.
Das harte Rennen um die besten Spezialisten 04. 05. 2022
Die Nachfrage nach qualifiziertem Personal steigt quer durch die Branchenlandschaft.
Nachhaltiges Wachstum mit Ingram Micro Cloud 03. 05. 2022
Der Distributor pflanzt für eine bestimmte Anzahl an verkauften Cloud-Seats einen Baum.
Töchtertag bringt Mädchen in die Technikbranche 02. 05. 2022
Beim Wiener Softwarehaus MP2 IT-Solutions blickte die 15-jährige Schülerin Mariola Vorkapic den IT-Expertinnen und -Experten über die Schulter.
Magenta Business launcht neues Mobile Voice-Portfolio für Unternehmen 29. 04. 2022
Wegfall von Servicepauschale und Aktivierungsgebühr, freie Wahl bei der Mindestvertragsdauer, 5G in allen Smartphone-Tarifen und eine SIM-Only-Option sind wesentliche Vorteile.
Atlassian-Experten gehen künftig gemeinsame Wege 28. 04. 2022
Durch den Zusammenschluss der Timetoact Group und des Atlassian Platinum Solution-Partners catworkx entsteht einer der größten Atlassian-Partner in der DACH-Region.
Trend Micro zeigt umfassende Security-Plattform 27. 04. 2022
Trend Micro One bietet Ökosystem aus eigenen Produkten und Drittanbieter-Integrationen.
Ingram Micro und Lenovo bauen Kooperation aus 26. 04. 2022
Ingram Micro wird exklusiver Lenovo 360-Distributor in Österreich
Hornetsecurity wird neuer Partner von Infinigate Österreich 20. 04. 2022
VAD erweitert sein Portfolio für den MSP-Markt in der gesamten DACH-Region.
Smarte Cloud-Kommunikation 19. 04. 2022
UC-Suite Cloudya Meet & Share mit Videokonferenzen ab sofort verfügbar.
Wieder live und in Farbe 14. 04. 2022
ELO verzeichnet rund 800 Teilnehmer bei seiner wieder als Präsenzveranstaltung abgehaltenen Kunden- und Partnertagung.
adesso gründet Landesgesellschaften in Schweden und Dänemark 13. 04. 2022
Akquisition des schwedischen IT-Unternehmens Purple Scout ist Basis für die neuen Niederlassungen.
weiter
Serie "Cloud Computing im Fokus"

Data Lake oder doch Haus am See

Gastbeitrag: Nur durch die Nutzung der Daten entsteht Wert; die IT ist gefordert, gut integrierte Technologien auf einer verwalteten Plattform bereitzustellen, sodass sich Mitarbeiter auf wertsteigernde Aufgaben konzentrieren können, fordert Andreas Juffinger.

Foto: AWS Der Autor Andreas Juffinger ist Senior Solutions Architect bei AWS

IDC und Forrester haben Untersuchungen veröffentlicht, in denen gezeigt wurde, dass Firmen, die mehr Daten nutzen, also datengetriebene Organisationen (DgO), schneller als der Mitbewerb wachsen. Richard Joyce, Senior Analyst bei Forrester schreibt, dass durch die Bereitstellung von 10 Prozent mehr Daten ein typisches Fortune 1000 Unternehmen über 50M Euro zusätzlichen Gewinn erreichen kann. Wie kann man das erreichen und eine DgO werden?

Erstens, ein DgO betrachtet Daten als einen Unternehmenswert und nicht als Eigentum von Abteilungen oder Geschäftszweigen. Der übliche Vergleich von Daten mit Öl steht der Demokratisierung der Daten im Weg, da dieses Bild die einzigartige Eigenschaft vom Betriebsmittel Daten verschleiert - man kann Daten weitergeben und sie trotzdem noch uneingeschränkt nutzen, sie verbrauchen sich nicht sondern je mehr man Daten nutzt, desto mehr hat man davon. Zweitens werden in DgO die gesammelten Daten im Bereich Analytics, Maschinelles Lernen und somit in Entscheidungsprozessen tatsächlich genutzt und nicht nur gesammelt. Aus den Daten werden komplexe Modelle, Abstraktionen oder Wahrscheinlichkeiten abgeleitet, die im Entscheidungsprozess unterstützen. Drittens ist in einer DgO sichergestellt, dass Daten im Unternehmen jederzeit einfach und sicher verfügbar sind, dafür braucht es eine entsprechende Daten- und Analyse-Plattform. 

Data Warehouse und Data Lake

Viele Jahre lang war das Data Warehouse (DWH), eine für Analyse und Reporting optimierte zentrale Datenbank, der einzige Ansatz, eine solche Daten-Infrastruktur bereitzustellen. Ein DWH erfordert hohe Investitionen und ist primär für strukturierte Daten geeignet. Ein wesentlicher Teil der Daten im Unternehmen, die semi- und unstrukturierten Daten, bleiben somit aber unberücksichtigt. Big Data Plattformen erlauben es nun, strukturierte, semi- und unstrukturierte Daten wie Textdokumente und Bilder in einem sogenannten Data Lake, abzulegen. Der Data Lake wird somit das zentrale Repository für alle Daten, daher muss ein Data Lake es erlauben, Daten in beliebiger Skalierbarkeit zu speichern. Data Lakes basierend auf On-Premis Hadoop Ökosystemen sind sehr herausfordernd, benötigen hyper-spezialisierte Data Engineers und sind oft zu reinen Daten-Senken verkommen. Vor Jahren als das Allheilmittel angesehen, werden Data Lakes mittlerweile auch im Hype Cycle für Analytics und Business Intelligenz von Gartner im Tal der Ernüchterung positioniert

Beide Generationen von Daten- und Analyse-Plattformen haben die Erwartungen vieler Unternehmen an eine agile und kosteneffiziente Dateninfrastruktur nicht erfüllt. IT-Abteilungen einer DgO sind gefordert, Fähigkeiten eines Data Lake, Maschinelles Lernen erfordert Rohdaten mit höchster Granularität, aber auch DWH, schnelle, komplexe Abfragen brauchen aggregierte Daten, bereitzustellen und aus den Fehlern der Vergangenheit zu lernen. Ein einheitlicher Ansatz führt letztendlich immer zu Kompromissen, der nur einen Teil der Business-Anforderungen abdecken kann. 

Foto: AWS Amazons Lake-Haus Ansatz beschreibt die nahtlose Integration eines Data Lakes auf einer Plattform Der Lake-Haus Ansatz

Amazons Lake-Haus Ansatz beschreibt nun die nahtlose Integration eines Data Lakes basierend auf Amazon Simple Storage Service (Amazon S3), einem Data Warehouse (Amazon Redshift) aber auch Maschinelles Lernen mit Amazon SageMaker auf einer Plattform. Eine einheitliche Governance, ein Datenkatalog und voll integrierte ETL Dienste, wie AWS Glue, runden den Ansatz ab. Explorative Analytics wird mit Amazon Athena, dem interaktiven Abfragedienst, der die Analyse von Daten im S3 Data Lake mit Standard-SQL erlaubt, unterstützt. 

Dieser Ansatz erlaubt nun die Datenbereitstellung für unterschiedliche Personas und Anwendungsfälle. Ein Data Scientist hat kann die Rohdaten in höchster Granularität nutzen, um damit Maschinelles Lernen zu betreiben. Data Engineers bereiten die Daten im Data Lake für Line of Business (LoB) Personas noch weiter auf und bereinigen, normalisieren diese zu den Level 2 oder aufbereiteten Daten. Wenn für Reporting komplexe Abfragen mit kurzen Antwortzeiten benötigt werden, können die Daten auch auf Level 3 oder als Strukturierte Daten ins DWH geladen werden. Ein LoB Nutzer kann nun die vorbereiteten Reports nutzen, aber auch mittels interaktiven Abfragen auf die aufbereiteten Daten oder Rohdaten zugreifen und der Data Lake wird somit zur zentralen Datendrehscheibe.

Der Lake-Haus-Ansatz erlaubt es nun, die unterschiedlichen Technologien gezielt einzusetzen, um Geschäftsanforderungen optimal zu erfüllen. Auch wenn ein solcher Ansatz im eigenen Rechenzentrum denkbar wäre, profitieren Organisationen hier von Cloud-Anbietern. Sie stellen nicht nur eine große Fülle von neuesten Technologien bereit, sondern Kunden können diese Technologien auch ganz in Abhängigkeit ihres jeweiligen Bedarfs nutzen, skalieren und auch wieder abstellen. Dabei fallen Vorabinvestitionen, wie sie beispielsweise im eigenen Rechenzentrum nötig sind, weg, denn bezahlt wird nach Verbrauch. Zudem können wertvolle IT-Ressourcen umverteilt werden, sodass sich IT-Spezialisten beispielsweise darum kümmern können, neue Innovationen voranzutreiben, statt sich um die Instandhaltung von Servern zu kümmern.  Die technologischen Voraussetzungen um den Wandel zu einer datengetriebenen Organisation voranzutreiben, ob Großunternehmen oder Start-up,  sind vorhanden, nun gilt es die ersten Schritte zu tun, um Silos aufzubrechen und vorhandene Daten im Unternehmen zu nutzen.

Dieser Artikel ist Teil unserer Serie "Cloud Computing im Fokus", die in den kommenden Wochen jeden Freitag auf www.ittbusiness.at erscheint. 

it&t business medien OG
Tel.: +43/1/369 80 67-0
office@ittbusiness.at
Wir verwenden Cookies, um Ihnen den bestmöglichen Service anbieten zu können. Wenn Sie auf der Seite weitersurfen, stimmen Sie der Cookie-Nutzung zu.
OK