Alle 14 Tage aktuelle News aus der IT-Szene   >   
KPMG Österreich tritt SAP-PartnerEdge-Programm bei 27. 03. 2024
Dem Beratungshaus stehen im Rahmen der neuen Kooperation zahlreiche Tools für die digitale Geschäftstransformation zur Verfügung.
SAP und NVIDIA intensivieren Partnerschaft 20. 03. 2024
Die beiden Tech-Player wollen mit ihrer neuen Kooperation den Einsatz generativer KI in Unternehmensanwendungen vorantreiben.
IT Security made in Austria 13. 03. 2024
Medialine partnert mit dem österreichischen Hersteller von „Quantum safe“ Speicherlösungen fragmentiX.
Neue Funktionen für SAP Datasphere 07. 03. 2024
Frische Features für SAP Datasphere und eine neue Unternehmenspartnerschaft helfen Unternehmen beim produktiven und sicheren Umgang mit Geschäftsdaten.
KI-Transformation: Effizienzsteigerung statt Innovation im Mittelpunkt 06. 03. 2024
Laut einer aktuellen Befragung hat die Mehrheit der Unternehmen noch keine KI-Strategie.
Nagarro fördert Digitalisierungsideen 19. 02. 2024
Nagarro sucht erneut innovative Ideen zu digitalen Geschäftsmodellen, Produkten und Services. Als Gewinn winkt ein Realitätscheck durch Expert:innen im Wert von 50.000 Euro.
Einfacher Weg zur Cloud-First-Strategie 12. 02. 2024
SAP präsentiert neue Möglichkeiten für Migration und Modernisierung von Softwaresystemen.
Dätwyler IT Infra übernimmt Seabix 18. 12. 2023
Der IT-Infrastruktur-Anbieter holt sich eine intelligente Kommunikationslösung ins Portfolio.
Bechtle konsolidiert Geschäft in Österreich 18. 12. 2023
Die beiden österreichischen Unternehmen der Bechtle-Gruppe gehen ab 2024 gemeinsame Wege.
hosttech launcht Kl-gestützte Domainsuche 15. 12. 2023
Der Internet Service Provider lanciert mit Domain GPT eine eigens entwickelte Kl-gestützte Domainsuche.
BOLL übernimmt Distribution von WALLIX in Österreich 15. 12. 2023
Der Security-VAD nimmt die Privileged-Access-Management(PAM)-Lösung des französischen Softwareanbieter ins Programm für Österreich.
vshosting expandiert nach DACH 14. 12. 2023
Der europäische Business Cloud Provider bietet seine Dienstleistungen nun auch im deutschsprachigen Raum an.
BestRecruiters 2023: BEKO holt Gold 01. 12. 2023
Der österreichische Technologiedienstleister sichert sich den Sieg in der Kategorie „Arbeitskräfteüberlassung“.
Trusted Access Client: Rundum-Schutz fürs Netzwerk 30. 11. 2023
Mit der Cloud-managed Remote Network Access-Lösung sorgt LANCOM für Sicherheit beim hybriden Arbeiten.
BOLL schließt Distributionsverträge mit Tenable und ALE 30. 11. 2023
Der DACH-IT-Security-VAD BOLL Engineering ist ab sofort Distributor für die Lösungen von Tenable in Österreich und in der Schweiz sowie ab 2024 für Alcatel-Lucent Enterprise in Österreich.
SVS setzt auf SuccessFactors 29. 11. 2023
Die HR-Lösung aus dem Hause SAP sorgt bei der SVS für Datentransparenz und eine aktive Einbindung der Belegschaft in die Geschäftsprozesse.
Trend Micro zeigt KI-gestützten Cybersecurity-Assistenten 28. 11. 2023
Der Companion unterstützt Analysten, um die Erkennung von und Reaktion auf Bedrohungen zu beschleunigen.
Nagarro bringt neue KI-Plattformen auf den Markt 23. 11. 2023
Genome AI, Ginger AI und Forecastra AI ermöglichen einen schnellen Einstieg in die KI-Welt.
weiter
The unbelievable Machine Company

Mit Data Science auf Gaunerjagd

Big Data-Experte ortet enormes Potenzial in der Auswertung der Panama Papers.

Foto: um Christian Nietner, Data Scientist bei *um: „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug“ Die „Panama Papers“ sind das größte Datenleak der Mediengeschichte. Ihre Veröffentlichung bringt eine unglaubliche Zahl von Korruptions-, Steuer- und anderen Delikten bis zum Bruch von UN-Sanktionen zutage. Die Arbeit des Recherchenetzwerks wird deshalb zu Recht als Glanzleistung des Enthüllungsjournalismus gefeiert. Doch wurden möglicherweise noch nicht alle Möglichkeiten genutzt, um in kurzer Zeit noch mehr verborgene Zusammenhänge zu finden. „Die Sternstunde von Datenjournalismus und Data Science steht noch aus“, meint Christian Nietner vom Big-Data-Spezialisten The unbelievable Machine Company (*um). Er erläutert, wie effektiver recherchiert und analysiert werden könnte, um neue Erkenntnisse aus den Daten zu gewinnen.

Optimierungspotential.

Bei den Panama Papers hat die Süddeutsche Zeitung gemeinsam mit einem Netzwerk von 400 Journalisten aus über 100 Medienorganisationen und 80 verschiedenen Nationen mehr als ein Jahr recherchiert sowie die Daten analysiert und ausgewertet – teils mit technischer Unterstützung, aber auch manuell. Aus Data-Science-Sicht besteht hier ein hohes Optimierungspotenzial bei der Automatisierung und Qualität der Auswertung. „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug. Sie verschenkt viele Möglichkeiten“, so Nietner. „Die Aufdeckung der Panama Papers ist beispiellos und könnte ein exzellentes Beispiel für wirksam angewandte Data Science sein, die auch die Zusammenführung und Verarbeitung unstrukturierter Daten, wie Emails, PDFs und Grafiken ermöglicht und damit zu wesentlich besseren Endergebnisse führen könnte“.

Beschleunigte Recherche.

Der Big-Data-Spezialist hat die Berichterstattung zu den Panama Papers aus Data-Science-Perspektive betrachtet und sich selbst die Frage gestellt, was mithilfe der aktuell verfügbaren Datentechnologien bei der Analyse und Auswertung dieser riesigen Datenmenge schneller und effektiver gemacht werden könnte. Anstatt jeden Ordner einzeln zu durchsuchen, empfiehlt sich beispielsweise der Einsatz einer hochgradig skalierbaren und konfigurierbaren Volltextsuchmaschine, die sowohl strukturierte als auch unstrukturierte Textdaten in einem gemeinsamen Datenpool konsolidieren kann. „Die automatisierte Auswertung von Bilddaten kann mittels tiefer neuronaler Netze erfolgen, wahlweise in Kombination mit Machine-Learning-Algorithmen für die Verarbeitung natürlicher Sprache. Die so gewonnenen Daten können anschließend dem Datenpool hinzugefügt werden. Statt vieler einzelner Dokumente, die über hunderte Ordner verteilt sind, erhält man auf diese Weise einen einzigen, effizient durchsuchbaren Datenpool aller Dokumente“, erklärt Nietner.

Zusammenhänge und Muster erkennen.

Ein wesentlicher Teil der Auswertung besteht nicht alleine in der Konsolidierung der Daten, sondern im Aufdecken und Validieren von unbekannten und nicht offensichtlichen Mustern und Zusammenhängen in den Informationen. Gerade hier leistet die Data Science einen enormen Mehrwert. „Ganz konkret könnten etwa Algorithmen zur Named Entity Recognition (NER) verwendet werden, die drauf trainiert sind, einen Fließtext automatisiert auf Eigennamen von Personen, Orten, Organisationen oder auch Zeitangaben zu durchsuchen“, so Nietner.
it&t business medien OG
Tel.: +43/1/369 80 67-0
office@ittbusiness.at