Woodmark Blog
Apache Spark vs. Apache Flink
Apache Flink, das hochleistungsfähige Big-Data-Stream-Processing-Framework, erreicht einen ersten Reifegrad. Im Vergleich mit Apache Spark handelt es sich um eine konkurrenzfähige Technologie, die als Echtzeit-Analyse-Framework zu empfehlen ist.
Big Data Governance live: Apache Atlas im Praxistest
Big Data Governance Big Data Governance ist in aller Munde. Welches größere Unternehmen möchte heute noch öffentlich kundtun auf dieses Zukunftsthema bewusst zu verzichten? Politische Diskussionsforen und Wissenschaftler laden dazu ein, die „gesellschaftliche Dimension von…
mehr erfahren Big Data Governance live:
Apache Atlas im Praxistest
Markt- und Standortanalysen in Tableau
Dieser Blogbeitrag zu Markt- und Standortanalysen mit Tableau beschäftigt sich mit der klassischen unternehmerischen Fragestellung der Standortwahl eines Unternehmens. Dazu stellen wir im Folgenden einen fiktiven Business Case zur Markt- und Standortanalyse in Berlin aus…
Apache Tika OCR zum Parsen von Text in Bilddateien oder eingebetteten Bildern PDFs
Das Parsen und Standardisieren von Inhalten aus unterschiedlichen Quellen und Dateitypen ist eine der Hauptanforderungen, um z. B. Inhalte durchsuchbar zu machen. So haben zum Beispiel Dateien aus gemeinsam genutzten Ressourcen selten gemeinsame Kodierungen...
Konfigurierung benutzerdefinierter Apache-NiFi-Prozessoren mit Hilfe von @OnScheduled-Annotation
Benutzerdefinierte Apache-NiFi-Prozessoren konfigurierbar machen: Obwohl Apache NiFi verschiedene Out-of-the-Box-Prozessoren zum Routen, Lesen oder Transformieren von Inhalten von Flowfiles bietet, stehen Entwickler immer wieder vor Situationen, in denen die verfügbaren Prozessoren nicht ausreichen, um komplexe...