Woodmark Blog
Apache Camel for Batching AWS Kinesis Records
In unserem aktuellen Woodmark-Blogbeitrag erfahren Sie, wie Sie eine benutzerdefinierte Komponente für das nachrichtenbasierte Enterprise-Integrations-Framework Apache Camel entwickeln, um Daten im Batch an den AWS Kinesis Endpoint zu senden.
Performance critical Spark
Performance: Ist Apache Spark schnell genug? Die Abfrageperformance kann oft geschäftskritische Ausmaße annehmen – deshalb rückt sie häufig nach der PoC-Phase eines Projekts in den Mittelpunkt. Gerade bei Big-Data-Lösungen ist der Unterschied zwischen einem funktionalen…
Big Data Governance live: Apache Atlas im Praxistest
Big Data Governance Big Data Governance ist in aller Munde. Welches größere Unternehmen möchte heute noch öffentlich kundtun auf dieses Zukunftsthema bewusst zu verzichten? Politische Diskussionsforen und Wissenschaftler laden dazu ein, die „gesellschaftliche Dimension von…
mehr erfahren Big Data Governance live:
Apache Atlas im Praxistest
Apache Tika OCR zum Parsen von Text in Bilddateien oder eingebetteten Bildern PDFs
Das Parsen und Standardisieren von Inhalten aus unterschiedlichen Quellen und Dateitypen ist eine der Hauptanforderungen, um z. B. Inhalte durchsuchbar zu machen. So haben zum Beispiel Dateien aus gemeinsam genutzten Ressourcen selten gemeinsame Kodierungen...