Leo Brunnick, Chief Product Officer bei Cloudera (Quelle: Cloudera)
Cloudera treibt mit REST Catalog die Innovation von Iceberg voran für Zero-Copy-Datenaustausch und einheitliche Metadaten-Intelligenz
Cloudera, das einzige Unternehmen, das künstliche Intelligenz (KI) für Daten überall verfügbar macht, kündigt Updates für seine Unified Plattform an. Beide Neuheiten, sowohl für Cloudera Iceberg REST Catalog als auch Cloudera Lakehouse Optimizer, unterstreichen das Engagement des Unternehmens, das beste offene Data Lakehouse auf Basis von Iceberg anzubieten. Nun stellt Iceberg REST Catalog die offene Interoperabilität bereit, die für einen nahtlosen Datenaustausch erforderlich ist. Lakehouse Optimizer trägt dazu bei, dass die Daten für alle Engines, die auf die Daten zugreifen, stets optimiert und kostengünstig sind – alles unter der einheitlichen Governance und Sicherheit von Cloudera.
Unternehmen, die das Potenzial von KI und Analytik voll ausschöpfen möchten, stehen vor erheblichen Hindernissen: komplexe Datenarchitekturen, isolierte Plattformen und uneinheitliche Governance. Der Transfer von Daten zwischen Systemen für Analysezwecke oder KI-Training erhöht Kosten, birgt Sicherheitsrisiken und verzögert die Erkenntnisgewinnung. Moderne Unternehmen benötigen offene, sichere und interoperable Datenarchitekturen, die Daten überall für KI und Multi-Engine-Analysen unterstützen, ohne Daten duplizieren zu müssen oder von einem bestimmten Anbieter abhängig zu sein.
Cloudera Iceberg REST Catalog – geringere Gesamtbetriebskosten und schnellere Amortisierung
Cloudera ist der erste und einzige Anbieter, der den Iceberg REST Catalog in eine Daten- und KI-Plattform für den gesamten Lebenszyklus integriert. Das schafft den Rahmen für eine sichere Datenfreigabe ohne Kopieren sowie eine einheitliche Governance in jeder Cloud und jedem Rechenzentrum. Dadurch können Engines von Drittanbietern direkt auf die von Cloudera verwalteten Daten zugreifen und eine konsistente Durchsetzung von Richtlinien und Metadaten-Intelligenz in Public Clouds, Rechenzentren und am Edge gewährleisten. Durch die Erweiterung der Leistungsfähigkeit von Apache Iceberg um REST-basierten Zugriff können Unternehmen ihre Datenstrategien zukunftssicher gestalten und gleichzeitig Kontrolle, Transparenz und Compliance bewahren.
Durch diese Updates profitieren alle Cloudera-Kunden auf Iceberg von einer nahtlosen Zero-Copy-Interoperabilität im gesamten Ökosystem. Dies erlaubt die Verbindungen zu führenden Analyse- und KI-Engines wie Snowflake, Databricks, AWS Athena, AWS EMR und Salesforce – mit vollständiger ACID-Konformität und einheitlichen Zugriffsrichtlinien. Darüber hinaus profitieren Kunden nun von Governance auf Unternehmensniveau, die detaillierte Zugriffskontrollen, Herkunftsnachverfolgung und Audits auf Tools von Drittanbietern über Clouderas Shared Data Experience (SDX) ausweitet und so eine sichere Demokratisierung der Daten und Compliance in großem Maßstab gewährleistet. Zudem erhalten sie offenen Zugriff auf Metadaten, wodurch Datenbestände sofort auffindbar sind, ohne an proprietäre Kataloge gebunden zu sein. Dies beschleunigt die KI-Entwicklung und Business Intelligence (BI) durch eine konsistente Quelle wahrheitsgetreuer Erkenntnisse. Schließlich sorgen diese Verbesserungen für niedrigere Gesamtbetriebskosten und eine schnellere Amortisierung: Kunden berichten von einer Reduzierung der Datenspeicherkosten um bis zu 79 Prozent bei gleichzeitiger verbesserter Transparenz über alle Geschäftsbereiche hinweg. Ein großer globaler Satellitenkunde konnte beispielsweise diese Einsparungen erzielen und gleichzeitig seine KI-Datenpipelines stärken.
Cloudera Lakehouse Optimizer – Steigerung der Abfrageleistung und Senkung der Speicherkosten
Der Cloudera Lakehouse Optimizer ist ein neuer, intelligenter Dienst, der automatisierte Optimierungen und Tabellenwartung für Apache Iceberg innerhalb des Lakehouse von Cloudera bereitstellt. Er bietet fortschrittliche und intelligente Funktionen, die über grundlegende Tabellenwartung hinausgehen, darunter Aufgaben wie das Neuschreiben von Manifest- und Positionslöschdateien. Indem Tabellen intelligent optimiert werden, entfallen manuelle Datenverwaltungsaufgaben und Betriebskosten, sodass sich Kunden auf Erkenntnisgewinnung aus ihren Daten konzentrieren können. Es handelt sich um eine offene Lösung, die für jede Iceberg-kompatible Engine in jeder Public Cloud geeignet ist. Die einzigartige Benutzeroberfläche, die eine detaillierte Definition und Änderung von Richtlinien erlaubt, bietet eine unternehmensgerechte Beobachtung und Kontrolle. Richtlinien können auf eine bestimmte Tabelle oder einen gesamten Katalog angewendet werden. Dieser Dienst wird in der kommenden Version der einzige seiner Art sein, der On-Premises verfügbar ist. Interne Benchmarks zeigen, dass dieser Service die Abfrageleistung um das bis zu Dreizehnfache steigert und die Speicherkosten um 36 Prozent senkt.
„Cloudera ist Vorreiter der Big-Data-Branche und nach wie vor ein führender Plattformanbieter, der weiterhin in die Unternehmensreife des offenen Tabellenformats Apache Iceberg investiert“, sagte Leo Brunnick, Chief Product Officer bei Cloudera. „Mit dieser Ankündigung halten wir unser Versprechen von Flexibilität, Skalierbarkeit und kompromisslosen Einblicken, wann und wo Unternehmen diese am dringendsten benötigen. Dieses Engagement ist der Grund, warum die weltweit größten Organisationen auf Cloudera vertrauen, um KI in ihre Daten zu integrieren – unabhängig davon, wo diese gespeichert sind.“
Disclaimer:
„Für den oben stehenden Beitrag sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Nutzer verantwortlich. Eine inhaltliche Kontrolle des Beitrags seitens der Seitenbetreiberin erfolgt weder vor noch nach der Veröffentlichung. Die Seitenbetreiberin macht sich den Inhalt insbesondere nicht zu eigen.“