Compute: Der größte Kostenblock
Die Compute-Kosten machen 70-80% der Gesamtkosten von Databricks aus. Das größte Potenzial zur Optimierung liegt nicht in der Cluster-Größe, sondern in der Compute-Strategie. Über ein Dutzend Compute-Optionen stellt Databricks bereit; und die meisten Teams wählen nicht die richtige Kombination. Es liegt nicht an Unwissenheit, sondern daran, dass die beste Strategie von Workload-Profil, Latenzanforderungen und Fehlertoleranz abhängt. Wir untersuchen euren spezifischen Workload-Mix und setzen die Compute-Strategie um, die für euer Profil die geringsten Kosten bei akzeptabler Performance bietet.
Wir sehen regelmäßig Umgebungen, in denen allein die Compute-Strategie den Unterschied zwischen dem aktuellen Budget und der Hälfte davon ausmacht; ohne Einschränkungen für die Engineering-Teams.
Storage: Oft übersehen
Storage-Kosten sind typischerweise kleiner als Compute, aber sie wachsen linear mit dem Datenvolumen; und unkontrolliert, wenn niemand aufräumt. Wir sehen regelmäßig Umgebungen, in denen über die Hälfte des Storage-Volumens aus veralteten Dateiversionen besteht. Dazu kommt: Das physische Datenlayout bestimmt die Query-Performance und damit indirekt die Compute-Kosten. Falsch organisierte Daten führen zu Full-Table-Scans, wo gezielte Zugriffe möglich wären.
Wir implementieren Storage-Strategien, die Wartung automatisieren, Datenlayout an tatsächliche Query-Patterns anpassen und historische Daten in kostengünstigere Tiers verschieben; ohne den Zugriff einzuschränken.
Netzwerk: Die versteckte Kostenquelle
Kosten für Inter-Region-Traffic, PrivateLink-Endpoints und Data-Egress sind die Punkte, die niemand beachtet; bis die erste Cloud-Rechnung ins Haus flattert. Kosten für das Netzwerk entstehen durch Architekturentscheidungen, die man bei der initialen Einrichtung der Plattform getroffen hat: Wie ist die Verteilung von Compute und Storage? Welche Dimensionierung hat die Security-Architektur? Auf welche Weise erfolgt der Datenaustausch mit externen Konsumenten? Wir finden die Netzwerk-Kostentreiber und verbessern die Architektur, ohne die Sicherheitsanforderungen zu gefährden.