Customer Post-Mortem: Database Outage (SQL Overload)
Summary On Feb 26, 2026 (09:08–10:35), awork was unavailable due to a database CPU saturation incident. A change intended to improve edge-case slow queries (enabling a SQL recompile setting) interacted with one specific high-impact query pattern from our Connect/external "type of work" endpoint, causing runaway load and a full service disruption.
Impact
Root Cause A performance optimization (SQL recompile enabled) increased database cost under pressure. A single problematic query pattern then drove database CPU to 100%, and long-running queries were not cancelled quickly enough, worsening the overload.
Resolution We restored service by rolling back the backend version and disabling the recompile setting.
Timeline
Prevention
Kunden-Post-Mortem: Datenbankausfall (SQL-Überlastung)
Zusammenfassung Am 26. Februar 2026 (09:08–10:35) war awork aufgrund eines Datenbank-CPU-Sättigungsvorfalls nicht verfügbar. Eine Änderung zur Verbesserung langsamer Edge-Case-Queries (Aktivierung eines SQL-Recompile-Settings) interagierte mit einem spezifischen, hochbelastenden Query-Pattern unseres Connect/externen „Type of Work"-Endpoints, was zu unkontrollierter Last und einem vollständigen Service-Ausfall führte.
Impact
Root Cause Eine Performance-Optimierung (SQL-Recompile aktiviert) erhöhte die Datenbank-Kosten unter Last. Ein einzelnes problematisches Query-Pattern trieb die Datenbank-CPU auf 100 %, und lang laufende Queries wurden nicht schnell genug gecancelt, was die Überlastung verschlimmerte.
Resolution Der Service wurde durch Rollback der Backend-Version und Deaktivierung des Recompile-Settings wiederhergestellt.
Timeline
Prevention