Warum Ihr Vibe-Coded MVP bei 100 Nutzern scheitern wird

7. April 2026#Vibe Coding

Sandor Farkas

Gründer & Lead Developer

Experte für Softwareentwicklung und Legacy-Code-Optimierung

Die 100-Nutzer-Klippe: Warum Vibe-Coded Produkte gegen eine Wand fahren

Sie haben ausgeliefert. Die Demo funktionierte. Ein paar Dutzend Early Adopter sind in der App, und die Dinge fühlen sich gut an. Dann erhalten Sie ein Product-Hunt-Feature oder einen gut getimten Social-Media-Post, und innerhalb einer Stunde gibt Ihr Server 503-Fehler zurück, Ihre Datenbankverbindungen sind erschöpft, und Ihre E-Mail-Benachrichtigungswarteschlange hat 4.000 unverarbeitete Jobs.

Dies ist die 100-Nutzer-Klippe, und hier trifft Vibe Coding – die Praxis, Software hauptsächlich durch das Prompting von KI-Tools wie ChatGPT, GitHub Copilot oder Cursor zu entwickeln – auf seine strukturellen Grenzen.

Vibe Coding funktioniert bemerkenswert gut, um etwas zu bauen, das anscheinend funktioniert. KI-Modelle werden auf enormen Mengen an Code trainiert und können Feature-Implementierungen produzieren, die den Happy Path abdecken, grundlegende Tests bestehen und in einer Demo glaubwürdig aussehen. Was sie konsistent nicht produzieren, ist Code, der für die Produktion entwickelt wurde: Systeme, die gleichzeitige Last verarbeiten, unter Ausfällen elegant degradieren und wartbar bleiben, wenn sich die Anforderungen ändern.

Dieser Beitrag erklärt die häufigsten Vibe-Coding-Versagensmuster, warum sie sich besonders bei der 100-Nutzer-Marke manifestieren, und was es braucht, um ein Produkt zu retten, das diesen Wendepunkt erreicht hat.

Warum 100 Nutzer der Brechpunkt ist

Einstellige Nutzerzahlen sind verzeilich. Ein oder zwei Nutzer lösen selten Race Conditions aus. Eine Datenbank mit 200 Zeilen zeigt selten einen fehlenden Index. Ein einzelner Server, der fünf Anfragen pro Minute verarbeitet, läuft selten aus Dateideskriptoren oder Connection-Pool-Slots aus.

Bei 100 gleichzeitigen Nutzern – oder sogar 100 aktiven Nutzern im Laufe eines Tages – verändern sich die Dynamiken grundlegend. Anfragen überlappen sich. Derselbe Datenbankdatensatz wird gleichzeitig gelesen und geschrieben. Background Jobs häufen sich schneller an, als sie verarbeitet werden. Speicherresidente Datenstrukturen, die bei kleinem Maßstab effizient schienen, entpuppen sich als quadratische Algorithmen.

KI-Code-Generierung hat kein Bewusstsein für diese Dynamiken. Sie produziert Code, der die angegebene Anforderung zum Zeitpunkt der Generierung erfüllt, ohne zu modellieren, wie sich dieser Code unter Gleichzeitigkeit, Volumen oder gegnerischen Bedingungen verhalten wird. Der Entwickler, der die Ausgabe überprüft, fängt diese Probleme möglicherweise auch nicht auf, weil der Code korrekt aussieht und die Tests bestehen.

Das Ergebnis ist ein Produkt, das in der Entwicklung gut funktioniert und in der Produktion versagt – nicht wegen Bugs im herkömmlichen Sinne, sondern wegen architektonischer Annahmen, die nur bei kleinem Maßstab gelten.

Die fünf häufigsten Vibe-Coding-Versagensmuster

1. Die N+1-Query-Epidemie

Das N+1-Query-Problem ist das mit Abstand häufigste Performance-Versagen in KI-generiertem Backend-Code. Es tritt auf, wenn Code eine Liste von N Datensätzen abruft und dann für jeden eine zusätzliche Query ausführt – was zu N+1 Gesamt-Datenbankabfragen führt, um eine einzige Seite zu rendern.

Ein typisches Beispiel in PHP, generiert von einer KI, die die Geschäftslogik korrekt versteht, aber nicht die ORM-Query-Strategie:

// Das sieht gut aus, führt aber 1 + N Queries aus
$orders = $orderRepository->findByUser($userId);
foreach ($orders as $order) {
    $customer = $order->getCustomer(); // löst eine Query für jede Bestellung aus
    echo $customer->getName();
}

Die korrekte Implementierung verwendet Eager Loading (ein JOIN oder IN-Klausel), um alle verwandten Datensätze in einer einzigen Query abzurufen. KI-Tools generieren häufig die naive Version, weil sie einfacher und isoliert korrekt ist.

Bei 5 Nutzern mit je 10 Bestellungen ergibt dies 55 Queries pro Seitenaufruf – langsam, aber nicht fatal. Bei 100 Nutzern mit je 50 Bestellungen ergibt es 5.100 Queries pro Seitenaufruf, und Ihr Datenbankserver ist nun der Engpass für jede Anfrage.

In Doctrine ORM beinhaltet die Behebung Join Fetches oder FETCH EAGER-Strategien. Das Identifizieren aller N+1-Instanzen in einer KI-generierten Codebasis erfordert systematisches Query-Logging und Profiling – etwas, das ein Code-Qualitäts-Audit erkennt, bevor es zu einem Produktions-Notfall wird.

2. Fehlende Datenbankindizes auf Query-Spalten

KI-generierte Migrationsdateien erstellen Tabellen und Spalten korrekt, fügen aber selten Indizes auf den Spalten hinzu, die tatsächlich abgefragt werden. Das liegt daran, dass das Hinzufügen der richtigen Indizes das Verständnis von Query-Mustern, Daten-Kardinalität und Zugriffsfrequenz erfordert – Kontext, der im Kopf des Entwicklers existiert, aber nicht im Prompt.

Das Ergebnis: Queries, die auf einer Entwicklungsdatenbank mit 500 Zeilen in Millisekunden ausgeführt werden, werden zu Full-Table-Scans, die auf einer Produktionsdatenbank mit 500.000 Zeilen 8 Sekunden dauern.

Häufige Spalten, die KI-generierte Schemas konsistent ohne Index lassen:

Fremdschlüsselspalten (user_id, order_id, tenant_id)
Status/State-Spalten, die in WHERE-Klauseln verwendet werden (status = 'pending')
Timestamp-Spalten, die für Bereichsabfragen verwendet werden (created_at BETWEEN)
E-Mail- und Benutzernamen-Spalten, die für Lookups verwendet werden

Ein EXPLAIN ANALYZE auf Ihren häufigsten Queries wird fehlende Indizes aufdecken. Sie hinzuzufügen ist schnell; sie in einer Codebasis zu finden, die ohne Index-Bewusstsein generiert wurde, ist der arbeitsintensive Teil.

3. Kein Connection Pooling oder Connection-Limit-Management

KI-generierte Anwendungen öffnen typischerweise eine neue Datenbankverbindung pro Anfrage und verlassen sich auf das Framework oder ORM, um die Wiederverwendung von Verbindungen zu handhaben. In der Entwicklung funktioniert das. In der Produktion unter Last erschöpft es das Verbindungslimit der Datenbank.

PostgreSQL hat standardmäßig 100 maximale Verbindungen. MySQL hat standardmäßig 151. Ein PHP-FPM-Setup mit 50 Worker-Prozessen auf zwei Servern kann diese Limits erschöpfen, bevor Sie 100 aktive Nutzer haben, abhängig von Anfragedauer und Query-Komplexität.

Die Lösung ist Connection Pooling (PgBouncer für PostgreSQL, ProxySQL für MySQL) kombiniert mit expliziten Verbindungslimits in der Anwendungskonfiguration. KI-generierte Docker-Compose-Dateien und Anwendungskonfigurationen beinhalten diese Komponenten selten, weil sie operative Infrastruktur darstellen, keine Anwendungslogik.

4. Synchrone Verarbeitung von Hintergrundarbeit

KI-Tools generieren standardmäßig synchronen Code, weil er einfacher zu verstehen und zu testen ist. Wenn Sie nach „E-Mail senden, wenn sich ein Benutzer registriert" fragen, sendet der generierte Code die E-Mail innerhalb des HTTP-Request-Handlers – und blockiert die Antwort, bis die API des E-Mail-Anbieters antwortet.

Bei geringem Volumen fügt dies 200–500 Millisekunden zu einer Antwort hinzu. Bei hohem Volumen erzeugt es einen Kaskadenausfall: E-Mail-API-Verlangsamungen verursachen Request-Timeouts, die dazu führen, dass sich Warteschlangen von HTTP-Verbindungen anhäufen, was den Worker-Pool Ihres Webservers erschöpft.

Produktionsreife Anwendungen verarbeiten jede Arbeit, die externe API-Aufrufe, Dateiverarbeitung oder nicht-triviale Berechnungen umfasst, in Background Jobs. Symfony Messenger, Laravel Queues oder jede Message-Queue-Integration trennt den Schritt „Arbeit annehmen" vom Schritt „Arbeit erledigen" – aber KI-Tools fügen diese Architektur nicht hinzu, es sei denn, Sie fragen explizit danach, und selbst dann fehlt der generierten Queue-Infrastruktur oft Retry-Logik, Dead-Letter-Handling und Job-Monitoring.

5. In-Memory-Session- und Cache-Speicherung

KI-generierte Anwendungen verwenden häufig In-Memory-Speicher für Sessions und Caches, weil es der Weg des geringsten Widerstands ist – keine Konfiguration, keine externen Abhängigkeiten, funktioniert sofort in der Entwicklung.

In einer horizontal skalierten Produktionsumgebung erzeugt dies Ghost Sessions: Die Anfrage eines Benutzers landet auf Server A (wo seine Session lebt), aber die nächste Anfrage landet auf Server B (der keine Kenntnis von dieser Session hat). Der Benutzer wird stillschweigend ausgeloggt.

Selbst auf einem einzelnen Server erzeugt die Verwendung von PHPs Standard-dateibasierter Session-Speicherung oder In-Memory-Arrays für Caching unter gleichzeitiger Last Datei-Sperrkonflikte und Cache-Invalidierungsprobleme, die KI-generierter Code nie antizipiert.

Redis oder Memcached als externe Session- und Cache-Backends löst dies, erfordert aber Infrastrukturkonfiguration, die KI-Tools typischerweise als Übung für den Leser überlassen.

Der Rettungsansatz: Was ein Senior-Entwickler tatsächlich tut

Wenn Wolf-Tech ein Legacy-Code-Optimierungs- oder Code-Qualitäts-Beratungs- Engagement für ein Vibe-Coded Produkt übernimmt, folgt der Prozess einem konsistenten Muster.

Schritt 1: Instrumentieren vor dem Optimieren. Fügen Sie Query-Logging, Error-Tracking (Sentry oder Äquivalent) und Request-Timing hinzu, bevor Sie Änderungen vornehmen. Ohne Messung ist Optimierung Raterei.

Schritt 2: Datenbank profilieren. Identifizieren Sie die 10 langsamsten Queries, fügen Sie fehlende Indizes hinzu und eliminieren Sie N+1-Muster. Dieser Schritt allein produziert typischerweise eine 3- bis 10-fache Performance-Verbesserung bei Anwendungen mit signifikanter ORM-Nutzung.

Schritt 3: Zustandsbehaftete Komponenten externalisieren. Verschieben Sie Sessions zu Redis, fügen Sie eine geeignete Cache-Schicht hinzu und konfigurieren Sie Connection Pooling. Dies adressiert die horizontalen Skalierungsblocker.

Schritt 4: Queue-Architektur prüfen. Verschieben Sie alle externen API-Aufrufe, Dateiverarbeitung und E-Mail-Versand in Background Jobs mit geeignetem Retry und Fehlerbehandlung.

Schritt 5: Load-Test vor dem Re-Launch. Führen Sie einen Load-Test mit einem Tool wie k6 oder Locust bei 2x Ihrem erwarteten Peak-Traffic durch, um zu überprüfen, dass die Korrekturen halten, bevor Sie Ihre Nutzerbasis informieren.

Diese Arbeit dauert typischerweise zwei bis vier Wochen für eine moderat komplexe Anwendung und ist dramatisch günstiger als ein Rewrite von Grund auf – was oft die Alternative ist, die Gründer in Betracht ziehen, wenn Vibe-Coded Produkte unter Last kollabieren.

Wann Vibe Coding gut genug ist (und wann nicht)

Vibe Coding ist für die Validierung von Product-Market-Fit wirklich nützlich. Wenn Sie versuchen festzustellen, ob jemand das will, was Sie bauen, ist die architektonische Qualität des Codes ein sekundäres Anliegen. Bringen Sie schnell etwas vor Nutzer, erfahren Sie, ob die Kernannahme zutrifft, und investieren Sie dann in die Härtung der Codebasis, wenn das Signal positiv ist.

Der Fehler ist, den Vibe-Coded Prototypen als das Produktionssystem zu behandeln. Die 100-Nutzer-Klippe ist kein Bug, der durch sorgfältigeres Prompting behoben werden kann – es ist die natürliche Konsequenz von Code, der nie für Produktionslast konzipiert wurde. Diesen Unterschied frühzeitig zu erkennen, spart erhebliche Kosten und Benutzer-Frustration.

Wenn Sie sich in der Phase befinden, in der Sie die Idee validiert haben und sich auf Wachstum vorbereiten, ist der richtige Schritt ein strukturierter technischer Review vor der Skalierung Ihres Marketings. Das Identifizieren und Lösen der oben beschriebenen architektonischen Probleme bei einer handhabbaren Codebasengröße ist ein begrenztes, vorhersehbares Engagement. Dieselbe Arbeit nach einem Wachstumsereignis zu tun, das bereits einen öffentlichen Ausfall verursacht hat, ist dringlicher, teurer und trägt die zusätzlichen Kosten der Erosion des Nutzervertrauens.

Fazit

Vibe Coding ist ein legitimes Tool für schnelles Prototyping, aber es produziert systematisch Code mit Lücken in der Produktionsreife: N+1-Queries, fehlende Indizes, kein Connection Pooling, synchrone Hintergrundarbeit und unangemessene Session-Speicherung. Diese Probleme sind bei kleinem Maßstab unsichtbar und katastrophal bei der 100-Nutzer-Marke, wo echte Gleichzeitigkeit und Datenvolumen die zugrundeliegenden Annahmen aufdecken.

Die gute Nachricht ist, dass diese Probleme diagnostizierbar und behebbar sind, ohne von vorne anzufangen. Ein fokussiertes technisches Audit und ein strukturiertes Sanierungsprojekt können einen Vibe-Coded MVP nehmen und ihn in ein Produkt verwandeln, das skaliert.

Bereit, Ihre Anwendung produktionsreif zu machen, bevor sie unter Last bricht? Wolf-Tech bietet eine kostenlose Erstberatung an. Kontaktieren Sie uns unter hello@wolf-tech.io oder besuchen Sie wolf-tech.io, um loszulegen.