Home / Insights / Creative

Creative

Creative Scorecard: wie du ein Creative vor dem Skalieren bewertest

Skalieren ist ein Verstärker, kein Reparaturmechanismus, und wer ein Creative nach Optik bewertet, verbrennt Budget hinter False-Positive-Winnern. Diese Scorecard entscheidet stattdessen entlang der Conversion-Kette.

Warum Optik keinen Kunden gewinnt und Bauchgefühl scheitert

Wenn du Budget auf ein Creative gibst, multiplizierst du dessen Eigenschaften: die guten und die schlechten. Ein Creative, das bei 50 EUR Tagesbudget knapp profitabel war, weil es zufällig die billigsten Impressionen einer engen, kaufbereiten Mikro-Audience erwischt hat, bricht bei 500 EUR ein. Der Algorithmus muss dann in teurere, breitere, weniger vorqualifizierte Auktionen liefern. Die richtige Frage vor dem Skalieren ist deshalb nicht hat es funktioniert, sondern warum, und hält dieser Grund unter Druck.

Optik korreliert mit der Stop-Stufe, nicht mit der Conversion. Ein schönes Creative gewinnt die Aufmerksamkeit, trifft aber oft kein Problem, kein Versprechen und keine Einsicht. Es produziert Reichweite, keine Kunden. Bauchgefühl ist als Skalierungsgrundlage untauglich, weil es das Creative bewertet, das du selbst siehst, nicht die Auktion, in der es ausgeliefert wird. Du beurteilst Ästhetik, der Algorithmus belohnt Relevanz-Signale, die zu billigen, kaufbereiten Impressionen führen. Bauchgefühl ist zudem nicht reproduzierbar, nicht delegierbar und nicht falsifizierbar. Bei einer Hit-Rate von oft nur rund 6 bis 7 Prozent echten Winnern liebt es statistisch in 9 von 10 Fällen das falsche Creative.

Die Conversion-Kette: jede Stufe einzeln messen

Ein Performance-Creative ist keine Optik-Einheit, sondern eine Kette von Mikro-Konversionen. Jedes Glied kann ein eigenes Versagen produzieren, und genau das macht das Endurteil über ROAS oder CPA blind: Die Endzahl sagt dir, dass es klemmt, aber nie wo. Eine Scorecard misst jede Stufe einzeln statt der Blackbox am Ende.

  • Stop: Stoppt der erste Frame die richtige Person? Diagnose ist die Hook- oder Thumbstop-Rate, also 3-Sekunden-Views geteilt durch Impressionen. Faustwert: rund 30 Prozent aufwärts.
  • Hold: Hält die Person dran, bis das Argument transportiert ist? Diagnose ist die Hold-Rate, also 15-Sekunden-Views geteilt durch 3-Sekunden-Views. Stark wird es ab rund 50 Prozent.
  • Qualifizierter Intent: Klickt sie aus Kaufabsicht oder aus Neugier? Diagnose ist die Outbound-CTR im Verhältnis zur Conversion-Rate, nie die CTR allein.
  • Erwartungs-Match: Findet sie auf der Landingpage, was das Creative versprochen hat? Diagnose sind Bounce, Time-on-Page und das Verhältnis von Outbound-CTR zu LP-CVR.
  • Conversion und Tragfähigkeit: Kauft sie unter Ziel-CPA, und hält die Kette über mehrere Audiences und über Zeit (Frequency)?

Der entscheidende Punkt: Jede Stufe kann gut aussehen, während die nächste kollabiert. Hoher Hook bei niedriger Hold heißt neugierig gemacht, aber nichts gesagt. Hohe CTR bei mieser LP-CVR heißt die falschen Leute geklickt oder die Erwartung gebrochen.

Kernaussage

Skalieren multipliziert die Qualität, die vor dem Skalieren da war. Deshalb entscheidet nicht das Budget danach, sondern die Diagnose jeder Stufe davor: Stop, Hold, qualifizierter Intent, Erwartungs-Match, Tragfähigkeit.

Die fünf Prüffragen als Gate-Logik

Jede Prüffrage ist ein Gate. Fällt das Creative durch, wird es nicht skaliert, sondern iteriert oder gekillt, egal wie gut die Endzahl aussieht. Frage 1, stoppt es die richtige Zielgruppe: Liegt der Hook unter rund 25 Prozent, liegt das Problem am ersten Frame oder Audio. Dann testest du den Hook isoliert neu, Body und CTA konstant. Frage 2, transportiert es Problem, Versprechen oder Einsicht: Hoher Hook bei einer Hold unter rund 30 Prozent bedeutet Aufmerksamkeit ohne Argument, also Script und Angle überarbeiten. Frage 3, erzeugt es qualifizierten Intent: Eine CTR von 7 Prozent wirkt elite, aber mit einer LP-CVR von 0,3 Prozent und hoher Bounce sind das Curiosity-Clicks, also teurer Traffic. Frage 4, passt die Erwartung zur Landingpage: Hohe CTR plus niedrige LP-CVR plus hohe Bounce ist fast immer ein Erwartungsbruch zwischen Ad-Versprechen und LP-Headline. Frage 5, trägt es Spend über Audiences und über Zeit?

Sind alle Vor-Stufen grün, liegen aber unter rund 100 Conversions oder unter 300 bis 500 EUR Spend, ist die Datenbasis zu dünn. Ein guter CPA aus 1 bis 3 Conversions ist Rauschen, kein Signal. Dann läufst du weiter, statt auf Glück zu skalieren. Mehr zur Haltbarkeit gewinnender Creatives liest du unter Creative Fatigue erkennen.

Ein Zahlenbeispiel: warum der hübsche Loser skaliert wird

Zwei Video-Creatives, je 300 EUR Spend, gleiche Audience. Creative 1 hat einen Hook von 41 Prozent, eine Hold von 24 Prozent, eine LP-CVR von 2,1 Prozent und einen CPA von 95 EUR. Creative 2 hat einen Hook von 31 Prozent, eine Hold von 52 Prozent, eine LP-CVR von 3,4 Prozent und einen CPA von 61 EUR. Creative 1 sieht im Account am besten aus, weil es den höchsten Hook und damit die höchste Reichweite produziert. Tatsächlich skaliert Creative 2: Der starke Hold beweist, dass Problem und Versprechen transportiert werden, statt nur Aufmerksamkeit zu erzeugen. Wer nach Hook oder Optik bewertet, skaliert den Verlierer und merkt es erst, wenn der CPA bei breiterer Auslieferung klettert.

Daraus folgt die Wenn-dann-Logik für die Allokation: Sind alle Stufen grün und bleibt der CPA bei plus 20 bis 30 Prozent Budget stabil, dann skalierst du in Schritten von 20 bis 30 Prozent alle 2 bis 3 Tage, um Learning-Phase-Resets zu vermeiden. Der Test-CPA ist dabei eine Untergrenze, kein Versprechen, weil der Algorithmus beim Hochskalieren breiter ausliefert.

Übertragbare Bausteine und warum das System schlägt

Ein Creative ist modular zu sehen: Hook, Angle, Format, Proof, CTA und LP-Narrative. Die Scorecard liefert nicht nur ein Ja oder Nein, sondern isoliert das übertragbare Element. Gewinnt der Hook über mehrere Bodies hinweg, transplantierst du ihn in andere Konzepte, etwa als Hook-Matrix aus 5 Hooks mal 2 Angles. Gewinnt der Angle über mehrere Hooks, gießt du ihn in neue Formate. Gewinnt das Format, nutzt du es als Template. Voraussetzung ist, pro Test nur eine Variable zu ändern. Wechselst du Hook, Format, Angle und CTA gleichzeitig, erzeugst du Noise statt Lernen und kannst nichts übertragen, weil niemand weiß, welches Element gewonnen hat.

Genau deshalb schlägt eine strukturierte Scorecard das Geschmacksurteil: Sie diagnostiziert, wo es klemmt, statt nur dass es klemmt. Sie isoliert die wiederverwendbaren Bausteine und macht aus einem Einzel-Winner eine Konzept-Bibliothek. Und sie verlagert die Entscheidung von der Person aufs System, womit sie reproduzierbar, delegierbar und testbar wird, also ein wiederholbarer Prozess statt eines Glücksgriffs.

Wenn du diesen Prozess nicht selbst aufbauen, sondern mit getesteten Skalierungskandidaten arbeiten willst: Zur Performance Creative Agentur.

Häufige Fragen

Wie viel Spend braucht ein Creative, bevor ich über das Skalieren entscheide?

Als Orientierung solltest du rund 100 Conversions oder etwa 300 bis 500 EUR Spend pro Creative abwarten. Ein guter CPA aus nur 1 bis 3 Conversions ist statistisches Rauschen und kein belastbares Signal. Erst danach sind die Stufenwerte stabil genug für eine Entscheidung.

Warum sinkt mein CPA nach dem Hochskalieren, obwohl das Creative im Test gewonnen hat?

Der Test-CPA ist eine Untergrenze, kein Versprechen. Beim Hochskalieren liefert der Algorithmus in breitere und teurere Auktionen mit weniger vorqualifizierten Nutzern aus, wodurch der CPA steigt. Skaliere deshalb in Schritten von 20 bis 30 Prozent alle 2 bis 3 Tage, damit die Performance stabil bleibt.

Was bedeutet ein hoher Hook bei gleichzeitig niedriger Hold-Rate?

Das Creative gewinnt zwar Aufmerksamkeit, transportiert aber kein Argument, also kein Problem und kein Versprechen. Die Leute schauen kurz hin und springen wieder ab, bevor die Botschaft ankommt. In diesem Fall solltest du Script und Angle überarbeiten, statt das Creative zu skalieren.

Kostenloses Erstgespräch

Wo liegt euer nächster Engpass?

Im Audit prüfen wir Account, Creative, Post-Click und Datenlage und sagen dir, welcher Hebel zuerst zählt.

Erstgespräch anfragen