Ivan NychyporukAI Media / Content Creator / VFX Digital Compositor / AI Integration Consultant

Project

KI-Werbefilm — Charakter- und Kinematografie-Prompts

2026video / advertising / workflow

Eine vollständige Pipeline für KI-generierte Werbung — vom Charaktersystem über era-spezifische Szenen-Prompts bis hin zu Sound Design, Voice-Over und finalem Schnitt eines 30-sekündigen Café-Spots.

Kontext

Dieses Projekt wurde im Rahmen des KIMUVA-Programms entwickelt. Ziel: einen wiederholbaren, filmischen KI-Video-Workflow aufzubauen, der ein kreatives Konzept bis zum fertigen 30-sekündigen Werbespot führt — mit Bildmaterial, Voice-Over und Soundeffekten.

Verwendete Tools: Google Veo 3.1 Fast · Adobe Firefly · Gemini Nano Banana · Suno · ElevenLabs · Adobe Premiere Pro

Erfolgskennzahlen:

  • Übereinstimmungsrate mit dem Referenzwert pro Frame
  • Auftreten von Artefakten pro Einstellung
  • VO-Geschwindigkeit (Wörter pro Sekunde) und wahrgenommene Ruhe

Charaktersystem — Kellnerin

Eine konsistente Figur („Mila") verankert den gesamten Spot. Kontinuität wird durch festgelegte Identitätsmerkmale erreicht — nicht durch Wiederverwendung derselben Quellbilder.

  • Identitätsmerkmale: Haarfarbe/-länge, Hautunterton, Altersgruppe, Körperhaltung, Mikroausdrücke
  • Grundausstattung: Café-Schürze + neutrale Bluse + dezentes Accessoire (szenenübergreifend wiederholbar)
  • Kontinuitätsmerkmale: Namensschild, Tassenstil, charakteristische Geste — halbes Lächeln, Blick nach links zur Kamera
  • Variabilität ist Trumpf: Licht und Farbpalette können sich ändern; Anatomie, Silhouette und Requisiten bleiben konstant
  • Prompt-Hygiene: prägnante Beschreibungen; keine Widersprüche; maximal 1–2 zentrale Requisiten

"Mila, late-20s café server; fair skin with light freckles across nose; hazel eyes; chestnut-brown hair in a low ponytail with a few baby hairs; subtle natural makeup; oval face; small silver stud earrings and thin chain necklace; brown leather watch on right wrist; crisp white oxford shirt, sleeves rolled; navy cotton apron tied in a center knot; calm, kind, attentive; signature details: tiny beauty mark under left cheekbone; slightly frayed apron strap; gentle, reassuring smile."

Charakter-Referenz – Mila, Portrait 1Charakter-Referenz – Mila, Portrait 2

Kinematografie-Prompt — Eröffnungseinstellung

Die Eröffnungseinstellung wird aus einem einzigen, vollständig spezifizierten Prompt generiert. Zwei generierte Ausgaben desselben Prompts:

Café-Tür – generierter Output ACafé-Tür – generierter Output B

Prompt (Auszug): Wide Shot durch die geschlossene Café-Glastür von der Straße. Frontalansicht, Augenhöhe. 50-mm-Objektiv, f/2, 1/100, ISO 200, Pro-Mist 1/8, CPL. Innenraum 2700K warmes Bernstein vs. Außenbereich 5600K kühles Blau/Grau. Negativ: türkisfarbene Tür, helles Tageslicht, übergroßes Schild vor dem Gesicht, Bewegungsunschärfe, Hände auf der Theke außen.

Anatomie eines Prompts

Jede Einstellung folgt derselben sechsteiligen Vorlage:

ElementInhalt
BildgestaltungBildausschnitt, Kameraperspektive, Kompositionsregel
KameraBrennweite (50–65 mm), geringe Schärfentiefe, max. 1 Bewegung
Handlung1 klare Handlung des Subjekts (Tasse abstellen, sanfter Blick)
BeleuchtungHaupt-/Aufhell-/Gegenlicht + praktische Lichtquellen; Weichheit, Richtung, Kontrast
Palette & Textur3–5 Farbakzente; nasser Asphalt, Porzellan, mattes Baumwollgewebe
EinschränkungenKeine Logos/Text; negative Prompts für unerwünschte Geometrie

Charaktere der Epochen — 80er bis heute

Der Spot erstreckt sich über drei Zeitperioden, jede erfordert ein eigenes Charakterset mit festgelegten Kontinuitätsparametern.

Straßenszene der 80er Jahre

80er-Charaktere: Rollschuhfahrerin (Quad-Rollschuhe, High-Waist-Shorts, Pastellwindjacke) · Boombox-Typ (buntes Trainingsjäckchen, Kassettenrekorder) · Skater (gebleichtes Print-T-Shirt, Flanell um die Taille) · Büropaar (Schulterpolster-Blazer, Trenchcoat)

Straßenszene von den 90ern bis heute

90er–Heute: Paar unter Regenschirm (Oversize-Jeansjacke, kariertes Hemd) · Läufer mit AirPods (türkises Funktionsshirt, Fitnessband) · E-Scooter-Fahrer (gesteppte Weste, Helm) · Fußgänger mit Smartphone (Olivgrüne Parka, leuchtender Bildschirm im Regen)

Jeder Epochen-Charakter hat festgelegte Kontinuität: Kleidungspalette, Requisiten, Bewegungsrhythmus und Frisur bleiben über alle Einstellungen hinweg konstant.

Farbe und Beleuchtung

Regnerische Café-Straße – Farb- und Beleuchtungsreferenz

Der Spot wechselt vom warmen Café-Innenraum zur regnerischen Straße — eine bewusste Farbtemperatur-Transition:

  • Innenraum: 3000K warmes Bernstein — Hängelampen-Bokeh, glasierte Fliesen, Dampfschleier
  • Außenbereich: ≈5600K kühles Blau/Grau — spiegelndes Pflaster, diffuses Himmelslicht, gedämpfte Sättigung
  • Korrekturhinweise: Hauttöne schützen; sanfte Lichthöfe; Schwarztöne sparsam aufhellen; engerer Laternenkegel im Freien

Leitfaden zur Artefaktminimierung

Kaffeemühle – Animationsreferenz
  • Überladene Prompts → aufteilen in „1 Subjekt + 1 Aktion"
  • Mehrdeutige Requisitenlisten → detaillierte Inventarliste für Vorder-/Mittel-/Hintergrund
  • Phantomgliedmaßen / Metallstangen → zum negativen Prompt hinzufügen
  • Instabile Komposition → mit Referenzbild sperren; Kantenscans und Tangentenprüfungen durchführen

Für die Kaffeemühlen-Rotation wurden Keyframe-Checkpoints bei t=15%, 35%, 55%, 75%, 92% mit einem abschließenden elastischen Einschwingen <5° festgelegt — keine Beschreibung des vollständigen Bogens, nur die Referenzwinkel.

Fehlerbehebung bei Zeitübergangsaufnahmen

Die Kamera wechselt in einer einzigen Einstellung von innen durch das Café-Glas auf die Straße. Die Lösung: Dolly-Bewegung statt Zoom — mit expliziten Parallax-Anweisungen.

Zeitübergang – Café-InnenraumZeitübergang – Mitte der BewegungZeitübergang – Straße sichtbar

Kamerabewegung (Pflicht): Langsames Vorwärts-Dolly entlang der optischen Achse — kein Zoom, kein Schwenk/Neigen/Rollen. Von t=0→90% ca. 40 cm vorwärts; Horizont stabil. Bei t≈70–80% ist der Fensterrahmen vollständig aus dem Bild, die Straße komplett sichtbar. Parallax zeigen: Tafel/Fahrrad/Autos skalieren um ~15–20%.

Packshot-Design

Das Produkt (AURUM-Kaffeedose) wurde mit Gemini Nano Banana gestaltet und in die Szene eingefügt, dann mit Google Veo 3.1 Fast animiert.

Packshot – AURUM Kaffeedose

Nano Banana: Verpackungsdesign-Generierung, Farb- und Schriftanpassung, Umgebungskomposition Veo 3.1 Fast: Motion Graphics und Produktpräsentation

Sound Design

  • Diegetische Geräusche: leiser Raumklang · sanfte Straßengeräusche · Abstellen einer Tasse · Summen der Kaffeemühle · Zischen von Dampf
  • Musik: Sweet Silence (0,75×) — langsame, verträumte, klavierdominierte Ballade; generiert in Suno v4.5-all (6:08)
  • Dynamik: niedriger Grundpegel, nur sanfte Transienten — kein konstantes Hintergrundrauschen

VO-System

ElevenLabs Voice-Einstellungen

Kadenzkarte:

ZeitcodeInhalt
:00–:08Einführung in die Szene
:10–:18Produktwert
:20–:26Sensorische Linie
:27–:30Markenname / Call-to-Action (ganz leise)

Ablauf: Entwurf → Anpassung an Dauer → Kürzung um ca. 40 % für Spielraum → Kadenzkarte erstellen

TTS-Einstellungen (ElevenLabs): Geschwindigkeit leicht unter Normal · weicher Stimmeinsatz · weiche Zischlaute — Stimme: Jessica, Eleven Multilingual v2

Editing — Shotliste

Shot 01 – Eröffnung des CafésShot 02 – Straßenenergie der 80erShot 03 – Erster TropfenShot 04 – Kameraschwenkung durch die ZeitShot 04a – Mahlen der BohnenShot 05 – 90er-Straße im RegenShot 06 – DampfreinigungShot 07 – Die Straße heuteShot 08 – Latte Art FinishShot 09 – Packshot
#EinstellungZeitcode
1Eröffnung des Cafés0.00–2.50
2Straßenenergie der 80er Jahre2.50–6.00
3Erster Tropfen6.00–8.00
4Schnelle Kameraschwenkung durch die Zeit8.00–11.00
4aMahlen der Bohnen11.00–13.00
5Straße in den 90er Jahren im Regen13.00–16.00
6Dampfreinigung16.00–19.00
7Die Straße von heute19.00–22.00
8Latte Art Finish22.00–25.50
9Packshot25.50–30.00
Adobe Premiere Pro Editing-Timeline

Ergebnisse

Ein wiederholbarer End-to-End-Workflow: Konzept → Charaktersystem → Prompt-Engineering → Generierung → Sound & VO → Schnitt.

Ergebnisse: höhere Bildgenauigkeit; stimmige Farbpalette mit Regenstimmung; reduzierte Anzahl an Artefakten; VO-Sprechtempo passend zum ruhigen Schnittrhythmus.

Was wiederholt werden sollte:

  • Mehrfachaufnahmesequenzen (2 × 4-Sekunden-Takte pro Einstellung)
  • Alternative Brennweiten pro Szene
  • Gesperrte Farbpalette als Generierungsanker

Checkliste: Komposition ✓ | Farbpalette ✓ | Artefakte ✓ | SFX-Hintergrund ✓ | VO ✓