Agentic Video Production
Filmproduktion neu gedacht: AI-Agents uebernehmen Routinearbeit in der Postproduktion, Menschen kuratieren und feilen am Endprodukt. Fuer international agierende Marketing-Teams entstehen so mehrsprachige Video-Varianten in einem Bruchteil der bisherigen Produktionszeit.
Was wir machen
- Auto-Scene-Cut: AI erkennt Szenenwechsel und schneidet Rohmaterial vor.
- Voice-Cloning + Dubbing: Mehrsprachige Versionen ohne neue Aufnahmen.
- Caption-Generation: Untertitel + Subtitle-Files automatisch generiert (Whisper-basiert).
- Color-Match & LUT-Suggest: AI schlaegt Color-Grading-Profile vor.
- GPU-Rendering: Render-Pipeline auf eigener GPU-Infrastruktur (siehe GPU Rendering via MCP).
Pipeline-Architektur
Unsere agentische Pipeline besteht aus sieben Stages, die teils parallel und teils sequenziell laufen. Jede Stage produziert ein nachvollziehbares Artefakt, das menschlich gereviewt werden kann:
[Capture] --> [Scene-Detect] --> [AI-Caption] --> [Color-Match]
|
v
[QC-Pass] <-- [Render] <-- [Auto-LUT]
Capture nimmt Rohmaterial entgegen (Cloud-Upload, NAS-Drop, Camera-Card-Mount). Scene-Detect segmentiert via Shot-Boundary-Detection. AI-Caption erstellt Whisper-Transcripts plus Szenen-Beschreibungen. Color-Match normalisiert ueber Clips hinweg. Auto-LUT schlaegt Color-Grading-Profile basierend auf Brand-Guidelines vor. Render bekommt die Final-Cut-Anweisungen und nutzt unsere GPU-Pipeline. QC-Pass prueft Audio-Levels, Subtitle-Timing, Brand-Konformitaet und gibt Editor-Review frei.
Tool-Stack
- Claude / GPT-4: Drehbuch-Analyse, Szenen-Tagging, Storyline-Verifikation, Brand-Tone-Check.
- OpenAI Whisper: Mehrsprachige Transcripts mit Word-Level-Timestamps fuer praezises Caption-Splitting.
- Stable Diffusion / SDXL: Frame-Composing, B-Roll-Generation, Inpainting fuer Logo-Replacement.
- Blender / Houdini: 3D-Compositing, Particle-Systems, Procedural-Animation fuer Title-Sequences.
- FFmpeg-Pipelines: Encoding, Format-Konvertierung, HLS/DASH-Packaging fuer Web-Delivery.
- DaVinci Resolve API: Color-Grading-Profile-Export und LUT-Anwendung im Batch-Modus.
Wann macht Agentic Video Sinn?
Sechs Szenarien, in denen unsere Kunden den groessten Hebel sehen:
- Schulungs- und Trainings-Content: Onboarding-Videos in mehreren Sprachen mit identischem Master-Cut.
- Onboarding-Strecken: Personalisierte Begruessungsvideos, in denen Name, Rolle und erste Aufgaben dynamisch eingeblendet werden.
- Webinar-Recaps: Aus 60min-Stream wird ein 5min-Highlight-Cut plus Kapitel-Marker und Transkript.
- Product-Demos: Feature-Updates als kurze, automatisch versionierte Clips fuer Sales und Support.
- Conference-Recap: Multi-Speaker-Events werden in einzelne Talks gesplittet, mit Captions und Speaker-Tags.
- Brand-Templates: Wiederkehrende Formate (Quartals-Update, Mitarbeiter-Portrait, Case-Study) als Auto-Generation-Templates.
Pricing-Modell
Wir arbeiten stunden- und volumenbasiert. Setup einer kundenspezifischen Pipeline (Brand-Templates, Stilrichtung, Tool-Konfiguration) liegt typischerweise bei CHF 6500-12000 einmalig. Pilot-Projekte mit definiertem Scope (5-10 Videos) starten ab CHF 5000. Laufende Monats-Pakete fuer regelmaessigen Output bewegen sich zwischen CHF 2500 und CHF 8000 pro Monat je nach Volumen, Sprachen-Anzahl und Render-Komplexitaet. Pay-per-Render ist fuer einzelne Specials moeglich.
Wann macht das Sinn?
Fuer Unternehmen mit hohem Output-Volumen (Schulungs-Content, Onboarding, Webinar-Recap, Product-Demos) reduziert Agentic Production die Postproduction-Zeit um 60-80% bei gleichbleibender Qualitaet.
Klassische Crew bleibt
Fuer Imagefilm, Eventfilm, Spezialeffekte und High-End-Produktion arbeiten wir mit klassischer Filmcrew + Postproduktion. Hier ergaenzen AI-Tools, ersetzen sie aber nicht.