🔍 Règles de validation — InkMan
Checklist Gemma applique à chaque keyframe
🤖 Comment ça marche
Après chaque génération de keyframe par Gemini Image, Gemma 3 Vision (DeepInfra)
reçoit l'image générée + les refs acteurs + toutes les règles ci-dessous + le contexte de la vidéo
(narration, objets, style guide, description de la scène) et valide la cohérence.
Si Gemma détecte des problèmes → liste les issues → Gemini régénère avec les corrections précises. Max 3 tentatives par keyframe.
Si Gemma détecte des problèmes → liste les issues → Gemini régénère avec les corrections précises. Max 3 tentatives par keyframe.
📋 Règles actuelles (10)
- 1. Each character must match their reference image exactly (same body style, proportions, outfit, and signature trait).
- 2. The character count in the image MUST exactly match the cast for this keyframe — no extras, no duplicates, no background crowd.
- 3. Each character must be recognizable from their reference (same head shape, same signature trait).
- 4. Background must be paper cream (#FAF7F1) — no other scene ambience unless described in the scene.
- 5. Decor is MINIMAL — only elements listed in the scene objects list. No random extra objects.
- 6. NO text anywhere: no labels, words, letters, numbers, captions, logos, signs, writing on whiteboards/screens/documents, watermarks. All surfaces must be blank.
- 7. NO frame, NO border, NO decorative outer rectangle around the image.
- 8. 16:9 landscape aspect ratio, cinematic horizontal composition.
- 9. Line weight consistent across all elements — same thickness for all outlines.
- 10. No shadows, no rim-lighting, no glow, no texture, no gradient. Flat editorial illustration.
➕ Ajouter une règle
Règles claires, actionables, évitant l'ambigu. Gemma les vérifie une par une.
🧪 Contexte envoyé à Gemma pour chaque validation
- Image générée (keyframe)
- Images des acteurs présents + leurs descriptions physiques
- Liste des règles ci-dessus
- Style guide officiel de la chaîne
- Narration complète de la vidéo (contexte)
- Description textuelle du keyframe (pose, action)
- Liste des objets attendus dans le keyframe + leurs descriptions
- Nombre exact d'acteurs attendus