KI-Porträts erstellen: So trainierst du dein eigenes Bildmodell

31. Januar 2025
ℹ️Hinweis zur Quelle

Dieser Blogartikel wurde automatisch erstellt (und übersetzt). Er basiert auf dem folgenden Original, das ich für die Veröffentlichung auf diesem Blog ausgewählt habe:
How to Train an AI Image Model on Yourself | Cory Zue.

KI-Porträts erstellen: So trainierst du dein eigenes Bildmodell

Die Möglichkeit, personalisierte KI-Bildmodelle zu trainieren, um fotorealistische Abbilder von sich selbst oder anderen zu generieren, ist heutzutage überraschend einfach geworden. Frühere Versuche, dies umzusetzen, scheiterten oft an der Komplexität und den hohen Hardwareanforderungen. Mittlerweile existieren jedoch benutzerfreundliche Tools und Techniken, die den Prozess erheblich vereinfachen.

Grundlagen für das Training eines KI-Bildmodells

Für das Erstellen solcher Modelle sind im Wesentlichen drei Komponenten erforderlich:

  • Ein Basismodell: Dieses dient als Ausgangspunkt für das Training. Das Modell Flux wird oft als gute Alternative zu Stable Diffusion genannt.
  • Eine Trainingsmethode: Eine verbreitete Technik ist LoRA (Low-Rank Adaptation). Dabei wird nur ein kleiner Teil des Modells trainiert und mit einem spezifischen, selbstgewählten „magischen“ Wort verknüpft. Bei der späteren Prompt-Eingabe beeinflusst dieses Wort das Modell stark.
  • Ein Trainingsdatensatz: Dieser besteht aus einer Sammlung von Bildern der Person oder des Objekts, das das Modell lernen soll. Vielfalt bezüglich Ausdruck, Szene, Beleuchtung und Perspektive sind hierbei wichtig.

Der Workflow im Überblick

  1. Bildersammlung: Es empfiehlt sich, eine Sammlung von 10-15 Fotos mit unterschiedlichen Ausdrücken, Szenen, Lichtverhältnissen und Winkeln zusammenzustellen.
  2. Textbeschreibungen (Captions): Die Bilder benötigen Textbeschreibungen, die dem Modell als Lernmaterial dienen. Diese sollten das gewählte „magische“ Wort enthalten. Moderne Tools können diese Bildunterschriften mithilfe von LLMs automatisch generieren.
  3. Hardware: Für das Training sind rechenintensive Ressourcen (GPUs, RAM) erforderlich. Anstatt eigene Hardware zu nutzen, bietet sich die Nutzung von GPU-as-a-Service-Plattformen wie Replicate an.
  4. Training: Auf Replicate kann man auf vorgefertigte „Rezepte“ zurückgreifen, wie z.B. ostris/flux-dev-lora-trainer für das Training des Flux-Modells mit LoRA. Nach dem Erstellen eines Accounts und der Hinterlegung von Zahlungsinformationen können die erforderlichen Parameter eingegeben werden:
    • input_images: Die komprimierte Datei mit den Trainingsfotos.
    • trigger_word: Das „magische“ Wort für den LoRA-Trigger. Dieses sollte ungewöhnlich sein. Beispiele wären "czue".
    • hf_repo_id und hf_token: Hugging Face Repository und API-Schlüssel (optional).
    • autocaption_prefix: Ein Präfix für die generierten Bildunterschriften, passend zum Trigger-Wort (z.B. "Ein Foto von czue").
  5. Modellspeicherung: Hugging Face dient als Plattform zum Speichern und Teilen von Modellen, ähnlich wie GitHub für Code. Das erstellte Modell kann optional in einem Hugging Face Repository gespeichert werden.
  6. Inferenz: Im letzten Schritt wird das trainierte Modell genutzt, um Bilder zu generieren. Auf Replicate kann dazu das Rezept lucataco/flux-dev-lora genutzt werden. Wichtig ist die Angabe des hf_lora Feldes, das entweder auf das Hugging Face Repository oder die trainierten Modelldateien auf Replicate verweist. Zusammen mit einem Prompt, der das „magische“ Wort enthält, können dann Bilder generiert werden.

Ergebnisse und Kosten

Die Ergebnisse können variieren, wobei zusätzliche Hinweise im Prompt (z.B. "ein 40-jähriger Mann") die Konsistenz und Genauigkeit verbessern können. Das Einbeziehen mehrerer Personen in den Prompt kann zu unerwünschten Verschmelzungen von Merkmalen führen.

Die Kosten für das Training und die Bildgenerierung sind überschaubar. Das Training eines Modells kostet nur wenige Dollar, und die Generierung einzelner Bilder liegt im Cent-Bereich.

Fazit

Die Erstellung eigener KI-Bildmodelle ist heutzutage zugänglich und kostengünstig. Die vorgestellten Tools und Techniken ermöglichen es auch Einsteigern, mit geringem Aufwand personalisierte KI-Porträts zu erstellen.


Die Kommentare sind geschlossen.