Zephyrnet-Logo

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion – KDnuggets

Datum:

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
Bild vom Autor
 

Haben Sie sich jemals gefragt, wie Menschen mithilfe der KI-Bildgenerierung solch hyperrealistische Gesichter erzeugen, während Ihre eigenen Versuche voller Störungen und Artefakte enden, die sie offensichtlich gefälscht aussehen lassen? Sie haben versucht, die Eingabeaufforderung und die Einstellungen zu optimieren, können aber immer noch nicht die Qualität erreichen, die Sie von anderen sehen. Was machst du falsch?

In diesem Blogbeitrag zeige ich Ihnen drei Schlüsseltechniken, mit denen Sie mithilfe von Stable Diffusion hyperrealistische menschliche Gesichter erzeugen können. Zunächst behandeln wir die Grundlagen des Prompt Engineering, um Sie bei der Generierung von Bildern mithilfe des Basismodells zu unterstützen. Als Nächstes untersuchen wir, wie ein Upgrade auf das Stable Diffusion XL-Modell die Bildqualität durch größere Parameter und Training erheblich verbessern kann. Abschließend stelle ich Ihnen ein benutzerdefiniertes Modell vor, das speziell für die Erstellung hochwertiger Porträts optimiert wurde.

Zuerst lernen wir, positive und negative Aufforderungen zu schreiben, um realistische Gesichter zu erzeugen. Wir werden die Stable Diffusion Version 2.1-Demo verwenden, die auf Hugging Face Spaces verfügbar ist. Es ist kostenlos und Sie können loslegen, ohne etwas einrichten zu müssen. 

Link: hf.co/spaces/stabilityai/stable-diffusion

Achten Sie beim Erstellen einer positiven Aufforderung darauf, alle notwendigen Details und den Stil des Bildes anzugeben. In diesem Fall möchten wir das Bild einer jungen Frau erzeugen, die auf der Straße geht. Wir verwenden eine allgemeine ausschließende Eingabeaufforderung, Sie können jedoch zusätzliche Schlüsselwörter hinzufügen, um sich wiederholende Fehler im Bild zu vermeiden.

Positive Aufforderung: „Eine junge Frau Mitte 20, die auf der Straße läuft, direkt in die Kamera blickt, selbstbewusster und freundlicher Gesichtsausdruck, lässig gekleidet in moderner, stilvoller Kleidung, Hintergrund einer städtischen Straßenszene, helle, sonnige Tagesbeleuchtung, lebendige Farben“

Negative Aufforderung: „entstellt, hässlich, schlecht, unreif, Cartoon, Anime, 3D, Malerei, Schwarzweiß, Cartoon, Malerei, Illustration, schlechteste Qualität, niedrige Qualität“

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Wir hatten einen guten Start. Die Bilder sind genau, aber die Qualität der Bilder könnte besser sein. Sie können mit den Eingabeaufforderungen herumspielen, aber das ist das Beste, was Sie aus dem Basismodell herausholen können. 

Wir werden das Stable Diffusion XL (SDXL)-Modell verwenden, um qualitativ hochwertige Bilder zu erzeugen. Dies wird dadurch erreicht, dass das Latent im Basismodus erzeugt und anschließend mit einem Refiner verarbeitet wird, um detaillierte und genaue Bilder zu erzeugen.

Link: hf.co/spaces/hysts/SD-XL

Bevor wir die Bilder generieren, scrollen wir nach unten und öffnen die „Erweiterten Optionen“. Wir fügen eine negative Eingabeaufforderung hinzu, legen den Startwert fest und wenden eine Verfeinerung an, um die beste Bildqualität zu erzielen.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Dann schreiben wir die gleiche Eingabeaufforderung wie zuvor mit der geringfügigen Änderung. Anstelle einer generischen jungen Frau werden wir das Bild einer jungen Inderin erzeugen.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Dies ist ein deutlich verbessertes Ergebnis. Die Gesichtszüge sind perfekt. Versuchen wir, andere Ethnien zu generieren, um auf Voreingenommenheit zu prüfen und die Ergebnisse zu vergleichen.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Wir haben realistische Gesichter, aber alle Bilder haben Instagram-Filter. Normalerweise ist die Haut im wirklichen Leben nicht glatter. Es hat Akne, Flecken, Sommersprossen und Linien. 

In diesem Teil erstellen wir detaillierte Gesichter mit Markierungen und realistischer Haut. Dafür verwenden wir das benutzerdefinierte Modell von CivitAI (RealVisXL V2.0), das für hochwertige Porträts optimiert wurde. 

Link: civitai.com/models/139562/realvisxl-v20

Sie können das Modell entweder online verwenden, indem Sie auf die Schaltfläche „Erstellen“ klicken, oder es herunterladen, um es lokal über die Stable Diffusion WebUI zu verwenden.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Laden Sie zunächst das Modell herunter und verschieben Sie die Datei in das Stable Diffusion WebUI-Modellverzeichnis: C:WebUIwebuimodelsStable-diffusion. 

Um das Modell auf der WebUI anzuzeigen, müssen Sie auf die Schaltfläche „Aktualisieren“ klicken und dann den Modellprüfpunkt „realvisxl20…“ auswählen.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Wir beginnen damit, die gleichen positiven und negativen Eingabeaufforderungen zu schreiben und ein hochwertiges Bild im Format 1024 x 1024 zu erstellen. 

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Das Bild sieht perfekt aus. Um das benutzerdefinierte Modell optimal nutzen zu können, müssen wir unsere Eingabeaufforderung ändern.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Die neuen positiven und negativen Eingabeaufforderungen erhalten Sie, indem Sie auf der Modellseite nach unten scrollen und auf das realistische Bild klicken, das Ihnen gefällt. Die Bilder auf dem CivitAI enthalten positive und negative Hinweise und eine erweiterte Steuerung.

Positive Aufforderung: „Ein Bild einer jungen indischen Frau, fokussierte, entschlossene, surreale, dynamische Pose, ultrahohe Auflösung, scharfe Textur, hochdetailliertes RAW-Foto, detailliertes Gesicht, geringe Schärfentiefe, scharfe Augen (realistische Hautstruktur: 1.2), helle Haut , DSLR, Filmkörnung“

Negative Aufforderung: „(schlechteste Qualität, niedrige Qualität, Illustration, 3D, 2D, Malerei, Cartoons, Skizze), offener Mund“

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Wir haben ein detailliertes Bild einer Inderin mit realistischer Haut. Es handelt sich um eine verbesserte Version im Vergleich zum Basis-SDXL-Modell.

 

3 Möglichkeiten zur Erzeugung hyperrealistischer Gesichter mithilfe stabiler Diffusion
 

Wir haben drei weitere Bilder erstellt, um verschiedene Ethnien zu vergleichen. Die Ergebnisse sind phänomenal und enthalten Hautflecken, poröse Haut und präzise Gesichtszüge.

Der Fortschritt in der generativen Kunst wird bald ein Niveau erreichen, bei dem wir Schwierigkeiten haben werden, zwischen realen und synthetischen Bildern zu unterscheiden. Dies signalisiert eine nachhaltige Zukunft, in der jeder aus einfachen Textaufforderungen äußerst realistische Medien erstellen kann, indem er benutzerdefinierte Modelle nutzt, die auf verschiedenen realen Daten trainiert wurden. Der schnelle Fortschritt birgt ein spannendes Potenzial – vielleicht kann die Erstellung eines fotorealistischen Videos, das Ihr eigenes Abbild und Ihre Sprachmuster nachbildet, eines Tages so einfach sein wie das Eintippen einer beschreibenden Eingabeaufforderung. 

In diesem Beitrag haben wir etwas über Prompt Engineering, fortschrittliche Stable-Design-Modelle und fein abgestimmte Kostüme-Modelle zur Generierung hochpräziser und realistischer Gesichter gelernt. Wenn Sie noch bessere Ergebnisse erzielen möchten, empfehle ich Ihnen, die verschiedenen hochwertigen Modelle auf civitai.com zu erkunden.
 
 

Abid Ali Awan (@1abidaliawan) ist ein zertifizierter Datenwissenschaftler, der es liebt, Modelle für maschinelles Lernen zu erstellen. Derzeit konzentriert er sich auf die Erstellung von Inhalten und schreibt technische Blogs zu maschinellem Lernen und Data-Science-Technologien. Abid hat einen Master-Abschluss in Technologiemanagement und einen Bachelor-Abschluss in Telekommunikationstechnik. Seine Vision ist es, ein KI-Produkt mit einem grafisch-neuronalen Netzwerk für Schüler zu entwickeln, die mit psychischen Erkrankungen zu kämpfen haben.

spot_img

Neueste Intelligenz

spot_img