Und Bilder? DiffusionBee!

Neben GPT4All gibt es auch DiffusionBee, das auf dem OpenSource Modell Stable Diffusion aufbaut und ist eine Bilder-KI. Ähnlich wie MidJourney, Dall-E und Leonardo erstellt es aus Texten Bilder, kann aber auch zu Bildern neue erzeugen.

Wie GPT4All arbeitet es auf dem Desktop ohne Internetverbindung. DiffusionBee arbeitet nur auf dem Mac, eine Windows-Version steht in den Sternen. Die Vorgehensweise ist auch einfach: Man lädt das Programm herunter und beim ersten Start lädt das Programm ein Modell nach.

Dann kann man einen Prompt eingeben. Unter Optionen kann man noch Parameter, unter anderem die Bildgröße angeben. Für mich funktioniert der Sampler "k_euler_ancestral" am besten. Man kann auch einen Negative Prompt aktivieren, mit dem man bestimmte Elemente ausschließen kann.

Danach drückt man auf "Generate" und das Bild wird erstellt. Je nachdem wie leistungsfähig der Mac ist (M1 oder M2), wieviel Speicher Frei und je weniger Programme offen sind, desto schneller geht es.

Das Ergebnis kann sich sehen lassen (selbst mit dem Standard-Model):

Je ausführlicher Prompt und Negative Prompt, desto detailreicher wird es. Unter Civitai.com finden sich nicht nur genügend Beispiele dafür, sondern auch andere Modelle, die je nach Spezialisierung eher in Richtung Anime, als auch in Richtung Realistisches Foto gehen und heruntergeladen werden können. Diese Datei kann dann als Custom Model eingeladen werden. Je nachdem kann das Modell bessere und schönere Bilder erstellen.

Auch hier wieder gilt: Viel Spaß beim Experimentieren.

You should also read: