Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>Hilfe bei Dall-E und ChatGPT

Hilfe bei Dall-E und ChatGPT

derguteste
derguteste29.05.2409:41
Hallo zusammen,

Meine Mutter hat mir als Kind jeweils selbsterfundene Geschichten erzählt die ich wiederum meinen Kindern erzählt habe. Und nun dachte ich ich schreib einige der Kurzgeschichten auf. Damit diese nicht in Vergessenheit geraten.

Nachdem ich die Geschichten aufgeschrieben hab dachte ich wäre doch schön wenn es dazu noch einzelne Bilder gibt. Da ich nicht ganz so gut zeichnen kann dachte ich an Dall-e.

Kann mir jemand sagen wie ich es hinbekomme das ich mehrere Bilder generieren kann und die Chraktere mehr oder weniger gleichbleibend aussehen?

Ich habe bereits eine sehr detailierte Beschreibung des Hauptcharakters geschrieben und dann auch die Referenz ID zum erstellten Referenzbild des Charakters so wie er aussehen soll mit in den Prompt gepackt. Trotzdem generiert Dall-E nicht nur subtile änderungen sondern komplett unterschiedliche Charaktere pro Bild.

Ich weiss das konsistente Charaktere für aktuelle KIs noch schwer umzusetzen ist. Deshalb frag ich zusätzlich gibt es evtl eine bessere Lösung für mein Vorhaben Charaktere für meine Geschichten zu visualisieren für den Privatgebrauch. Darf auch etwas kosten. Hauptsache ich kann einzelne Szenen mit den Charakteren erstellen und sie ändern nicht bei jede bild ihr Äusseres. Muss auch nicht zwingend voll automatisiert sein.

Danke für eure Hilfe
+6

Kommentare

svenn
svenn29.05.2411:54
probiere das mal mit supermachine
da hast du viele parameter zum einstellen und kannst zu den promts ein referenzbild hochladen, vielleicht geht es damit.
+3
Raziel129.05.2412:56
Mittels GEN ID sollte das möglich sein unter DALL-E

Sonst würde ich midjourny verwenden, welches sowas meiner Erinnerung nach von haus aus beherrscht.
0
MacStudio29.05.2415:13
Bei Midjourney gibt man einfach ein Bild (per DragDrop) als Vorlage zum prompt dazu. Bei allen anderen ist das ein Kampf und Krampf und lohnt nicht wirklich.
(Als Rockie muß man bei Midjourney leider über Discord arbeiten, da geht das auch, ist nur umständlicher. Ab 100 Bilder darf man die Web-Version verwenden. Monatlich kündbar.)
Zu den besten Ergebnissen kommt man, wenn man ChatGPT die Prompts schreiben lässt und dann die Vorlage - in diesem Fall das Gesicht - beifügt.
Nutze ich täglich beruflich. Mit Midjourny bekommt man so Durchgänge Bildstrecken in jedem Style den man möchte (inkl. echte "Reportage") hin. Photorealistisch.

PS: Midjourney ist allen anderen Anbietern - inkl. selbst trainierten Style Diffusion Modellen - 1-2 Generationen voraus. Es macht nicht wirklich Sinn sich mit anderen Anbietern zu quälen.
+5
Schens
Schens30.05.2408:43
Eine Herangehensweise, so wie MacStudio zu arbeiten, ist, ChatGPT so in etwa zu nutzen:

"Stell dir vor, du bist der beste Prompt Designer für midJourney. schreib mir bitte einen prompt der mir ein Foto realistisches Knolling-Bild eines Ellenators ausgibt. Suche dafür im Netz nach einem Foto eines Ellenators auf Basis eines Fiat 500"

ChatGPT4o gibt dann das aus
Create a realistic photo of a knolling layout featuring an Ellenator based on a Fiat 500. The image should display the car and its unique components neatly arranged on a flat surface. Include the modified rear axle with the closely positioned 14-inch wheels, parts of the ECU, and any other distinctive elements used in the conversion. The background should be neutral, allowing the details of the components and the car to stand out clearly.

Worauf MidJourney im ersten Versuch das hier liefert:



Gut, kein Ellenator, aber für Take 1 ganz OK.
0
Josch
Josch30.05.2409:12
Schens
[…]
Gut, kein Ellenator, aber für Take 1 ganz OK.

Danke für die Beschreibung Deiner Herangehensweise.

Was da so an Phantasie-Bauteilen bei ist, ist lustig 😂

Vergleichbares Verhalten habe ich bei diversen technischen Themen festgestellt. Besonders lustig waren im Motorradbereich Kreationen, die dermaßen unsinnig waren, dass fast kein auch nur annähernd brauchbares Ergebnis zustande kam. Selbst mit hochgeladener Vorlage wurde extrem viel vollkommener Unsinn produziert, dass es schon weh tat. In dem Bereich ist die Bildgenerierung oftmals noch sehr mühsam.
0
Brunhilde_von_der_Leyen30.05.2410:10
Und ohne Chat GTP geht es auch. Der Prompt "realistic Knolling picture of an Ellenator based on a Fiat 500 real photo" liefert mir ähnliche Bilder.
0
Bozol
Bozol30.05.2421:00
Auch habe Interesse für diese Dinge und hab mir seinerzeit einen Löhnware-Account von ChatGPT geholt, musste aber feststellen das ich nicht genügend freie Zeit hatte und habe somit den Löhnware-Account wieder in einen Free-Account umgewandelt. Trotz allem sind ein paar nette Sachen herausgekommen, wie z.B. mein E39 welcher dem Original auf dem Parkplatz bis auf Felgen, nicht getönte Scheiben und M-Paket wie ein Zwilling dem Anderen gleicht…
+1
Schens
Schens31.05.2407:55
Bozol
wie z.B. mein E39 welcher dem Original auf dem Parkplatz bis auf Felgen, nicht getönte Scheiben und M-Paket wie ein Zwilling dem Anderen gleicht…

Wirklich beeindruckend. Zumal die Datenlage zum E39 (bis 2005?) eher überschaubar sein dürfte.
0
Bozol
Bozol31.05.2409:18
Schens
Wirklich beeindruckend. Zumal die Datenlage zum E39 (bis 2005?) eher überschaubar sein dürfte.

Ja, mir gings genau so. Der E60/E61 wurde von 2003-2010 gebaut, dann kam ja schon der F10/F11. Leider musste ich meine knappe Freizeit noch weiter aufsplitten sodass sich der Bezahl-Accout nicht mehr rechnete, auch wenns "nur" 22€ waren.
Ich habe zwar noch ein weiteres Bild von schräg hinten, auch die Ergebnisse der Anderen möchte aber den Thread nicht kapern.
0
ssb
ssb31.05.2412:30
DIe Variante mit img2img könnte auch bei DrawThings funktionieren - läuft dann auf deinem Rechner ohne Cloud-Service. Kostenlos übrigens.

Je nach Model ist es oft sogar eher störend, wenn sich alle Charaktere zu ähnlich sehen - aber da muss man viel spielen. Da geht viel Zeit den Bach runter.
0
BMPBrother31.05.2413:37
Schens
Eine Herangehensweise, so wie MacStudio zu arbeiten, ist, ChatGPT so in etwa zu nutzen:

"Stell dir vor, du bist der beste Prompt Designer für midJourney. schreib mir bitte einen prompt der mir ein Foto realistisches Knolling-Bild eines Ellenators ausgibt. Suche dafür im Netz nach einem Foto eines Ellenators auf Basis eines Fiat 500"

ChatGPT4o gibt dann das aus
Create a realistic photo of a knolling layout featuring an Ellenator based on a Fiat 500. The image should display the car and its unique components neatly arranged on a flat surface. Include the modified rear axle with the closely positioned 14-inch wheels, parts of the ECU, and any other distinctive elements used in the conversion. The background should be neutral, allowing the details of the components and the car to stand out clearly.

Worauf MidJourney im ersten Versuch das hier liefert:



Gut, kein Ellenator, aber für Take 1 ganz OK.

Habe ich das jetzt richtig verstanden, dass du eine KI (ChatGPT) beauftragt hast, einen Auftrag für eine andere KI (MidJourney) zu erstellen? 😅
0
Schens
Schens31.05.2416:30
BMPBrother
Habe ich das jetzt richtig verstanden, dass du eine KI (ChatGPT) beauftragt hast, einen Auftrag für eine andere KI (MidJourney) zu erstellen? 😅

Korrekt. Je komplexer die Aufgabe, umso besser funktioniert das. Speziell mit Claude vs. ChatGPT habe ich sehr unterschiedliche Resultate. Oder auch innerhalb ChatGPT verhält sich 4o ziemlich unterschiedlich zu meinen speziell trainierten GPTs. In innerhalb dieser liefert meine "Arnold Chatgptenegger" ein völlig unterschiedliches Ergebnis als "Gary Vaynerchat".

Edit: Ich sollte das evtl. erläutern: Du kannst eine "eigene" GPT erstellen, indem Du sie mit Daten fütterst. Das "P" steht für "Pretrained". Gary Vaynerchat wurde zum Beispiel mit Transcripten aus 20h Vorträgen von Gary Vaynerchuk gefüttert.
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.