Ich verbringe mehr Zeit mit der Nutzung von KI-Bildgebungsgeräten als der Durchschnitt. Ich habe mehrere Programme überprüft, die besten davon bewertet und gekürt und Best Practices für die KI-Bildaufforderungstechnik kennengelernt, um bessere Ergebnisse zu erzielen. Dabei habe ich Hunderte von KI-Bildern erstellt. Einige Bilder sind wunderschön und unglaublich detailliert, andere sind schrecklich. Andernfalls könnten sie seltsam, schrullig, gruselig oder auf andere Weise unbrauchbar sein.
Jedes schlechte KI-Bild ist auf seine Art einzigartig, aber bei meinen Tests und Analysen habe ich bei verschiedenen Diensten ähnliche Probleme festgestellt. Es gibt bestimmte Details, die KI-Imager gerne durcheinander bringen, und es gibt bestimmte Tricks, mit denen Sie sie beheben können. Keine dieser Strategien ist perfekt – sie hängen weitgehend vom verwendeten Generator ab – aber sie sind ein guter Ausgangspunkt.
Denken Sie daran, dass kein KI-Kunstdienst menschliche Schöpfer nachbilden oder ersetzen kann. Wenn Sie KI-Imager verwenden, finden Sie hier die größten Probleme, auf die ich gestoßen bin, und wie Sie sie beheben können.
10 Fotos, die zeigen, womit KI-Fotografen am meisten zu kämpfen haben
Alle Fotos ansehen
Menschliche Gesichter und Ausdrücke
Präzise Gesichtsausdrücke stellen KI-Generatoren immer wieder vor Herausforderungen. Ungewöhnliche Augen, Zähne und Augenbrauen sind einige der stärksten Indikatoren dafür, dass ein Bild von der KI generiert wurde. In diesem Fall fand ich das Ergebnis äußerst lustig, wenn auch völlig unbrauchbar. Die Mädchen tragen Halloween-ähnliche Vampirzähne und der Typ im Hintergrund hat mehr als nur einen Bad-Hair-Day.
Selbst bei Zeichentrickfiguren oder unrealistischen Charakteren haben Generatoren Schwierigkeiten, Emotionen und Ausdrücke zu mildern. Dieses Bild – erstellt von unserem Top-Pick, Dall-E 3 – verstärkte die Aufforderung wirklich und das Endergebnis war sehr dramatisch. Ich bezeichne mich selbst als Sauberkeitsfanatiker, aber ich kann mir nicht vorstellen, dass sich irgendjemand über Reinigungsprodukte im Wert von scheinbar mehreren Hundert Dollar so aufregt. Selbst die besten Programme können scheitern und instabile Ergebnisse liefern.
So beheben Sie Folgendes: Ich empfehle, den Dienst zu bitten, die Anzahl der Personen zu reduzieren, die er zu rendern versucht – das Risiko von Fehlern zu verringern – und Bearbeitungstools nach der Generierung zu verwenden, um bestimmte Teile des Bildes auszuwählen, die neu generiert oder korrigiert werden müssen. Die Wahl eines weicheren Adjektivs („wütend“ statt „wütend“) kann dabei helfen, den Dienst auf den richtigen Weg zu bringen.
Ikonische Charaktere, Marken und erkennbare Logos
Aus vielen Gründen sind KI-Imager selten in der Lage, genaue Logos, bekannte Marken oder anderweitig erkennbare Zeichen zu erstellen. Dies liegt häufig daran, dass erhebliche rechtliche Bedenken bestehen, dass ein Unternehmen die Nutzung seiner Markenmaterialien oder seines geistigen Eigentums für KI-Dienste zulässt. Es kann auch daran liegen, dass das Logo oder die Marke, die Sie einbinden möchten, nicht in den Trainingsdaten des Generators enthalten ist und der Generator Ihre Anfrage daher nicht versteht.
Zwei aktuelle Ausnahmen hiervon sind die neuen Bildfunktionen des Google Pixel 9 und Pixel 9 XL dank Gemini AI, mit denen unsere Mobilexperten Bilder mit präzisen Darstellungen von Mickey Mouse und Pikachu erstellt haben. Die andere Ausnahme sind einige zahlende Nutzer von X (ehemals Twitter), die berichten, dass sie dafür den Grok-Chatbot der Social-Media-Site nutzen können Realistisch aussehende Mickeys und menschliche politische Persönlichkeiten. Diese Bilder sind immer noch keine perfekten Renderings, aber sie kommen dem ziemlich nahe.
So beheben Sie das Problem: Das ist nicht möglich, aber das Positive daran ist, dass Sie mit größerer Wahrscheinlichkeit Klagen wegen Urheberrechtsverletzung vermeiden. Wenn Sie auf dieses Problem stoßen, empfehle ich Ihnen, Ihr Designkonzept zu überdenken, um zu sehen, ob Sie dieselbe Botschaft vermitteln können, ohne einen bestimmten Firmennamen oder ein bestimmtes Logo zu verwenden. Benötigen Sie wirklich das TikTok-Logo oder benötigen Sie beispielsweise nur ein Telefon, auf dem ein vertikales Video abgespielt wird?
Komplexe und überlappende Elemente
Gelegentlich kommt es zu einer Blockierung des Generators, wenn ein Bild zu viele überlappende oder komplexe Elemente enthält. Bei den besten KI-Bildgebungsprogrammen tritt dieses Problem nicht sehr oft auf, aber selbst die besten Programme scheitern irgendwann. Bei diesem Bild von Leonardo wird die Bibliothek meiner Träume durch die Rolltreppe ruiniert, die auf halber Höhe verschwindet.
Ebenso sieht dieses fotorealistische Bild einer Küche auf den ersten Blick gut aus, aber ein zweiter Blick oder ein kurzer Zoom zeigt im Kochbuch abgedruckte Kauderwelschzeichen, und das Buch selbst scheint zwei Buchrücken und drei Abschnitte zu haben. Bilder wie diese zeigen, wie frustrierend es sein kann, KI-Bilder zu erstellen – selbst wenn man glaubt, einen Gewinner zu haben, machen kleine Fehler sie unbrauchbar.
So beheben Sie das Problem: Versuchen Sie, Ihre Eingabeaufforderung zu vereinfachen oder Bearbeitungstools nach der Generierung zu verwenden, um das Problem hervorzuheben und zu beheben. Manchmal kann es auch hilfreich sein, die Ästhetik zu ändern. Diese Probleme treten normalerweise auf, wenn Sie versuchen, fotorealistische Bilder oder Archivbilder zu erstellen. Wenn Ihr Dienst ein spezielles Bereichsbearbeitungstool anbietet, versuchen Sie, damit den fraglichen Bereich auszuwählen und den Generator zu bitten, den Inhalt zu entfernen.
Übermäßige Bearbeitung und Halluzinationen
Das Zeichen eines großartigen KI-Bildgebers ist seine Fähigkeit, ein Bild mit wenigen Fehlern oder Halluzinationen zu erzeugen und gleichzeitig die richtigen Tools zur Verfügung zu stellen, um diese Probleme zu beheben, wenn sie unweigerlich auftreten, aber nicht jeder Dienst tut dies. In diesem Beispiel aus Midjourney habe ich mehrere Bearbeitungsrunden an diesem Bild einer Fußballmannschaft durchlaufen, die einen Sieg feiert, und ich habe keine Ahnung, was zu diesem Endergebnis geführt hat – oder irgendeine Ahnung, was mit dem Fleck los ist, bei dem es sich wahrscheinlich um einen Spieler handelt auf der rechten Seite des Bildes. Ehrlich gesagt glaube ich auch nicht, dass Midjourney es wusste.
So beheben Sie das Problem: Bei der KI-Bildbearbeitung ist manchmal weniger mehr. Haben Sie keine Angst, Ihren aktuellen Bilderstapel zu verwerfen und von vorne zu beginnen. Sie können große Probleme oft bereits im Vorfeld beheben, indem Sie Ihre Eingabeaufforderung so verfeinern, dass Sie sich später nur noch um die Behebung kleinerer Probleme kümmern müssen.
KI-Generatoren benötigen immer noch menschliche Arbeitskraft
Ich habe keinen Zweifel daran, dass die Unternehmen, die hinter diesen KI-Generatoren stehen, daran arbeiten, diese Probleme zu beseitigen und ihre Modelle zu verbessern. Unvollkommene Bilder zeigen uns vorerst einmal mehr, dass sich diese Technologie zwar verbessert, aber nicht perfekt ist. Ich hoffe, dass viele dieser Dienste, da sie vor ähnlichen Herausforderungen stehen, alle nach Lösungen für diese Probleme suchen werden.
Abschließend möchte ich Sie daran erinnern, dass es bewährte Vorgehensweise ist, beim Teilen darauf hinzuweisen oder zu bestätigen, dass ein Bild von der KI generiert wurde. Da KI-Bilder immer besser und realistischer werden, ist es wichtiger denn je, KI-generierte Kunst von anderen Medienarten zu unterscheiden.
Weitere Informationen finden Sie in unseren Ratschlägen zum Schreiben der besten KI-Bildaufforderung und in unseren Top-Tipps für KI-Bildgeneratoren.