KIs, die Bilder wie aus dem Nichts generieren erfreuen sich heutzutage viel Popularität. Japan wird bekanntermaßen jedoch stark mystifiziert. Ich habe die künstlichen Intelligenzen Midjourney zu Japan befragt und zeige hier, wie akkurat ihre Vorstellung des Landes ist!
Midjourneys Bild von Japan
Die Aufgabe: Für den Test habe ich Midjourney gebeten, mir einige sehr bekannte japanische Dinge zu zeigen. Der Reihe nach einfach Japan allgemein, dann aber auch spezifischere Sachen wie etwa ein japanisches Frühstück, Burgen oder auch diverse Dinge aus der Mythologie des Landes.
Wie sieht der Alltag in Japan aus?
So hab ich die KI genutzt: Als erstes hab ich mir angesehen, wie Midjourney den japanischen Alltag sieht. Zur Generation gab ich der KI nacheinander die beiden Prompts “Japan” und “Modern life in Japan”. Die Ergebnisse siehst du in der folgenden Galerie:
Die Erkentnisse: Wie zu erwarten hat mir die KI ein sehr klischeehaftes Bild gezeichnet, das stets versucht, Frauen im Kimono zu zeigen. Zudem wirkt der Stil nicht sehr modern, sondern wirkt eher wie aus den 60er bis 80er Jahren. Gerade die Gebäude sehen jedoch so aus, wie ich sie von einer japanischen Stadt erwarte. Außerdem lassen sich gerade bei den Details zahlreiche Fehler finden.
Was stimmt nicht? Ganz davon abgesehen, dass die beiden Damen in Bild 1 keine Arme haben, so haben sie auch ihren Kimono falsch rum an. Der Ausschnitt ist klar am Rücken zu erkennen und auch die bauchbinde wirkt komisch. Bei dem berühmten Ausblick von der Chureito Pagode auf den Fuji hingegen hat die KI noch eine zweite Pagode dazu erfunden, die im Original nicht da ist.
Probleme mit dem Kleindungsstil: Der Drang, einen Kimono zu zeigen, geht so weit, dass die KI gar moderne Kleidung derart anpasst und mit dem traditionellen Trachten verschmilzt. Besonders deutlich wird das bei Bild 5, das zwei Frauen in einem Café zeigt. Sie tragen offensichtlich einfache Mäntel, was so durchaus realistisch wäre, jedoch lässt sich bei beiden darunter klar ein Kimono erkennen.
Wie ist Japan wirklich? Kimono oder gar Yukata zieht man heutzutage nur noch zu bestimmten Anlässen an. Nur sehr wenige Frauen tragen derartige Sachen im Alltag. Die meisten ziehen ganz einfach normale westliche Sachen an. Oft zudem nicht sehr farbenfroh. Etwas häufiger sieht man zudem noch einen auf “süß” getrimmten Stil. Dazu gibt es zudem viele Anzugträger – Frauen und Männer gleichermaßen.
Japanisches Frühstück
So hab ich die KI genutzt: Im zweiten Versuch bat ich sie ganz einfach darum, mit ein japanisches Frühstück zu zeigen. Was sie mir präsentierte, war jedoch in keinster Weise ein Frühstück, wie es die Mehrheit der Japaner essen. Der dafür genutzte Prompt war “a japanese breakfast”.
Veraltet und luxuriös: Was Midjourney einem als japanisches Frühstück verkaufen will, bekommst du so im Regelfall vielleicht noch in einem Ryokan. Denn das Bild zeigt ein sehr traditionelles Frühstück, was so heutzutage kaum noch jemand ist.
Was stimmt nicht? Allen voran kannst du eine Schüssel mit Misosuppe, eine weitere mit Gemüse und Ei sowie Reis erkennen. Aufsehenerregend ist jedoch das Sushi. Weil im Regelfall gibt es bei einem derartigen Frühstück nur normalen Fisch dazu. Zudem sind auch die Stäbchen etwas zu kurz geraten und die Schüssel oben rechts ist zu viel. Ich vermute, dass die KI hier eine weitere Miso-Suppe zeigen wollte, aber die ist bereits im geschlossenen Behälter links.
Ein echtes japanisches Frühstück: Das Frühstück Nummer 1 in Japan ist seit einigen Jahren einfach nur Brot. Und auch Fisch verschwindet immer mehr vom Speiseplan und weicht stattdessen Fleisch. Der Fleischdrang nimmt in Japan gar extreme Ausmaße an. Es gibt so gut wie nichts ohne Fleisch. Am nächsten kommt dem Bild noch das Frühstück, das ich im Austauschstudium hatte. Als wir dort mit dem Kurs zum Lernen in eine Herberge verreisten, gab es sehr traditionelles Essen. Aber selbst dort war es wesentlich simpler und bestand aus Reis, Miso-Suppe und einem Stück Fisch dazu.
Im folgenden Video erkläre ich dir genau, was die meisten Japaner heutzutage essen:
Japanische Burgen und Festungen
So hab ich die KI genutzt: Ich habe ein persönliches Interesse an japanischen Burgen. Den anderen Aufbau im Vergleich zu den Festungen im Westen finde ich beeindruckend. Da liegt es nahe, dss ich herausfinden musste, ob die KI ihn kennt. Als prompt nutzte ich “a japanese castle” und “bird’s eye view of a japanese castle”
Akkurat, aber etwas fehlt: Die KI kann durchaus akkurate Burgfriede erstellen und die auch noch in eine japanische Landschaft einfügen. Zudem nutzt sie auch wirklich einen japanischen Stil. Vom Design selbst, bis hin zum Material. Gerade im Westen werden japanische Burgen oft mit chineischen verwechselt, die wesentlich imposanter und farbenfroher aussehen. Allerdings fehlt etwas.
Wo versagt die KI? Was Midjourney hier zeigt, ist ausschließlich der Burgfried. Also der zentrale Turm. Es fehlt das gesamte Burggelände mit seinen Mauern, die die Festung in verschiedene Abschnitte unterteilt. Der Brugfried steht hier einfach nur frei in der Landschaft rum, was nicht realistisch ist.
Wie sieht eine echte japanische Burg aus? Wenn du einen Rundgang durch eine echte Festung sehen willst, dann sieh dir am besten mein Video zu meiner Reise nach Matsuyama an. Dort verbringe ich den größten Teil der Zeit damit, dir die Burg von außen und innen zu zeigen und auch genauer zu erklären, was japanische Befestigungen so besonders macht.
Religion und Mythologie
So hab ich die KI genutzt: Bei der Religion und Mythologie geht es langsam ans Abstrakte. Ich forderte die KI hierfür auf, mit einen Tempel, einen Yokai und die Sonnengöttin Amaterasu zu zeigen. Die Prompts waren “a japanese temple”, “a japanese yokai” und “japanese goddess amaterasu”.
Teil eines Tempels und Probleme bei der Mythologie: Der Baustil der Tempel selbst stimmt, auch, wenn sie wie die Burgen etwas alleine stehen. Zudem sieht es so aus, als generiert er nur die Eingangshalle und lässt den Rest weg. Bei der Mythologie präsentiert die KI mit dem Spiegel gar eine der drei Throninsignien von Amaterasu und stellt die korrekte Assoziation zu weißen Füchsen her, hat aber auch einige Probleme, die über ihre drei Arme und geschätzt 50 Finger hinausgehen.
Solche Yokai gibt es nicht! Die Yokai-Vorstellung von Midjourney mag rein stilistisch passen, allerdings zeigt es eine Kreatur, die eher aussieht wie eine Mischung aus Gollum und Yoda. Ein Yokai, der so dargestellt wird, gibt es nicht. Vermutlich orientierte sie sich bei Kappa, hat den aber mit weiteren Kreaturen vermischt.
Amaterasu ist nicht so aggressiv: Die japanische Sonnengöttin stellt die KI fast etwas dämonisch dar. Ein derart agressiver Fuchs, der eher an einen Wolf erinnert, passt jedoch so gut wie gar nicht zu ihrer Darstellung. Nich tnur wegen der Agression. Die Füchs sind die Boten von Inari, einer anderen Gottheit. Die Kleidung geht hingegen eher in die richtige Richtung, ist aber fast noch etwas zu freizügig.
Wie ist ist die echte Darstellung? Während Tempel in Japan oft aus größer angelegten Anlagen bestehen, so wird Amaterasu häufig mit drei Throninsignien dargestellt. Neben dem Spiegel gibt es noch ein Schwert und ein Juwel.
Der berühmte Shinkansen
So hab ich die KI genutzt: Japan ist besonders für sein gut aus gebauter Verkehrsnetz. Selbst, wenn das vorrangig in den Großstädten existiert und in kleineren Städten schon ganz anders aussieht. Besonders berühmt ist der Shinkansen, ein Hochgeschwindigkeitszug. Ich bat die KI mit dem simplen Prompt “Shinkansen” darum, mir einen zu zeichnen.
Welcher Shinkansen war das Vorbild? Die KI orientierte sich hier offenbar an der E5-Serie, wie an der Lackierung, sowie der aufgesetzten Nase zu erkennen ist. Allerdings hat sie es nicht geschafft, die Form beizubehalten. Das Fenster steht zwar wie beim Original etwas hervor, allerdings fehlt die Abflachung der Nase danach.
Ein mysteriöses Detail: Besonders merkwürdig sind jedoch die Scheinwerfer. Denn in einer ähnlichen Form existieren sie nur bei der N700-, E1- und E4-Serie. Midjourney vermischte hier also offenbar die Designs von zwei der Zugtypen.
Akkurates Japan von KIs?
Hübsch, aber nicht genau: Die von der KI erstellten Bilder sehen also allen voran hübsch aus, eignen sich aber nicht, wenn du wirklich spezifische Details von Japan zeigen willst. Das liegt an der Funktionsweise der KI. Sie lernt das Aussehen der jeweiligen Gegenstände anhand der verbreitesten Bilder. Wenn man sie um eine Generation bittet, versucht sie die Worte aus dem Prompt zu rekrieren.
Dadurch liefert dir die KI letztendlich auch ein sehr mystifizierendes Bild von Japan, wie gerade beim Alltag und auch beim Essen ersichtlich wird. Was auch daran liegt, dass gerade dieses Bild von Japan stark verbreitet, unter dem Deckmantel “kultureller Unterschiede” oft jedoch nicht als rassistisch gewertet wird. Mehr zu diesem Problem erkläre ich im folgenden Artikel zur Mystifizierung von Japan:
Ich bin der Betreiber von Kawaraban und beschäftige mich seit 2007 mit Japan und seiner Sprache.
Ich habe einen Bachelor of Arts in Japanologie erworben und ein Austauschstudium an der Senshu-Universität absolviert.
Seit 2018 lebe ich in Japan und berichte über das Land und mein Leben hier.
Eines meiner Ziele ist es, zukünftigen Generationen bessere Erklärungen zur Sprache zu bieten, als ich sie zur Verfügung hatte.