Mit KI-generierten Bildern Wissenschaftskommunikation neu gestalten

Das IPN Journal gewährt Einblicke in eine explorative Design-Studie, die im Rahmen einer Partnerschaft zwischen dem Forschungsnetzwerk Kiel Science Communication Network und dem Wissenschaftsmagazin Spektrum der Wissenschaft entstanden ist.

Björn Schmidt

Im Rahmen einer explorativen Design-Studie des Kiel Science Communication Networks (KielSCN), das vom IPN koordiniert wird, und des Wissenschaftsmagazins Spektrum der Wissenschaft untersuchen Forscherinnen und Forscher die transformative Rolle von Künstlicher Intelligenz (KI) bei der Verbesserung der Datenvisualisierung. Hier wird insbesondere der Einsatz von KI-generierten Bildern in den Blick genommen. Zugleich dient die Design-Studie als Vorstudie der Elaboration, wie verschiedene Visualisierungstechniken die Aufmerksamkeit und das Informationsverhalten von Leserinnen und Lesern beeinflussen können. Beide Teile dieser Studie werden hier vorgestellt.

Komplexe wissenschaftliche Inhalte einem breiten Publikum verständlich zumachen, wird in Zeiten der Datenflut zu einer immer größeren Herausforderung. KI-Technologien, vor allem im Bereich der Bildgenerierung, eröffnen neue Wege, wissenschaftliche Daten nicht nur informativ, sondern auch emotional ansprechend zu präsentieren. Hier setzt die Kooperation des Kieler Zentrums für Wissenschaftskommunikationsforschung KielSCN mit seinem Praxispartner, dem Wissenschaftsverlag Spektrum der Wissenschaft, an.

Das Kiel Science Communication Network

Die VolkswagenStiftung fördert das KielSCN als  eines von deutschlandweit vier Konsortien über einen Zeitraum von fünf Jahren in der Förderlinie Wissenschaftskommunikation hoch drei – Zentren für Wissenschaftskommunikationsforschung.

Als interdisziplinäres Forschungszentrum für Wissenschaftskommunikation entwickelt das KielSCN neue Ansätze für die Kommunikation von wissenschaftlichen Inhalten, indem sich die Beteiligten mit Visualisierungen von Informationen und deren Wahrnehmung beschäftigen. Dafür haben sich das Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, die Muthesius Kunsthochschule und die Christian-Albrechts-Universität zu Kiel zusammengeschlossen: Mit ihrer gebündelten Expertise in den Bereichen Bildungsforschung, Informationsdesign und innovativer Gesundheitsforschung wollen sie gemeinsam die visuelle Wissenschaftskommunikation auf ein neues, zukunftsweisendes Niveau heben.

Visualisierung der Prävalenz von Depressionen in Europa

Im Mittelpunkt der explorativen Design- bzw. Vorstudie steht eine gemeinsam entwickelte und veröffentlichte Visualisierung der Prävalenz von Depressionen in Europa. Sie basiert auf den Daten des European Health Interview Survey (EHIS), einer Gesundheitsumfrage in allen EU-Mitgliedsstaaten sowie einigen anderen europäischen Ländern im Jahr 2019. Die Befragten gaben in der Umfrage an, ob sie in den vergangenen 12 Monaten an einer Depression gelitten oder verschiedene Symptome der Krankheit bei sich beobachtet hatten. Die Visualisierung wurde innerhalb eines Interviews mit dem Titel „Depression. Der lange Schatten der Gesellschaft“ bei Spektrum der Wissenschaft veröffentlicht.

https://www.spektrum.de/ news/depression-foerdert- unsere-gesellschaft- psychische-erkrankungen /2200836?s=s2&b=b2

Die Visualisierung nutzt intuitive Balkendiagramme, um die Prävalenz von Depressionen in vier Schlüsselkategorien zu veranschaulichen: Geschlecht, Alter, Bildungsniveauund Herkunftsland. Diese Balkendiagramme dienen nicht nur der Darstellung von Prävalenzraten, sondern sind auch interaktive Schaltflächen, die eine tiefergehende Analyse ermöglichen. Nutzerinnen und Nutzer können bestimmte demografische Gruppen auswählen, woraufhin sich die Visualisierung in Echtzeit anpasst, um die Prävalenzwerte entsprechend der neuen Filterung anzuzeigen. Ein prägnantes Beispiel hierfür ist die Auswahl des weiblichen Geschlechts und der Altersgruppe 25–34 Jahre, wodurch die Darstellung der Depressionsprävalenz für diese spezifische Gruppe über alle Bildungsniveaus und Herkunftsländer hinweg sofort aktualisiert wird. Diese dynamische Anpassung der Balkendiagramme ermöglicht ein präziseres Verständnis der Daten und zeigt, wie verschiedene Faktoren, einzeln oder in Kombination, die Prävalenz von Depressionen beeinflussen.

Prävalenz
Prävalenz bezeichnet die gesamte Anzahl der Krankheitsfälle im betrachteten Teil der Bevölkerung zu einem Zeitpunkt oder während eines bestimmten Zeitraums. Die Prävalenz einer bestimmten Erkrankung wird meist als Prozentsatz angegeben (Anteil der erkrankten Personen an der Gesamtpopulation).

Gestaltung mittels KI

Die interaktive Auswahl wird weiter durch 96 KI-generierte Bildmotive ergänzt, die für jede Kombination aus Geschlecht, Alter und Bildungsniveau spezifisch sind. Diese Bilder bereichern die Daten um einen emotionalen Kontext und transformieren statistische Informationen in greifbare menschliche Erfahrungen. Beispielsweise kann die Auswahl der Gruppe weiblich und 25-34 Jahre ein Bildmotiv evozieren, das eine junge Frau in einer Landschaft zeigt, die Ruhe und Reflexion suggeriert. Solche visuellen Elemente fördern nicht nur ein tieferes emotionales Verständnis der Daten, sondern verstärken auch die narrative Komponente der Visualisierung, indem sie eine Brücke zwischen den Betrachterinnen und Betrachtern und den Lebensrealitäten von Menschen schlagen, die von Depressionen betroffen sind.

Den perfekten Prompt entwickeln

Ausgangspunkt war die Entwicklung eines Basis-Prompts, der sowohl vielseitig als auch präzise sein sollte. Dieser Prompt enthielt Optionen in geschweiften Klammern { }, die eine Vielzahl von Variationen ermöglichten. Zum Beispiel wurde der Prompt „{male, female, female and male}, {teenager, youngadult, adult, middle-aged, senior, elderly, octogenarian, person}, {casual, mature, academic, neutral} clothing, from behind, mist, seascape, cinematic Deakins style, wide shot -- ar 21:9 -- stylize 250“ sorgfältig entworfen, um verschiedene demografische Kategorien wie Geschlecht, Alter und Bildung zu umfassen. Diese Methode generierte effizient alle benötigten Bilder und demonstrierte gleichzeitig die Möglichkeiten der automatisierten Ausgabe mit Hilfe von KI.

Dynamische Infografiken, deren Balkendiagramme sich an die Interaktionen der Leserschaft anpassen und so tiefergehende Einblicke in  verschiedene demografische Gruppen ermöglichen.
Dynamische Infografiken, deren Balkendiagramme sich an die Interaktionen der Leserschaft anpassen und so tiefergehende Einblicke in verschiedene demografische Gruppen ermöglichen.

Demografische Daten in Beschreibungen übersetzen

Ein entscheidender Teil bei der Entwicklung der Visualisierung war die Übersetzung demografischer Kategorien in beschreibende Begriffe, die Midjourney interpretieren konnte. Diese Übersetzung war wesentlich, da sie sowohl mit dem Verständnis der KI übereinstimmen als auch unsere Datenkategorien genau abbilden musste. Beispielsweise wurde die Altersgruppe „15–24“ zu „teenager“ und das Bildungsniveau „tertiary“ zu „academic clothing“ übersetzt. Ein nuanciertes Verständnis dafür, wie KI textbasierte Beschreibungen wahrnimmt und verarbeitet, war dafür erforderlich.

Herausforderungen und Verzerrungen begegnen

Während dieses Prozesses waren wir uns der Verzerrungen bewusst, die in KI-generierten Bildern auftreten können. Besonders herausfordernd war die Darstellung spezifischer demografischer Merkmale, wie z.B. ältere schwarze Menschen mit weißen Haaren oder ältere Frauen mit weißen Haaren. Die KI konnte diese Merkmale nicht zuverlässig erzeugen, was auf fehlende oder unzureichende Repräsentationen dieser Merkmale in den Trainingsdaten hindeutet. Diese Einschränkungen unterstreichen die Wichtigkeit eines kritischen und aufmerksamen Umgangs mit KI-Technologien bei der Erstellung visueller Inhalte.

Potenzial und Zukunftsperspektiven KI-gestützter Bildgenerierung

Darüber hinaus lässt die dynamische Entwicklung im Bereich der KI-Technologie ein enormes Potenzial erwarten. Mit den täglichen Fortschritten erweitern sich die Möglichkeiten für präzisere, vielfältigere und authentischere Darstellungen in KI-generierten Bildern kontinuierlich. Diese Entwicklung ebnet den Weg für nuancierte und effektive Anwendungen in der Wissenschaftskommunikation und im Bereich der Bildung. Werkzeuge wie Midjourney werden so zu unverzichtbaren Hilfsmitteln für Kommunikatorinnen und Kommunikatoren, die komplexe Daten auf ansprechende und narrative Weise vermitteln wollen.

Explorative Gestaltung und Forschungsanwendung

Die Design-Studie zeigt nicht nur das Potenzial von KI-generierten Bildern für die Erstellung emotional ansprechender Visualisierungen, sondern bietet auch eine Basis für die Erforschung effektiver Wissenschaftskommunikationsstrategien. So ist das Design des Projekts nicht nur auf die Präsentation von Daten ausgerichtet, sondern dient auch als exploratives Werkzeug, um zu verstehen, wie verschiedene Visualisierungstechniken die Aufmerksamkeit und das Informationsverhalten von Leserinnen und Lesern beeinflussen. Das KielSCN und Spektrum der Wissenschaft haben verschiedene Versionen der Visualisierung entwickelt, um unterschiedliche Aspekte der Interaktion und der Informationsvermittlung zu testen.

Die Vorteile der KI-generierten Bildgebung sind vielfältig

Skalierbarkeit und Konsistenz
KI ermöglicht die schnelle Erstellung konsistenter Bilder in unbegrenzter Zahl, abhängig von der
verfügbaren Rechenleistung. Der festgelegte Stil unterstützt automatisierte, bedarfsgerechte Content-Produktion, was Flexibilität für dynamische Projekte bietet.

Ästhetische Qualität
Die ästhetische Qualität von KI-generierten Bildern ist
hoch und verbessert sich kontinuierlich. Es bietet Kommunikatorinnen und Kommunikatoren wertvolle Unterstützung bei der Erstellung attraktiver Inhalte, die die Zielgruppen effektiv ansprechen.

Emotionale Tiefe und Engagement
Bilder sind mehr als nur Dekoration – sie sollen Gefühle ansprechen und den Daten eine emotionale Ebene hinzufügen. Dies ist besonders wichtig, um wissenschaftliche
Informationen greifbar und erlebbar zu machen.

Kosteneffizienz
Die Effizienz der KI reduziert die Kosten und den Aufwand für die Erstellung vielfältiger, qualitativ hochwertiger Bildinhalte erheblich.

Anleitung zur Exploration

Die Abbildungen zeigen die unterschiedlichen Anleitungen, die zufallsgeneriert den Leserinnen und Lesern von Spektrum der Wissenschaft ausgespielt wurden.

Mit drei unterschiedlichen Anleitungen zur Exploration – freie Erkundung, geleitet mit persönlichem Bezug und geleitet mit einer spezifischen Aufgabe – versuchen wir zu verstehen, wie unterschiedliche Arten der Anleitung die Interaktion der Nutzerinnen und Nutzer mit der Visualisierung beeinflussen. Dieser Forschungsaspekt ist entscheidend, um effektive Strategien für die Präsentation komplexer Daten in Informationsumgebungen zu identifizieren. Das Verhältnis zwischen Anleitung und eigenständigem Erkunden ist hier eine interessante Stellschraube. Es soll untersucht werden, inwiefern unterschiedliche Anleitungen das Verständnis und die aktive und vertiefte Auseinandersetzung mit den Inhalten fördern oder hemmen.

Bildnutzungsstrategien

Durch den Einsatz unterschiedlicher Bildkonzepte – keine Bilder, ein statisches Bild, mehrere dynamische Bilder – sollen die Auswirkungen visueller Elemente auf den Grad der Beschäftigung mit der Grafik (engagement) der Nutzerinnen und Nutzer untersucht werden. Dieser Teil der Studie konzentriert sich darauf, die Rolle von Bildern bei der Förderung des Verständnisses und der emotionalen Verbindung zu den Daten besser zu verstehen. Es geht darum, herauszufinden, wie Bilder dazu beitragen können, komplexe Informationen zugänglicher und greifbarer zu machen, und wie sie das emotionale Erleben und die kognitive Verarbeitung der Inhalte beeinflussen.

Zukünftige Forschungsrichtungen

Das KielSCN plant weitere Studien, die die Wirkung unterschiedlicher visueller Stile und Interaktionsebenen auf verschiedene Zielgruppen genauer untersuchen. Das Ziel ist, ein differenzierteres Verständnis für die Personalisierung in der Wissenschaftskommunikation zu entwickeln.

Fazit

Dieses Projekt zeigt nicht nur das Potenzial von KI-generierten Bildern für die Erstellung von emotional ansprechenden Visualisierungen, sondern bietet auch eine mögliche Grundlage für die Erforschung effektiver Wissenschaftskommunikationsstrategien. Mit der fortschreitenden Entwicklung der KI eröffnen sich spannende Möglichkeiten, komplexe wissenschaftliche Daten einem breiteren Publikum verständlich und zugänglich zu machen.

Über den Autor

Björn Schmidt war nach seinem Studium an der Muthesius Kunsthochschule freiberuflich als Kommunikationsdesigner im Bereich Editorialdesign und Webdesign tätig. Im KielSCN ist er als wissenschaftlicher Mitarbeiter der Muthesius Kunsthochschule für das Informationsdesign und das Corporate Design zuständig und gestaltet die Forschung mit: bschmidt@kielscn.de


Mitwirkende an der Studie:

Prof. Dr. Melanie Keller ist nach ihrer Promotion an der Universität Duisburg-Essen sowie weiteren Stationen ander Universität Konstanz und der Universität Salzburg seit dem Jahr 2016 am IPN tätig. Sie leitet als Junior Principal Investigator das transdisziplinäre Forschungszentrum für visuelle Wissenschaftskommunikation KielSCN und ist seit 2024 stellvertretende Leiterin derAbteilung Didaktik der Physik am IPN: keller@leibniz-ipn.de

Stephan Reiche ist seit 2023 Doktorand am IPN. Der studierte Psychologe ist im KielSCN tätig: reiche@leibniz-ipn.de