Wie wir Kreativität messen – und warum KI dabei alles verändert
Kreativitätsbewertung ist längst nicht mehr nur ein Thema für Psycholog:innen, sondern spielt zunehmend auch in der Entwicklung künstlicher Intelligenz eine Schlüsselrolle. Wenn Algorithmen heute Texte schreiben, Bilder generieren oder Musik komponieren, stellt sich die Frage: Wie lässt sich überhaupt erkennen, ob etwas wirklich „kreativ“ ist? Und noch wichtiger: Was bedeutet diese neue Form maschineller Originalität für die Förderung menschlicher Talente?
Warum wir kreative Leistungen überhaupt messen wollen
In der klassischen Psychologie wurde lange Zeit vor allem Intelligenz gemessen. Viele Testverfahren sind so normiert, dass der durchschnittliche IQ auf 100 mit einer Standardabweichung von 15 festgelegt ist – eine saubere statistische Grundlage, um Personen miteinander zu vergleichen. Kreativität hingegen entzieht sich scheinbar klaren Kennzahlen: Ein Einfall kann genial, verrückt oder beides zugleich sein.
Trotzdem gibt es gute Gründe, kreative Leistungen systematisch zu erfassen. In Bildung, Beruf und Forschung geht es nicht nur darum zu wissen, wie klug jemand ist, sondern auch, wie gut eine Person:
- ungewöhnliche Verknüpfungen herstellen kann,
- neue Lösungswege findet und
- Ideen in konkrete Ergebnisse übersetzt.
Während Intelligenztests wie sprachliche Analogien oder Matrizenaufgaben eher die Effizienz und Präzision unseres Denkens abbilden, versuchen kreative Tests, Originalität, Flexibilität und Vielfalt von Ideen zu erfassen. In der Intelligenzdiagnostik werden etwa Ravens Progressive Matrizen häufig genutzt, um abstraktes, figürliches Denken zu bewerten. Für Kreativität braucht es dagegen eher Aufgaben, bei denen Teilnehmende mit offenen Fragestellungen, unvollständigen Bildern oder unstrukturierten Reizen arbeiten.
Hier wird deutlich: Wenn wir verstehen wollen, wie Menschen und KI in Zukunft zusammenarbeiten, müssen wir genauer hinschauen, was wir unter kreativer Leistung überhaupt verstehen – und wie wir sie verlässlich erfassen können.
Ein Blick ins KI-Labor: Wie Maschinen „kreativ“ werden
Stellen wir uns eine Entwicklergruppe in einem KI-Start-up vor. Ihr Ziel: Ein System, das neue Produktideen für nachhaltige Verpackungen generiert. Anfangs spuckt das Modell vor allem Varianten bereits existierender Lösungen aus – hübsch formuliert, aber wenig überraschend. Die Stimmung ist verhalten. „Wenn das alles ist, brauchen wir kein KI-Team“, murmelt jemand.
Doch dann ändert das Team seinen Ansatz. Statt nur große Datenmengen über existierende Verpackungen zu füttern, kombinieren die Forschenden mehrere Strategien:
- Sie geben dem Modell widersprüchliche Ziele (extrem stabil, aber komplett kompostierbar).
- Sie lassen es bewusst mit unvollständigen Informationen arbeiten.
- Sie bewerten die Ausgaben nicht nur nach Funktion, sondern auch nach Neuheitsgrad.
Auf einmal entstehen skizzenhafte Konzepte, die menschliche Designer:innen so noch nicht formuliert hatten. Viele davon sind unpraktisch, einige physikalisch kaum umsetzbar – aber zwischendrin tauchen Vorschläge auf, die die Entwicklungsabteilung ernsthaft weiterverfolgt.
Was ist hier passiert? Die kreative Leistung der KI beruht auf statistischer Mustererkennung in Kombination mit Mechanismen, die Zufall, Variation und Widerspruch gezielt nutzen. Um zu prüfen, ob diese Ergebnisse tatsächlich innovativ sind, verwenden Forschende zunehmend Methoden, die an psychologische Kreativtests erinnern: Expert:innen beurteilen Neuheit und Nützlichkeit, oder es werden menschliche und maschinelle Ideen blind miteinander verglichen.
Anders als bei etablierten Intelligenzmaßen – für die es Normwerte, Reliabilitätsangaben und Gütekriterien gibt – befindet sich die Messung KI-basierter Originalität noch im Aufbau. Dennoch zeigt sich ein Muster: Je vielfältiger die Trainingsdaten, je freier die Problemformulierung und je stärker die Bewertung an Neuheit und Nützlichkeit gekoppelt ist, desto eher erzeugt eine KI Ergebnisse, die wir als „kreativ“ erleben.
Wenn Tests auf Menschen treffen: Chancen und Stolpersteine
Die Entwicklung kreativer KI-Modelle wirkt unmittelbar auf die Art zurück, wie wir menschliche Kreativität einschätzen. In Recruiting, Hochschulzulassung oder Talentförderprogrammen werden heute vermehrt Tools eingesetzt, die kreative Problemlösefähigkeiten digitalen Tests überlassen. Das bietet Chancen – aber auch Risiken.
Ein Vorteil: Digitale Testverfahren können sehr schnell sehr viele Ideen erfassen, sie automatisch clustern und nach Kriterien wie Originalität, Umsetzbarkeit oder Komplexität sortieren. Lehrkräfte, Coaches oder Personalabteilungen erhalten dadurch strukturiertere Einblicke, als wenn sie nur offene Aufgaben „nach Gefühl“ bewerten.
Gleichzeitig dürfen wir psychometrische Grundlagen nicht ignorieren. Aus der Intelligenzdiagnostik wissen wir, dass Übungseffekte existieren: Wenn Menschen mit Testformaten vertraut sind, können sich ihre Ergebnisse allein deshalb leicht verbessern, ohne dass sich die zugrunde liegende Fähigkeit stark verändert hat. Das gilt auch für kreative Tests, insbesondere wenn sie immer denselben Aufgabentyp verwenden (zum Beispiel „Denke dir möglichst viele Verwendungen für einen Ziegelstein aus“).
Hinzu kommt: Viele Menschen mit hohen kreativen Potenzialen – etwa neurodivergente Personen, Personen mit ADHS oder unkonventionellen Lernbiografien – schneiden in streng standardisierten Testumgebungen oft schlechter ab, als es ihrem tatsächlichen Talent entspricht. Sie denken in Sprüngen, lassen sich leichter ablenken oder sind unter Zeitdruck blockiert. Digitale Kreativtests, die zu stark auf Geschwindigkeit und Formalität setzen, können dieses Potenzial übersehen.
Der entscheidende Punkt: Bewertungsverfahren sollten nie zum starren Gatekeeper werden, sondern als Diagnose- und Reflexionsinstrument dienen. Das gilt sowohl für die Entwicklung von KI-Systemen als auch für die Begleitung menschlicher Lern- und Karrierewege.
Praktische Wege, die eigene schöpferische Leistung zu messen und zu stärken
Wie lässt sich all das im Alltag nutzen, ohne selbst ein Forschungslabor zu betreiben? Im Kern geht es darum, formale Tests mit reflektierter Selbstbeobachtung und gezielten Übungsformaten zu verbinden.
1. Mehrdimensional statt eindimensional denken
Einzelne Tests – ob klassischer Intelligenztest, kreativer Assoziationstest oder Online-Tool – geben immer nur Ausschnitte wieder. Für eine fundierte Einschätzung lohnt es sich, verschiedene Perspektiven zu kombinieren:
- Kurztests zu divergenten Ideen (wie viele verschiedene Einfälle du generierst),
- Rückmeldungen aus realen Projekten (z.B. von Lehrkräften, Teamleitungen, Kund:innen) und
- Selbstreflexion: In welchen Situationen entstehen dir besonders häufig neue Ideen?
Wenn du einen Kreativitätstest online machst, nutze ihn also eher als Startpunkt für weitere Beobachtungen. Starte den Test jetzt – aber frage dich im Anschluss vor allem, welche Art von Aufgaben dir leichtfällt und welche dich eher blockiert.
2. KI als Spiegel für eigenes Denken verwenden
Ein spannender Effekt der aktuellen KI-Entwicklung: Du kannst viele Modelle heute direkt als kreativen Sparringspartner nutzen. Gib einer Text-KI beispielsweise dieselbe offene Aufgabe, die du selbst bearbeitest („Entwirf ein Lernkonzept für Englisch, das speziell auf Menschen mit Konzentrationsschwierigkeiten zugeschnitten ist“), und vergleiche dann:
- Welche Aspekte decken sich mit deinen Ideen?
- Wo ergänzt die KI etwas, an das du nicht gedacht hast?
- Welche Vorschläge erscheinen dir zwar originell, aber realitätsfern?
So entsteht eine Art dialogische Bewertung: Du nutzt die Stärke der KI, große Wissensräume zu durchsuchen, und setzt deine eigene Erfahrung und Intuition als Filter ein. Das schärft nicht nur deine Einschätzung, wie originell deine eigenen Vorschläge sind, sondern trainiert auch metakognitive Fähigkeiten – die Fähigkeit, über das eigene Denken nachzudenken.
3. Strukturiert üben, ohne in Testlogik zu verfallen
Weil wir wissen, dass Übungseffekte auftreten, lohnt es sich, Kreativitätsaufgaben bewusst zu trainieren – allerdings mit einem klaren Ziel: nicht, um Tests „auszutricksen“, sondern um eigene Denkwege zu erweitern. Du kannst zum Beispiel:
- regelmäßig Alltagsobjekte auswählen und dir alternative Nutzungen überlegen,
- Bilder oder Symbole nutzen, um Geschichten zu erfinden, oder
- bestehende Lösungen (Apps, Lernkonzepte, Produkte) gezielt „kaputtdenken“ und neu zusammensetzen.
Dokumentiere deine Ideen über einige Wochen, etwa in einem Notizbuch oder einer Kreativitäts-App. Schau dir danach an, ob deine Einfälle vielfältiger, mutiger oder strukturierter geworden sind. Dieses Vorgehen liefert dir eine persönlichere, kontextnahe Ergänzung zu standardisierten Testwerten.
4. Die Rolle formaler Kreativitätsbewertung kritisch reflektieren
Formale Verfahren können wertvolle Orientierung bieten – etwa bei der Studien- und Berufswahl, in Förderprogrammen oder in der klinisch-psychologischen Forschung. Gleichzeitig sollten sie niemals als endgültiges Urteil verstanden werden. Kein Test kann erfassen, wie du mit Rückschlägen umgehst, welchen Sinn du in deiner Arbeit siehst oder wie sehr dich ein Thema emotional berührt – alles Faktoren, die reale kreative Leistungen massiv beeinflussen.
Sieh formale Ergebnisse deshalb als Hypothesen, nicht als Etikett. Wenn ein Testergebnis deine Selbstwahrnehmung widerspricht, lohnt sich die Frage: Lag es an der Aufgabengestaltung, an der Tagesform, an äußeren Rahmenbedingungen – oder zeigt sich hier vielleicht eine Fähigkeit, die du bislang unterschätzt hast?
Zusammenspiel von Mensch und Maschine: Ein Zukunftsbild
Je besser wir verstehen, wie KI zu scheinbar kreativen Ergebnissen gelangt, desto klarer wird auch, worin die Besonderheit menschlicher Kreativität liegt. Maschinen können heute in Sekunden tausende Varianten generieren, Kombinationen durchprobieren und Muster erkennen, die wir übersehen würden. Menschen bringen dafür etwas ein, was sich nur schwer in Algorithmen pressen lässt: Perspektivenwechsel, biografische Prägung, Werte, Humor, moralische Abwägungen.
In dieser Kombination entsteht ein starkes Zukunftsbild: KI liefert Möglichkeitsräume, Menschen wählen aus, interpretieren, gewichten und setzen um. Eine durchdachte Herangehensweise an die Bewertung kreativer Leistungen – bei Menschen wie bei Maschinen – kann helfen, diese Kooperation fair und transparent zu gestalten.
Am Ende geht es weniger darum, ob eine KI „kreativer“ ist als ein Mensch, sondern darum, welche Fragen wir stellen, welche Probleme wir lösen wollen und wie wir sicherstellen, dass unsere Verfahren zur Einschätzung von Ideenentwicklung verantwortungsvoll, diversitätssensibel und lernoffen bleiben. Genau hier hat eine reflektierte Kreativitätsbewertung ihren Platz: als Kompass, nicht als Richterin.
Häufige Fragen zur kreativen Leistung in Zeiten von KI
Wie unterscheiden sich Intelligenztests von Verfahren zur Messung kreativer Fähigkeiten?
Intelligenztests zielen vor allem auf die Effizienz und Genauigkeit von Informationsverarbeitung ab – etwa beim logischen Schließen, beim Erfassen von Mustern oder bei sprachlichen Problemen. Sie sind stark standardisiert und häufig wie bei klassischen IQ-Tests normiert, sodass ein Wert von 100 den Durchschnitt der Bevölkerung repräsentiert. Kreative Tests dagegen arbeiten meist mit offenen Aufgaben, mehreren richtigen Lösungen und subjektiveren Bewertungskriterien wie Originalität oder Nützlichkeit einer Idee.
Kann KI die Kreativität von Menschen objektiv beurteilen?
KI-Systeme können dabei helfen, große Mengen an Ideen zu strukturieren, zu clustern und nach vordefinierten Kriterien zu bewerten, etwa nach thematischer Vielfalt oder sprachlicher Komplexität. Vollständig objektiv ist diese Beurteilung jedoch nicht, weil schon die Auswahl der Trainingsdaten und der Bewertungsmaßstäbe Wertentscheidungen enthält. Am sinnvollsten ist es, KI als Unterstützungstool einzusetzen, das menschliche Einschätzungen ergänzt, nicht ersetzt.
Wie kann ich meine eigene kreative Entwicklung über längere Zeit verfolgen?
Eine gute Möglichkeit ist, langfristig an wiederkehrenden Aufgaben zu arbeiten und die Ergebnisse systematisch zu dokumentieren: Ideenlisten, Skizzen, Konzepte oder kreative Problemlösungen im Alltag. Wenn du diese im Abstand von mehreren Wochen oder Monaten vergleichst, erkennst du häufig, ob deine Einfälle vielfältiger, konkreter oder umsetzungsorientierter werden. Ergänzend können punktuelle Testverfahren sowie Feedback aus deinem Umfeld helfen, ein differenziertes Bild deiner kreativen Entwicklung zu erhalten.


Verwandte Ressourcen
Kreativitätsbewertung: verbessere deine Ergebnisse durch Übung und Fortschrittsmessung.