
Warum Rollenspiele LLMs von Logik & Fakten ablenken
Stand: 21.05.2026 10:00 Uhr
Seit Jahren gilt es als Goldstandard, der KI im Prompt eine Rolle zuzuweisen: "Du bist ein erfahrener Data-Analyst" oder "Du bist ein weltweit geschätzter Chief Marketing Officer." Doch aktuelle Studien zeigen, dass Rollenspiele die Qualität der KI-Ergebnisse verringern, sobald es um logisches Schlussfolgern, faktische Korrektheit und die Vermeidung von Vorurteilen geht.
Als White et al. (2023) ihr "Persona Pattern" in ihrem Prompt-Engineering-Katalog beschrieben, wurde es allgemein als Best Practice angenommen. Und während das Persona-Prompting gut geeignet ist, um einen gewünschten sprachlichen Stil zu bestimmen, kommen aktuelle Studien überraschenderweise nun zu dem Ergebnis, dass Rollenspiele die Qualität der KI-Ergebnisse verringern, sobald es um logisches Schlussfolgern, faktische Korrektheit und die Vermeidung von Vorurteilen geht.
Das Problem mit Personas
Wenn man ein Large Language Model (LLM) anweist, als "Experte zu agieren", drängt man es dazu, eine Rolle zu spielen. Das "in-der-Rolle-bleiben" benötigt allerdings Rechenleistung und Aufmerksamkeit, was zu unerwarteten und schlechten Ergebnissen an anderer Stelle führen kann.
Schlechteres Schlussfolgern
Eine Studie zur Schlussfolgerungsfähigkeit bei Zero-Shot-Prompts von Kim et al. fand heraus, dass die Anweisung, eine Rolle zu spielen, die logischen und mathematischen Fähigkeiten eines LLMs dämpfen kann. Das Modell ist oft so sehr mit seiner zugewiesenen Rolle beschäftigt, dass es abgelenkt wird und die eigentliche Aufgabe vernachlässigt.
Genauigkeit vs. Alignment
Untersuchungen von Hu ergaben: Personas sind förderlich für das Einhalten von alignment-Anweisungen, z.B. Stilanweisungen, Verhaltensregeln und sprachliche Richtlinien, verschlechtern aber das Abrufen von im LLM verankerten Wissen.
Verstärkung von Vorurteilen
LLMs in bestimmte soziodemografische Rollen zu zwingen führt zu stereotypischen Schlussfolgerungen, fand eine systematische Auswertung von Lutz et al. aus dem Jahr 2025 über 15 intersektionale demografische Gruppen heraus. Demnach fällt es LLMs schwer, Randgruppen korrekt zu simulieren. Wenn Sie eine konkrete Rolle vorschlagen (z.B. "Du bist eine Frau mit hispano-amerikanischem Hintergrund"), fällt das LLM oft zurück auf flache, weitverbreitete Vorurteile und unauthentische, verzerrte Darstellungen der eigentlichen Kultur. Das LLM kann diese Vorurteile dann sogar verstärken (wenn es sich in die Rolle so richtig reinsteigert). Wenn Persona-Prompts bei technischen oder analytischen Aufgaben gute Ergebnisse liefern, liegt das gewöhnlich daran, dass die Persona implizierte Anweisungen quasi hineinschmuggelt. Die unten genannten Studien zeigen jedoch, dass es bei bestimmten Aufgabenstellungen besser ist, solche impliziten Anweisungen direkt anzugeben.
Die Lösung: Zweiteilige Workflows
Recherche und kreatives Schreiben in einen einzelnen Prompt zu packen, zwingt die KI ihre kognitiven Fähigkeiten aufzuteilen, also gleichzeitig für logische Konsistenz, Genauigkeit, die Tonalität und den sprachlichen Stil zu verwenden. Ein zweiteiliger Workflow teilt diese Aufgaben auf: Erst die Recherche, dann die Ausformulierung.
Ein Beispiel für eine Marketing-Kampagne:
1. Schritt - Recherche: Dieser Prompt kümmert sich um die logischen Schlussfolgerungen sowie die Datenextraktion. Da wir keine Halluzinationen und nur die reinen Fakten wollen, verwenden wie einen strengen Systemkontext und vermeiden Personas vollständig.
Das Modell verschwendet keine Rechenleistung darauf wie ein erfahrener Analyst zu "klingen", sondern ruft lediglich die Fakten mit hoher Genauigkeit ab.
2. Schritt - Texten: Nachdem der Recherche-Prompt Fakten hoffentlich ohne Vorurteile oder Halluzinationen zusammengesucht hat, formuliert der zweite Prompt Werbe-Emails aus den Ergebnissen des ersten Prompts in dem angemessenen Stil und Zielgruppen entsprechender Ausdrucksweise. Ein Persona-Prompt ist in diesem Fall das perfekte Werkzeug.
Die KI kann ihre gesamte Aufmerksamkeit darauf verwenden, sich in der Rolle als visionärer Werbetexter auszuleben, ohne das Risiko einzugehen, die wichtigsten Marketing-Claims zu halluzinieren.
Fazit: Je nach gewünschtem Ergebnis vorgehen!
Sie brauchen eine Social-Media-Kampagne, die nach enthusiastischem Markenbotschafter klingt? Verwenden Sie eine Persona. Sie brauchen eine datengestützte Marktanalyse oder eine fehlerlos extrahierte Funktionsliste? Verwenden Sie einen neutralen Prompt mit expliziten Anweisungen oder einem Systemkontext.
Extra-Tipp "Jekyll & Hyde"-Methode
Im Zweifel können Sie die KI anweisen, für eine Aufgabe zwei Prompts erzeugen zu lassen: einmal komplett neutral und einmal mit Persona. Dann lassen Sie beide Prompts laufen und wählen Sie das beste Ergebnis. Dies kann eine KI übrigens auch sehr gut, was bei langen Ergebnissen hilfreich sein kann.
Happy Prompting!
Autor:

Sven Heyll
Software Developer
VIER
Quellen:
Hu, Z. (n.d.). Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM.
Kim, J., Yang, N., & Jung, K. (n.d.). Persona is a Double-Edged Sword: Rethinking the Impact of Role-play Prompts in Zero-shot Reasoning Tasks. ACL Anthology.
Lutz, M., Sen, I., Ahnert, G., Rogers, E., & Strohmaier, M. (2025). The Prompt Makes the Person(a): A Systematic Evaluation of Sociodemographic Persona Prompting for Large Language Models. arXiv.
White, J., et al. (2023). A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT. arXiv.