Warum Rollenspiele LLMs von Logik & Fakten ablenken

Stand: 21.05.2026 10:00 Uhr

Seit Jahren gilt es als Goldstandard, der KI im Prompt eine Rolle zuzuweisen: "Du bist ein erfahrener Data-Analyst" oder "Du bist ein weltweit geschätzter Chief Marketing Officer." Doch aktuelle Studien zeigen, dass Rollenspiele die Qualität der KI-Ergebnisse verringern, sobald es um logisches Schlussfolgern, faktische Korrektheit und die Vermeidung von Vorurteilen geht.

Als White et al. (2023) ihr "Persona Pattern" in ihrem Prompt-Engineering-Katalog beschrieben, wurde es allgemein als Best Practice angenommen. Und während das Persona-Prompting gut geeignet ist, um einen gewünschten sprachlichen Stil zu bestimmen, kommen aktuelle Studien überraschenderweise nun zu dem Ergebnis, dass Rollenspiele die Qualität der KI-Ergebnisse verringern, sobald es um logisches Schlussfolgern, faktische Korrektheit und die Vermeidung von Vorurteilen geht.

Das Problem mit Personas

Wenn man ein Large Language Model (LLM) anweist, als "Experte zu agieren", drängt man es dazu, eine Rolle zu spielen. Das "in-der-Rolle-bleiben" benötigt allerdings Rechenleistung und Aufmerksamkeit, was zu unerwarteten und schlechten Ergebnissen an anderer Stelle führen kann.

Schlechteres Schlussfolgern

Eine Studie zur Schlussfolgerungsfähigkeit bei Zero-Shot-Prompts von Kim et al. fand heraus, dass die Anweisung, eine Rolle zu spielen, die logischen und mathematischen Fähigkeiten eines LLMs dämpfen kann. Das Modell ist oft so sehr mit seiner zugewiesenen Rolle beschäftigt, dass es abgelenkt wird und die eigentliche Aufgabe vernachlässigt.

Genauigkeit vs. Alignment

Untersuchungen von Hu ergaben: Personas sind förderlich für das Einhalten von alignment-Anweisungen, z.B. Stilanweisungen, Verhaltensregeln und sprachliche Richtlinien, verschlechtern aber das Abrufen von im LLM verankerten Wissen.

Verstärkung von Vorurteilen

LLMs in bestimmte soziodemografische Rollen zu zwingen führt zu stereotypischen Schlussfolgerungen, fand eine systematische Auswertung von Lutz et al. aus dem Jahr 2025 über 15 intersektionale demografische Gruppen heraus. Demnach fällt es LLMs schwer, Randgruppen korrekt zu simulieren. Wenn Sie eine konkrete Rolle vorschlagen (z.B. "Du bist eine Frau mit hispano-amerikanischem Hintergrund"), fällt das LLM oft zurück auf flache, weitverbreitete Vorurteile und unauthentische, verzerrte Darstellungen der eigentlichen Kultur. Das LLM kann diese Vorurteile dann sogar verstärken (wenn es sich in die Rolle so richtig reinsteigert). Wenn Persona-Prompts bei technischen oder analytischen Aufgaben gute Ergebnisse liefern, liegt das gewöhnlich daran, dass die Persona implizierte Anweisungen quasi hineinschmuggelt. Die unten genannten Studien zeigen jedoch, dass es bei bestimmten Aufgabenstellungen besser ist, solche impliziten Anweisungen direkt anzugeben.

Die Lösung: Zweiteilige Workflows

Recherche und kreatives Schreiben in einen einzelnen Prompt zu packen, zwingt die KI ihre kognitiven Fähigkeiten aufzuteilen, also gleichzeitig für logische Konsistenz, Genauigkeit, die Tonalität und den sprachlichen Stil zu verwenden. Ein zweiteiliger Workflow teilt diese Aufgaben auf: Erst die Recherche, dann die Ausformulierung.

Ein Beispiel für eine Marketing-Kampagne:

1. Schritt - Recherche: Dieser Prompt kümmert sich um die logischen Schlussfolgerungen sowie die Datenextraktion. Da wir keine Halluzinationen und nur die reinen Fakten wollen, verwenden wie einen strengen Systemkontext und vermeiden Personas vollständig.

Prompt: "Systemkontext: Du machst die Faktenextraktion für eine Marketing-Kampagne. Du verarbeitest rohes Kunden-Feedback. Ziel: Analysiere die angehängten Reviews der Mitbewerber. Gib eine Liste der drei wichtigsten Kundenprobleme sowie der drei am häufigsten geforderten Funktionen in Stichpunkten aus. Füge keinen weiteren Text wie Konversation oder Marketing-Ratschläge hinzu."
Ergebnis: Reine Fakten, unbeeinflusst von eventuell durch eine Persona/Rolle angenommenen Vorurteilen.

Das Modell verschwendet keine Rechenleistung darauf wie ein erfahrener Analyst zu "klingen", sondern ruft lediglich die Fakten mit hoher Genauigkeit ab.

2. Schritt - Texten: Nachdem der Recherche-Prompt Fakten hoffentlich ohne Vorurteile oder Halluzinationen zusammengesucht hat, formuliert der zweite Prompt Werbe-Emails aus den Ergebnissen des ersten Prompts in dem angemessenen Stil und Zielgruppen entsprechender Ausdrucksweise. Ein Persona-Prompt ist in diesem Fall das perfekte Werkzeug.

Prompt: "Sei ein inspirierender, visionärer B2B-Texter, der innovative Chief Technology Officers ansprechen möchte. Schreibe eine kurze knackige Email-Sequenz aus drei Teilen, die darstellt, wie unser neues Produkt ihnen dabei helfen kann, ihre Vorgänge effizient zu skalieren. Verwende dazu genau die Kundenprobleme aus den folgenden Daten.
Daten: {{fakten_aus_dem_ersten_schritt}}"
Ergebnis: Mitreißender, positiver Marketingtext, der mit echten Daten unterfüttert ist.

Die KI kann ihre gesamte Aufmerksamkeit darauf verwenden, sich in der Rolle als visionärer Werbetexter auszuleben, ohne das Risiko einzugehen, die wichtigsten Marketing-Claims zu halluzinieren.

Fazit: Je nach gewünschtem Ergebnis vorgehen!

Sie brauchen eine Social-Media-Kampagne, die nach enthusiastischem Markenbotschafter klingt? Verwenden Sie eine Persona. Sie brauchen eine datengestützte Marktanalyse oder eine fehlerlos extrahierte Funktionsliste? Verwenden Sie einen neutralen Prompt mit expliziten Anweisungen oder einem Systemkontext.

Extra-Tipp "Jekyll & Hyde"-Methode

Im Zweifel können Sie die KI anweisen, für eine Aufgabe zwei Prompts erzeugen zu lassen: einmal komplett neutral und einmal mit Persona. Dann lassen Sie beide Prompts laufen und wählen Sie das beste Ergebnis. Dies kann eine KI übrigens auch sehr gut, was bei langen Ergebnissen hilfreich sein kann.

Happy Prompting!

Autor:

Ein Mann mit einer hellen Mütze und einer Brille lächelt vor einem schlichten weißen Hintergrund in die Kamera.

Sven Heyll

Software Developer

VIER

Quellen:
Hu, Z. (n.d.). Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM.
Kim, J., Yang, N., & Jung, K. (n.d.). Persona is a Double-Edged Sword: Rethinking the Impact of Role-play Prompts in Zero-shot Reasoning Tasks. ACL Anthology.
Lutz, M., Sen, I., Ahnert, G., Rogers, E., & Strohmaier, M. (2025). The Prompt Makes the Person(a): A Systematic Evaluation of Sociodemographic Persona Prompting for Large Language Models. arXiv.
White, J., et al. (2023). A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT. arXiv.

Zum Blog