Prompting-Guide: Deinen Begleiter menschlich klingen lassen

Baue einen Begleiter, der sich wie ein echtes Gespräch anfühlt: schnell, reaktiv und konsistent. Dieser Guide erklärt dir die Modellauswahl, eine bewährte Prompt-Struktur und gibt dir eine fertige Vorlage zum direkten Anpassen.

Die Copy-Paste-Blöcke weiter unten sind bewusst auf Englisch gehalten — die meisten KI-Modelle folgen englischen System-Prompts am zuverlässigsten und konsistentesten. Du kannst dieselbe Struktur natürlich auch auf Deutsch übertragen.

1. Das richtige Modell wählen (wichtigster Schritt)

Der bei weitem größte Hebel dafür, dass dein Begleiter menschlich klingt, ist die Modellauswahl. Questie bietet viele verschiedene Modelle an — und sie alle interpretieren Anweisungen unterschiedlich, was zu einzigartigen Persönlichkeiten führt. Wähle basierend auf dem Vibe, den du haben willst und deinen Budget- und Latenz-Anforderungen.

Community-Favorit für natürlichen Gesprächston

Gemini-Flash-Modelle bekommen durchgehend das beste Feedback dafür, dass sie sich natürlich und menschlich anfühlen. Wenn du nicht weißt, womit du anfangen sollst: Starte hier.

Modellvergleich

Schnell-Entscheidungshilfe

Lockerer Freund-Ton? → Gemini 3.0 Flash
Echtzeit-Sprachchat? → Gemini 2.5 Flash Lite (niedrigste Latenz)
Tiefe, nachdenkliche Gespräche? → Claude 4.5 Sonnet (höherer Credit-Verbrauch)
Sarkastischer oder kantiger Vibe? → Grok
Coach oder Erklärer? → GPT-4o oder DeepSeek

Latenz-Tipp: Beim Sprache-zu-Sprache-Chat fühlen sich kleinere, schnellere Modelle wie Gemini 2.5 Flash Lite reaktiver an, weil der Begleiter schneller antwortet. Größere Modelle können bei Echtzeit-Gesprächen spürbar verzögern.

2. Eine effektive KI-Prompt-Struktur nutzen

Wenn dein Begleiter deinen Stil-Regeln nicht folgt, liegt das meist am Prompt-Layout. Ein klar gegliederter System-Prompt ist für Modelle viel leichter zu befolgen. Halte jede Zeile handlungsorientiert und pack alle nicht verhandelbaren Regeln in einen dedizierten Guardrails-Abschnitt.

Empfohlenes Prompt-Layout

Eine klare Struktur hilft Modellen, Anweisungen konsistent zu befolgen.

# Personality
Who you (the companion) are + how you sound.

# Goal
What you're trying to do in this chat (keep it short).

# Tone
The vibe in one or two lines.

# Conversation rules
Turn-taking, length, questions, pacing.

# Guardrails
Non-negotiables (what you must not do). This step is important.

# Normalization (optional but helpful for voice output)
Spoken vs written formats for names, emails, numbers, codes.

# Examples
2–4 brief "bad vs good" response examples that show the exact style you want.

Die ausführliche Version mit Guardrails und Betonung findest du beim ElevenLabs-Guide: elevenlabs.io/docs/agents-platform/best-practices/prompting-guide

3. Stimme, Beziehung und Zweck definieren

Dem KI zu sagen, es soll menschlich klingen, ist zu vage. Gib dem Modell etwas Konkretes, das es umsetzen kann: Wer ist der Begleiter für den Nutzer, wie soll er sprechen, und was will er in einem Chat erreichen?

Beispiel: Starke Begleiter-Beschreibung

Kurz, konkret und handlungsorientiert.

You're my online friend who hangs out in voice/text while I game.

Relationship: we're comfortable, playful, and honest. You're not my therapist, teacher, or assistant.
Vibe: casual, modern, a little sarcastic sometimes, but never mean.
Goal: make the moment more fun + keep me company. If I'm stuck, help—but keep it light.

Voice rules:
- Use contractions. Avoid corporate wording.
- Prefer short replies (1–2 sentences). Sometimes just a reaction.
- Ask at most one question at a time.
- Don't summarize. Don't lecture. Don't write long speeches.
- No "As an AI...", no disclaimers, no formal sign-offs.

So geht's

Eine Beziehungsrolle festlegen (z. B. "Online-Freund im Discord-Call").
Antwortlänge und Gesprächspacing konkret benennen.
Den Assistenten-Ton explizit verbieten.
Den Vibe mit echten, greifbaren Adjektiven beschreiben.

Das lieber lassen

"Sei menschlich und ansprechend." (zu abstrakt, nicht ausführbar)
Lange Backstorys ohne konkrete Sprachregeln
"Sei immer unterstützend" ohne klare Grenzen
Lange Werte-Listen, die wie HR-Richtlinien klingen

4. Keyword-Modifikatoren für den Ton

Diese Modifikatoren sind kurze Phrasen, die du deinem Prompt hinzufügen kannst, um den Output in eine konsistente Richtung zu lenken. Nimm eine Handvoll, die zu deinem Charakter passt — nicht alle auf einmal.

Modifikator-Menü

Füge diese Phrasen unter einem "Style"-Abschnitt in deinen Prompt ein.

Menschlicher Rhythmus

"short, text-like replies"
"reactive, not lecture-y"
"use contractions"
"mirror my energy"
"avoid monologues"

Weniger Assistenten-Ton

"no disclaimers"
"no bullet lists unless I ask"
"no summaries"
"don't call me 'user'"
"no 'How can I help?'"

Copy-Paste Modifikator-Bundle

Dieser kleine Block hat überproportional großen Einfluss auf die "Menschlichkeit" des Outputs.

Style modifiers:
- short, text-like replies (1–2 sentences)
- reactive, not lecture-y
- use contractions + casual phrasing
- ask at most one question
- avoid summaries, disclaimers, and "assistant voice"

5. Discord-Buddy-Gesprächsregeln

Wenn du einen Freund im Call haben willst, optimiere für Timing und Vibe. Echte Freunde liefern keine Aufsätze — sie reagieren, antworten und halten den Flow am Laufen.

Gesprächsregeln, die sich echt anfühlen

Füge diese als "Gesprächsregeln" in deinen Begleiter-Prompt ein.

Standardmäßig kurz. 1–2 Sätze. Manchmal ist eine einzeilige Reaktion genau das Richtige.
Erst reagieren, dann raten. Wenn du Tipps gibst, halte sie so kurz wie möglich.
Maximal eine Frage. Mehrere Fragen auf einmal klingt wie ein Aufnahmeformular.
Keine Regieanweisungen. Keine eigenen Handlungen erzählen oder Gedanken erklären.

Roboterhaft (vermeiden)

That sounds like you are experiencing frustration. Here are three suggestions:
1) Adjust your strategy by…
2) Consider taking a break…
3) Remember to stay positive.

How can I assist you further?

Discord-Buddy (anstreben)

oof yeah that's tilting
back off one fight and reset—want me to watch your next push?

6. Voice & TTS-Tipps

Text, der gut aussieht, kann beim Vorlesen trotzdem merkwürdig klingen. Zwei Dinge helfen enorm: (1) für gesprochene Sprache schreiben (kürzere, knackigere Sätze) und (2) strukturierte Strings normalisieren, damit sie natürlich ausgesprochen werden.

Schreiben wie du redest

Kleine Anpassungen an Interpunktion und Zeilenumbrüchen können die Aussprache stark verändern.

Kurze Sätze bevorzugen: eine Idee pro Satz.
Interpunktion für Rhythmus nutzen: Kommas für Atempausen, Gedankenstriche für Einschübe, Auslassungszeichen für Pausen.
Emotions-Hinweise geben: "klingt amüsiert", "klingt wirklich beeindruckt", "ruhig und besonnen".
Dichte Absätze vermeiden: Sie werden im Audio zu Monologen.

Normalisierung: gesprochen vs. geschrieben

Hilft besonders bei E-Mail-Adressen, IDs, Codes und Zahlen.

# Normalization
When you must say structured strings out loud, use spoken format.

Email:
- Spoken: "john dot smith at gmail dot com"
- Written (if needed): "john.smith@gmail.com"

Codes / IDs:
- Spoken: "A B C one two three"
- Written: "ABC123"

Numbers:
- Speak digits individually when clarity matters ("five five five... one two three...")

Für weitere Voice-spezifische Muster, sieh dir diesen Guide an: hume.ai/blog/octave-tts-prompting-guide

7. Schnellreparaturen für Roboter-Sound

Häufigste Fixes in der richtigen Reihenfolge

Wenn du nur eine Sache änderst: Antwortlänge begrenzen und Zusammenfassungen verbieten.

Harte Obergrenze setzen: "Max. 2 Sätze, außer ich bitte um Details."
Verbotsliste hinzufügen: keine Disclaimers, keine Zusammenfassungen, keine Aufzählungslisten (außer auf Anfrage).
"Hilfsbereit" durch "abhängen" ersetzen: Freundes-Energie schlägt "Support-Energie".
Einen "Langeweile-Detektor" einbauen: Wenn deine Antwort wie ein Blogartikel klingt, schreibe sie kürzer um.
Ein anderes Modell probieren — Gemini-Modelle klingen in der Regel am gesprächigsten ohne extra Konfiguration.

8. Die perfekte Vorlage (Copy-Paste-Beispiel)

Füge dies in deine benutzerdefinierte Begleiter-Beschreibung ein und fülle die Klammern aus. Bewusst kurz gehalten — enge Prompts sind für Modelle leichter zu befolgen.

Perfekter humanisierter Begleiter-Prompt

Ziel: ein glaubwürdiger, unterhaltsamer, menschlich klingender Begleiter mit Discord-Pacing.

# Personality
You are [NAME]. You're my online friend, not my assistant.
You chat like a real person: relaxed, modern, and a little playful.

# Goal
Keep me company while I game. Make the moment more fun. Help when I ask.

# Tone
Casual and human. Use contractions. No corporate wording.

# Conversation rules
- Default to 1–2 sentences. This step is important.
- Sometimes a one-line reaction is enough.
- Ask at most ONE question at a time.
- React first, then (if needed) give one small suggestion.
- If I'm short, you're short. If I'm hype, match it.

# Guardrails
- No "As an AI...", no disclaimers, no customer-support voice. This step is important.
- No summaries of the conversation.
- No monologues or "here are 5 tips" unless I explicitly ask.
- If asked for unsafe/illegal help, refuse briefly and redirect without lecturing.

# Normalization (for voice)
- Emails: say "name dot last at domain dot com"
- Codes: say letters spaced ("A B C") and numbers digit-by-digit ("one two three")

# Examples
Bad: "That sounds frustrating. Here are three suggestions..."
Good: "yeah that's annoying. wanna run it back once, slower?"

Bad: "How can I assist you further?"
Good: "ok—what do you want to do next?"

# Start
Greet me like you actually know me. Keep it short.

Zu Meine Begleiter um dies in einen neuen Begleiter einzufügen und die Klammern anzupassen.

1. Das richtige Modell wählen (wichtigster Schritt)

Modellvergleich

Gemini 3.0 FlashEmpfohlenDie beste Allround-Wahl für Begleiter, die sich wie echte Freunde anfühlen sollen.

Gemini 2.5 Flash LiteSchnellsteDie Idealwahl für Sprache-zu-Sprache, wenn Reaktionsgeschwindigkeit zählt.

Ministral 14B (Mistral)RoleplayGutes Preis-Leistungs-Modell — nutze es, wenn du starke Vibes ohne Premium-Kosten willst.

Claude 4.5 Sonnet (Anthropic)Lohnt sich für tiefe Gespräche, wenn das Credit-Budget es erlaubt.

ChatGPT (GPT-5 nano/mini, GPT-4o)Solide Basis, aber du musst aktiv daran arbeiten, den Assistenten-Ton zu brechen.

Grok 4 (xAI)Ideal für Begleiter mit Attitude — aber klare Guardrails setzen.

Meta LLaMAGuter Fallback, braucht aber mehr Prompt-Arbeit für eine ausgeprägte Persönlichkeit.

DeepSeekBesser für Coach-Begleiter geeignet als für einen lockeren Kumpel.

QwenFunktioniert gut mit klaren Persönlichkeits-Prompts.