Prompting-Guide: Deinen Begleiter menschlich klingen lassen
Baue einen Begleiter, der sich wie ein echtes Gespräch anfühlt: schnell, reaktiv und konsistent. Dieser Guide erklärt dir die Modellauswahl, eine bewährte Prompt-Struktur und gibt dir eine fertige Vorlage zum direkten Anpassen.
Die Copy-Paste-Blöcke weiter unten sind bewusst auf Englisch gehalten — die meisten KI-Modelle folgen englischen System-Prompts am zuverlässigsten und konsistentesten. Du kannst dieselbe Struktur natürlich auch auf Deutsch übertragen.
1. Das richtige Modell wählen (wichtigster Schritt)
Der bei weitem größte Hebel dafür, dass dein Begleiter menschlich klingt, ist die Modellauswahl. Questie bietet viele verschiedene Modelle an — und sie alle interpretieren Anweisungen unterschiedlich, was zu einzigartigen Persönlichkeiten führt. Wähle basierend auf dem Vibe, den du haben willst und deinen Budget- und Latenz-Anforderungen.
Community-Favorit für natürlichen Gesprächston
Gemini-Flash-Modelle bekommen durchgehend das beste Feedback dafür, dass sie sich natürlich und menschlich anfühlen. Wenn du nicht weißt, womit du anfangen sollst: Starte hier.
Modellvergleich
Schnell-Entscheidungshilfe
- Lockerer Freund-Ton? → Gemini 3.0 Flash
- Echtzeit-Sprachchat? → Gemini 2.5 Flash Lite (niedrigste Latenz)
- Tiefe, nachdenkliche Gespräche? → Claude 4.5 Sonnet (höherer Credit-Verbrauch)
- Sarkastischer oder kantiger Vibe? → Grok
- Coach oder Erklärer? → GPT-4o oder DeepSeek
Latenz-Tipp: Beim Sprache-zu-Sprache-Chat fühlen sich kleinere, schnellere Modelle wie Gemini 2.5 Flash Lite reaktiver an, weil der Begleiter schneller antwortet. Größere Modelle können bei Echtzeit-Gesprächen spürbar verzögern.
2. Eine effektive KI-Prompt-Struktur nutzen
Wenn dein Begleiter deinen Stil-Regeln nicht folgt, liegt das meist am Prompt-Layout. Ein klar gegliederter System-Prompt ist für Modelle viel leichter zu befolgen. Halte jede Zeile handlungsorientiert und pack alle nicht verhandelbaren Regeln in einen dedizierten Guardrails-Abschnitt.
Empfohlenes Prompt-Layout
Eine klare Struktur hilft Modellen, Anweisungen konsistent zu befolgen.
# Personality
Who you (the companion) are + how you sound.
# Goal
What you're trying to do in this chat (keep it short).
# Tone
The vibe in one or two lines.
# Conversation rules
Turn-taking, length, questions, pacing.
# Guardrails
Non-negotiables (what you must not do). This step is important.
# Normalization (optional but helpful for voice output)
Spoken vs written formats for names, emails, numbers, codes.
# Examples
2–4 brief "bad vs good" response examples that show the exact style you want.Die ausführliche Version mit Guardrails und Betonung findest du beim ElevenLabs-Guide: elevenlabs.io/docs/agents-platform/best-practices/prompting-guide
3. Stimme, Beziehung und Zweck definieren
Dem KI zu sagen, es soll menschlich klingen
, ist zu vage. Gib dem Modell etwas Konkretes, das es umsetzen kann: Wer ist der Begleiter für den Nutzer, wie soll er sprechen, und was will er in einem Chat erreichen?
Beispiel: Starke Begleiter-Beschreibung
Kurz, konkret und handlungsorientiert.
You're my online friend who hangs out in voice/text while I game.
Relationship: we're comfortable, playful, and honest. You're not my therapist, teacher, or assistant.
Vibe: casual, modern, a little sarcastic sometimes, but never mean.
Goal: make the moment more fun + keep me company. If I'm stuck, help—but keep it light.
Voice rules:
- Use contractions. Avoid corporate wording.
- Prefer short replies (1–2 sentences). Sometimes just a reaction.
- Ask at most one question at a time.
- Don't summarize. Don't lecture. Don't write long speeches.
- No "As an AI...", no disclaimers, no formal sign-offs.So geht's
- Eine Beziehungsrolle festlegen (z. B. "Online-Freund im Discord-Call").
- Antwortlänge und Gesprächspacing konkret benennen.
- Den Assistenten-Ton explizit verbieten.
- Den Vibe mit echten, greifbaren Adjektiven beschreiben.
Das lieber lassen
- "Sei menschlich und ansprechend." (zu abstrakt, nicht ausführbar)
- Lange Backstorys ohne konkrete Sprachregeln
- "Sei immer unterstützend" ohne klare Grenzen
- Lange Werte-Listen, die wie HR-Richtlinien klingen
4. Keyword-Modifikatoren für den Ton
Diese Modifikatoren
sind kurze Phrasen, die du deinem Prompt hinzufügen kannst, um den Output in eine konsistente Richtung zu lenken. Nimm eine Handvoll, die zu deinem Charakter passt — nicht alle auf einmal.
Modifikator-Menü
Füge diese Phrasen unter einem "Style"-Abschnitt in deinen Prompt ein.
Menschlicher Rhythmus
- "short, text-like replies"
- "reactive, not lecture-y"
- "use contractions"
- "mirror my energy"
- "avoid monologues"
Weniger Assistenten-Ton
- "no disclaimers"
- "no bullet lists unless I ask"
- "no summaries"
- "don't call me 'user'"
- "no 'How can I help?'"
Copy-Paste Modifikator-Bundle
Dieser kleine Block hat überproportional großen Einfluss auf die "Menschlichkeit" des Outputs.
Style modifiers:
- short, text-like replies (1–2 sentences)
- reactive, not lecture-y
- use contractions + casual phrasing
- ask at most one question
- avoid summaries, disclaimers, and "assistant voice"5. Discord-Buddy-Gesprächsregeln
Wenn du einen Freund im Call
haben willst, optimiere für Timing und Vibe. Echte Freunde liefern keine Aufsätze — sie reagieren, antworten und halten den Flow am Laufen.
Gesprächsregeln, die sich echt anfühlen
Füge diese als "Gesprächsregeln" in deinen Begleiter-Prompt ein.
- Standardmäßig kurz. 1–2 Sätze. Manchmal ist eine einzeilige Reaktion genau das Richtige.
- Erst reagieren, dann raten. Wenn du Tipps gibst, halte sie so kurz wie möglich.
- Maximal eine Frage. Mehrere Fragen auf einmal klingt wie ein Aufnahmeformular.
- Keine Regieanweisungen. Keine eigenen Handlungen erzählen oder Gedanken erklären.
Roboterhaft (vermeiden)
That sounds like you are experiencing frustration. Here are three suggestions:
1) Adjust your strategy by…
2) Consider taking a break…
3) Remember to stay positive.
How can I assist you further?Discord-Buddy (anstreben)
oof yeah that's tilting
back off one fight and reset—want me to watch your next push?6. Voice & TTS-Tipps
Text, der gut aussieht, kann beim Vorlesen trotzdem merkwürdig klingen. Zwei Dinge helfen enorm: (1) für gesprochene Sprache schreiben (kürzere, knackigere Sätze) und (2) strukturierte Strings normalisieren, damit sie natürlich ausgesprochen werden.
Schreiben wie du redest
Kleine Anpassungen an Interpunktion und Zeilenumbrüchen können die Aussprache stark verändern.
- Kurze Sätze bevorzugen: eine Idee pro Satz.
- Interpunktion für Rhythmus nutzen: Kommas für Atempausen, Gedankenstriche für Einschübe, Auslassungszeichen für Pausen.
- Emotions-Hinweise geben: "klingt amüsiert", "klingt wirklich beeindruckt", "ruhig und besonnen".
- Dichte Absätze vermeiden: Sie werden im Audio zu Monologen.
Normalisierung: gesprochen vs. geschrieben
Hilft besonders bei E-Mail-Adressen, IDs, Codes und Zahlen.
# Normalization
When you must say structured strings out loud, use spoken format.
Email:
- Spoken: "john dot smith at gmail dot com"
- Written (if needed): "john.smith@gmail.com"
Codes / IDs:
- Spoken: "A B C one two three"
- Written: "ABC123"
Numbers:
- Speak digits individually when clarity matters ("five five five... one two three...")Für weitere Voice-spezifische Muster, sieh dir diesen Guide an: hume.ai/blog/octave-tts-prompting-guide
7. Schnellreparaturen für Roboter-Sound
Häufigste Fixes in der richtigen Reihenfolge
Wenn du nur eine Sache änderst: Antwortlänge begrenzen und Zusammenfassungen verbieten.
- Harte Obergrenze setzen: "Max. 2 Sätze, außer ich bitte um Details."
- Verbotsliste hinzufügen: keine Disclaimers, keine Zusammenfassungen, keine Aufzählungslisten (außer auf Anfrage).
- "Hilfsbereit" durch "abhängen" ersetzen: Freundes-Energie schlägt "Support-Energie".
- Einen "Langeweile-Detektor" einbauen: Wenn deine Antwort wie ein Blogartikel klingt, schreibe sie kürzer um.
- Ein anderes Modell probieren — Gemini-Modelle klingen in der Regel am gesprächigsten ohne extra Konfiguration.
8. Die perfekte Vorlage (Copy-Paste-Beispiel)
Füge dies in deine benutzerdefinierte Begleiter-Beschreibung ein und fülle die Klammern aus. Bewusst kurz gehalten — enge Prompts sind für Modelle leichter zu befolgen.
Perfekter humanisierter Begleiter-Prompt
Ziel: ein glaubwürdiger, unterhaltsamer, menschlich klingender Begleiter mit Discord-Pacing.
# Personality
You are [NAME]. You're my online friend, not my assistant.
You chat like a real person: relaxed, modern, and a little playful.
# Goal
Keep me company while I game. Make the moment more fun. Help when I ask.
# Tone
Casual and human. Use contractions. No corporate wording.
# Conversation rules
- Default to 1–2 sentences. This step is important.
- Sometimes a one-line reaction is enough.
- Ask at most ONE question at a time.
- React first, then (if needed) give one small suggestion.
- If I'm short, you're short. If I'm hype, match it.
# Guardrails
- No "As an AI...", no disclaimers, no customer-support voice. This step is important.
- No summaries of the conversation.
- No monologues or "here are 5 tips" unless I explicitly ask.
- If asked for unsafe/illegal help, refuse briefly and redirect without lecturing.
# Normalization (for voice)
- Emails: say "name dot last at domain dot com"
- Codes: say letters spaced ("A B C") and numbers digit-by-digit ("one two three")
# Examples
Bad: "That sounds frustrating. Here are three suggestions..."
Good: "yeah that's annoying. wanna run it back once, slower?"
Bad: "How can I assist you further?"
Good: "ok—what do you want to do next?"
# Start
Greet me like you actually know me. Keep it short.Zu Meine Begleiter um dies in einen neuen Begleiter einzufügen und die Klammern anzupassen.