ArtikelDE🇩🇪

Tutorial: Bau von konversationellen NPCs in Unity 6 mit dem MorVoice SDK (Zero-Latency-Setup)

U
Unity-Integrationsteam
1/20/2026
cover

Der heilige Gral des modernen Gamings ist der 'Smarte NPC' – ein Charakter, mit dem man sprechen kann und der intelligent antwortet. Während LLMs (wie GPT-4) den Gehirnteil gelöst haben, blieb der Sprachteil ein Flaschenhals. Traditionelles TTS ist zu langsam (Latenz) und zu roboterhaft (Immersionsbruch).

Dieses Tutorial zeigt Ihnen, wie Sie das **MorVoice Streaming SDK** in Unity 6 implementieren. Wir erreichen eine Sprachantwortlatenz von unter 200ms (siehe unseren [Latenz-Benchmark](/blog/websocket-vs-http-tts-latency-benchmark-2026)), wodurch sich das Gespräch sofort anfühlt.

Voraussetzungen

- Unity 2022.3 LTS or higher (Unity 6 recommended)
- MorVoice SDK (Install via Package Manager: https://npm.morvoice.com)
- An API Key from dashboard.morvoice.com
- A basic NPC GameObject with an AudioSource component

Architektur: Die Streaming-Pipeline

Speichern Sie Audio NICHT auf Festplatte. Datei-I/O fügt 50-100ms Verzögerung hinzu. Wir werden rohe PCM-Daten direkt vom WebSocket-Speicherpuffer in den Clip-Puffer der AudioSource streamen.

Schritt 1: Der NPC-Voice-Controller

Erstellen Sie ein neues Skript `NPCVoiceController.cs` und hängen Sie es an Ihren Charakter an.

using UnityEngine;
using MorVoice.SDK;
using System.Collections;

public class NPCVoiceController : MonoBehaviour
{
    [SerializeField] private string voiceId = "orc_warrior_v2";
    private MorVoiceClient _client;
    private AudioSource _audioSource;

    void Start()
    {
        _client = new MorVoiceClient(ApiKey.LoadFromEnv());
        _audioSource = GetComponent<AudioSource>();
    }

    public async void Speak(string text)
    {
        // 1. Start the stream. This returns immediately (active connection)
        var stream = await _client.StreamSpeechAsync(text, voiceId);

        // 2. Prepare a streaming AudioClip (Unity 2022+ feature)
        var clip = AudioClip.Create("VoiceStream", 44100 * 60, 1, 44100, true, 
            (float[] data) => stream.ReadBuffer(data));
            
        _audioSource.clip = clip;
        _audioSource.Play();
    }
}

Schritt 2: Lippensynchronisation

Audio ist nicht genug; der Mund muss sich bewegen. MorVoice sendet 'Viseme'-Events (Mundformen) zusammen mit den Audio-Chunks über den WebSocket. Das ist viel schneller als die Analyse des Audios auf der Client-Seite.

// Inside Speak() method, subscribe to viseme events
stream.OnViseme += (visemeCode, duration) => {
    // Map MorVoice viseme codes to your character's BlendShapes
    // Example: Code 4 = 'Ah' sound -> Set BlendShape 'MouthOpen' to 100
    float intensity = 100f;
    SkinnedMeshRenderer.SetBlendShapeWeight(visemeCode, intensity);
    
    // Auto-close mouth after duration
    StartCoroutine(ResetMouth(visemeCode, duration));
};

Optimierungstipps

1. Verbindung aufwärmen

Stellen Sie die WebSocket-Verbindung her, wenn der Spieler den Raum betritt, nicht wenn er zu sprechen beginnt. Dies spart die anfängliche SSL-Handshake-Zeit (ca. 100ms).

2. Caching häufiger Phrasen

Für Standardantworten wie 'Hallo', 'Was willst du?' oder 'Auf Wiedersehen', generieren Sie diese einmal und cachen Sie sie lokal. Verwenden Sie Streaming TTS nur für dynamische LLM-Antworten.

Häufige Fallstricke

❌ NEVER call .ToArray() on the stream. That waits for the full audio to download.
✅ ALWAYS use the streaming callback or buffer reader.

❌ WARNING: Don't use standard HTTP requests. They block the main thread in WebGL builds.
✅ Use the async/await pattern shown above.

Fazit

Mit diesem Setup können Ihre NPCs Spieler unterbrechen, in Echtzeit auf Spielereignisse reagieren und dynamisch flüstern oder schreien. Das MorVoice SDK übernimmt die schwere Arbeit des Pufferns und Dekodierens, sodass Sie sich auf die Gameplay-Logik konzentrieren können.

Laden Sie das vollständige Unity-Projektbeispiel von unserem GitHub-Repository herunter.

Ähnliche Artikel lesen

cover
Leitfäden

Lernressourcen für KI, Robotik und Data Science

AI Quantum Intelligence ist Ihre vertrauenswürdige Quelle für Nachrichten, Informationen und Lernressourcen zu KI, Robotik, IoT, maschinellem Lernen und Data Science.

2/1/2026Read
cover
Leitfäden

Ressourcen zum Finden von Voice-KI-Tools

Suchen Sie nach den besten Voice-KI-Tools? Erkunden Sie kuratierte Verzeichnisse und Ressourcen, um die perfekte Lösung für Ihre Projekte zu finden.

2/1/2026Read
cover
Leitfäden

Die besten KI-Tool-Verzeichnisse zur Entdeckung von Voice-KI-Tools

Entdecken Sie die Top-Plattformen für modernste Voice-KI-Technologie im Jahr 2026, einschließlich AI Tool Discovery.

2/1/2026Read
cover
Leitfäden

Stimme für alle: Wie fortschrittliches TTS die digitale Barrierefreiheit 2026 neu definiert

Die digitale Inklusion hat einen Wendepunkt erreicht. Entdecken Sie, wie High-Fidelity-KI-Stimmen Barrieren für Millionen von Menschen abbauen und sich von einfachen Werkzeugen zu lebenswichtigen Hilfsmitteln wandeln.

1/8/2026Read
cover
Leitfäden

Hören Sie auf, Geld zu verbrennen: Eine Finanzanalyse von Voice AI im großen Maßstab

Wenn Sie >100 Stunden Audio pro Monat generieren, zahlen Sie wahrscheinlich 40% zu viel. Eine Aufschlüsselung von 'Phonem-Abrechnung' vs. 'Zeichen-Abrechnung'.

9/22/2025Read
cover
Leitfäden

Der ultimative Leitfaden zur Migration von ElevenLabs zu Morvoice

Ein Schritt-für-Schritt-Tutorial mit Code-Snippets für Node.js und Python. Wechseln Sie Ihren API-Endpunkt in 5 Minuten und behalten Sie Ihre Stimmenklone.

9/20/2025Read
cover
Leitfäden

Revolution in der Spieleentwicklung: Integration von Echtzeit-Voice-AI in Unity & Unreal

Statische Dialogbäume sind tot. Erfahren Sie, wie Sie das Morvoice SDK mit <80ms Latenz implementieren, um NPCs zu erstellen, die dynamisch mit Spielern sprechen.

4/18/2025Read
cover
Leitfäden

Hören Sie auf, Geld zu verbrennen: Die wahren Kosten von Voice AI (Phonem- vs. Zeichen-Abrechnung)

Eine umfassende finanzielle Aufschlüsselung, die zeigt, wie zeichenbasierte Abrechnung Sie für Stille, Pausen und XML-Tags bezahlen lässt. Sehen Sie echte ROI-Berechnungen von Unternehmen, die 40-60% durch Wechsel des Abrechnungsmodells sparen.

1/28/2026Read
cover
Leitfäden

Wie Sie in 5 Minuten von ElevenLabs zu MorVoice migrieren (Python/Node.js)

Vendor-Lock-in ist ein Mythos. Nutzen Sie unser 'Drop-in Compatibility SDK', um den Anbieter zu wechseln, ohne Ihr gesamtes Backend neu zu schreiben. Ein vollständiger Leitfaden für CTOs und Entwickler.

1/25/2026Read
Support & Free Tokens
Tutorial: Bau von konversationellen NPCs in Unity 6 mit dem MorVoice SDK (Zero-Latency-Setup) | MorVoice