ArticleAR🇺🇸

ما وراء SSML: التحكم في الهمس والصراخ والبكاء عبر واجهة برمجة التطبيقات

ف
فريق المنتج
1/18/2026
cover

إذا طلبت من محرك TTS القياسي أن يقول 'أنا غاضب جداً الآن'، فسيقولها بنفس الهدوء. هذا التنافر يكسر ثقة المستخدم.

تيح لك MorVoice التحكم في هذا التنغيم الصوتي ليس فقط من خلال فئات واسعة، ولكن باستخدام **ناقلات النمط القياسية**.

واجهة برمجة تطبيقات متجه النمط

وسم العواطف الأساسي

// Simple request
{
  "text": "Get out of my office!",
  "emotion": "anger"
}

يختار هذا نمط 'الغضب' الافتراضي. لكن المشاعر البشرية دقيقة.

خلط قياسي متقدم

نحن نكشف عن 6 أبعاد أساسية للعاطفة: السعادة، الحزن، الغضب، الخوف، الاشمئزاز، والمفاجأة.

// Complex 'passive-aggressive' mix
{
  "text": "Oh, sure, that's a great idea.",
  "emotion": {
    "anger": 0.3,    // Underlying tension
    "happiness": 0.6, // Fake politeness
    "disgust": 0.2    // Subtle judgment
  },
  "voice_settings": {
    "speed": 0.9,     // Slightly slower for emphasis
    "pitch": -1.0     // Lower tone
  }
}

والنتيجة هي أداء ساخر بشكل مخيف لا يمكن لأي نموذج قياسي إنتاجه.

ذكاء اصطناعي سياقي ديناميكي

تكمن القوة الحقيقية عند توصيل هذا بـ LLM. اطلب من GPT-4 إخراج متجه نمط JSON جنباً إلى جنب مع الرد النصي.

# System Prompt for GPT-4
SYSTEM_PROMPT = """
You are a helpful assistant. 
Analyze the sentiment of your reply and provide emotion scores (0.0-1.0).
Format: JSON
"""

# GPT-4 Output:
{
  "message": "I'm so sorry to hear that your account was locked. That must be frustrating.",
  "emotion": {
    "sadness": 0.7,   // Empathy
    "anger": 0.1      // Mirroring user frustration
  }
}

حالات الاستخدام

1. الكتب الصوتية

يمكن للشخصيات الهمس أثناء مشاهد التخفي أو الصراخ أثناء المعارك. يتحكم معامل 'الإسقاط' في المسافة المحاكية.

2. بوتات العلاج

يحتاج البوت الذي يتعامل مع مواضيع حساسة إلى أن يبدو لطيفاً ومطمئناً (دفء عالٍ، سرعة منخفضة).

مثال على الكود: وظيفة 'الشياح'

async function shout(text) {
  return await morvoice.generate({
    text: text,
    style: {
      projection: "shout", // Special mode for loud projection
      anger: 0.8,
      excitement: 0.5
    },
    // IMPORTANT: Turn on clipping protection for loud audio
    post_processing: { normalize: true }
  });
}

الخلاصة

العاطفة هي واجهة برمجة تطبيقات الإنسانية. تحول MorVoice 'قارئ النص' إلى 'ممثل رقمي'.

Read Next

cover
منتج

مخطط المبدع: توسيع نطاق المحتوى العالمي باستخدام استنساخ الصوت بالذكاء الاصطناعي

تعلم أسرار كبار المبدعين في العالم الذين يستخدمون استنساخ الصوت بالذكاء الاصطناعي للوصول إلى المليارات.

1/12/2026Read
cover
منتج

ما وراء الاستنساخ 'الروبوتي': علم Neural-Resonance™

لماذا غالباً ما تبدو الأصوات المستنسخة معدنية؟ نشرح العيوب في شبكات GAN التقليدية وكيف تلتقط بنية Diffusion Transformer الخاصة بنا 'روح' الصوت.

10/1/2025Read
cover
منتج

كيفية خفض تكاليف الذكاء الاصطناعي الصوتي بنسبة 50٪ دون فقدان الجودة

توقف عن الدفع مقابل الصمت وعلامات XML. تعمق في فوترة 'Active Phoneme' من Morvoice مقابل نموذج عدد الأحرف في ElevenLabs.

10/15/2025Read
cover
منتج

أصلي حقيقي: دعم 50+ لغة بلهجات إقليمية

لا ترضى بالألمانية الأمريكية. تقدم Morvoice لهجات خاصة بالمنطقة (البافارية، السويسرية، النمساوية) لتجارب محلية فائقة.

6/12/2025Read
cover
منتج

دبلجة الذكاء الاصطناعي الآلية: توسيع نطاق وصولك على يوتيوب إلى المليارات

كيفية استخدام 'استنساخ الصوت عبر اللغات' من Morvoice لدبلجة مقاطع الفيديو إلى الإسبانية والألمانية واليابانية مع الحفاظ على نبرة المتحدث الأصلي.

3/22/2025Read
cover
منتج

الدليل الكامل لـ Amazon SES لمسوقي البريد الإلكتروني

الدليل الكامل لـ Amazon SES لمسوقي البريد الإلكتروني...

1/1/2026Read
cover
منتج

تكامل Mailwarm API: برنامج تعليمي كامل

تكامل Mailwarm API: برنامج تعليمي كامل...

1/4/2026Read
cover
منتج

وضع صندوق الوارد في Gmail: تجنب مجلد الرسائل غير المرغوب فيها

وضع صندوق الوارد في Gmail: تجنب مجلد الرسائل غير المرغوب فيها...

1/7/2026Read
cover
منتج

دليل إعداد البريد الإلكتروني للمعاملات

دليل إعداد البريد الإلكتروني للمعاملات...

1/10/2026Read
Support & Free Tokens
ما وراء SSML: التحكم في الهمس والصراخ والبكاء عبر واجهة برمجة التطبيقات | MorVoice