تقنية 2020-10-22 1 دقائق قراءة

Neural TTS وصعود الصوت بالذكاء الاصطناعي في التوطين

التوليد الصوتي العصبي غيّر تكلفة وسرعة إنتاج الصوت متعدد اللغات للتدريب والعروض.

غيّر الصوت العصبي طريقة إنتاج الصوت متعدد اللغات. ما كان يحتاج إلى استوديو ومعلقين وجدول طويل يمكن الآن إنتاج نسخة أولى منه بسرعة أكبر.

لكن الصوت الآلي الجيد لا ينتج بمجرد لصق النص. يحتاج إلى نص محلي، وضبط نطق، ومراجعة صوتية.

كيف يعمل

تولد أنظمة TTS العصبية صوتا من النص وتسمح باختيار اللغة والأسلوب والسرعة والتوقفات. مقارنة بالأصوات القديمة، أصبحت الطبيعية أفضل بكثير.

هذا يساعد الشركات على إنتاج تعليق صوتي بعدة لغات.

خفضت AI تكلفة إنتاج الدورات والشروحات والمحتوى كثير التحديث. يمكن للشركة إنتاج نسخ سريعة ثم اختيار الأسواق التي تستحق صوتا بشريا.

في مكتبات التدريب الكبيرة، فرق الوقت واضح.

قد تُنطق أسماء المنتجات والاختصارات والوحدات بشكل خاطئ. العاطفة وطابع العلامة والأداء المعقد ما زالت أفضل بالصوت البشري.

كما أن طول النص في لغة أخرى قد يغير توقيت الفيديو.

يناسب تدريب العمليات، شروحات البرامج، تعليمات الدعم، الإعلانات الداخلية وعروض المنتج. أما الحملات العاطفية والشهادات فتحتاج غالبا إلى صوت بشري.

ابدأ بتوطين النص، ثم أنشئ الصوت، ثم راجع النطق والتوقفات والتزامن والمكساج. الجودة تأتي من العملية كاملة.

يمكننا تجهيز تعليق صوتي متعدد اللغات لفيديوهاتك: اطلع على الخدمة.

بقلم MediaLocalize Team