Meta
أعلنت شركة Meta ، الشركة الأم لـ Facebook ، عن نموذج جديد لتحويل النص إلى كلام (TTS) يسمى Voicebox وهذا المسمى بـ Voicebox هو نموذج ذكاء اصطناعي توليدي يمكنه إنتاج خطاب عالي الجودة وطبيعي من نص بحوالي ست لغات: الإنجليزية والفرنسية والإسبانية والألمانية والبولندية والبرتغالية وهناك تطورات وتحديثات للغات الأخرى الأكثر شهرة.
ويختلف Voicebox عن طرز TTS السابقة بعدة طرق وهو نموذج توليدي ، مما يعني أنه يمكنه إنشاء عينات كلام جديدة من البداية وهذا على عكس نماذج تحويل النص إلى كلام التقليدية ، وهي نماذج تمييزية يمكنها قراءة النص بصوت عالٍ فقط التي تم تدريبهم عليها ويعد Voicebox نموذجًا غير ذاتي الانحدار وهذا يعني أنه يمكن أن يولد الكلام بأي ترتيب ، بدلاً من الاضطرار إلى توليد الكلمات في جملة واحدة في كل مرة.
وهذا يجعل Voicebox أسرع بكثير من نماذج الانحدار التلقائي ، ويسمح له أيضًا بتوليد المزيد من الكلام الطبيعي والـ Voicebox هو نموذج متعدد المهام وهذا يعني أنه يمكنه أداء مهام متعددة تتعلق بالكلام ، مثل إزالة الضوضاء وتحرير المحتوى وتحويل النمط وتوليد عينات متنوعة وهذا يجعل Voicebox أداة متعددة الاستخدامات للغاية يمكن استخدامها لمجموعة متنوعة من التطبيقات.
وتعتقد Meta أن Voicebox لديه القدرة على إحداث ثورة في طريقة تفاعلنا مع أجهزة الكمبيوتر والأجهزة وعلى سبيل المثال ، يمكن استخدام Voicebox لإنشاء المزيد من المساعدين الافتراضيين الطبيعيين ، أو لتوليد كلام واقعي لروبوتات الدردشة والتطبيقات الأخرى التي تعمل بالذكاء الاصطناعي ويمكن أيضًا استخدام Voicebox لتحسين إمكانية الوصول إلى المحتوى الرقمي للأشخاص الذين يعانون من إعاقات بصرية.
ولا يزال نموذج تحويل النص الى صوت المسمى بـ Voicebox قيد التطوير ، لكن شركة Meta تخطط لإتاحته للجمهور في المستقبل القريب وتعتقد الشركة أن نموذج Voicebox لديه القدرة على إحداث تأثير كبير على الطريقة التي نتفاعل بها مع التكنولوجيا ، ويسعدها أن ترى كيف يستخدمها المطورون والباحثون لإنشاء تطبيقات جديدة ومبتكرة.
التطبيقات المحتملة لـ Voicebox
المساعدون الافتراضيون: يمكن استخدام Voicebox لإنشاء المزيد من المساعدين الظاهريين الطبيعيين ، مثل Amazon Alexa أو Google Assistant ويمكن لهؤلاء المساعدين استخدام Voicebox لقراءة النص بصوت عالٍ والإجابة على الأسئلة وتقديم معلومات أخرى بطريقة طبيعية وجذابة.
روبوتات المحادثة: يمكن استخدام Voicebox لتوليد كلام أكثر واقعية لروبوتات الدردشة وقد يجعل هذا روبوتات المحادثة أكثر جاذبية وفائدة للمستخدمين ، ويمكن أن يساعد أيضًا في تحسين تجربة العملاء للشركات وقد تكون خاصة فريدة ومميزة لأحد روبوتات الدردشة القادمة.
إمكانية الوصول: يمكن استخدام Voicebox لتحسين إمكانية الوصول إلى المحتوى الرقمي للأشخاص الذين يعانون من إعاقات بصرية وعلى سبيل المثال ، يمكن استخدام Voicebox لإنشاء إصدارات صوتية من الكتب والمقالات والمستندات الأخرى سواء في الهواتف المحمولة او في اجهزة الكمبيوتر.
إنشاء المحتوى: يمكن لمنشئي المحتوى استخدام Voicebox لإنشاء محتوى أكثر جاذبية وغامرة وعلى سبيل المثال ، يمكن استخدام Voicebox لإنشاء إصدارات صوتية من ألعاب الفيديو والأفلام وأشكال الترفيه الأخرى فمثلاً اذا كنت تريد انشاء محتوى للتعليق على الفيديوهات ولكن لا توجد احترافية في التعليق يمكنك استخدام هذا النموذج لتوليد صوت احترافي ومناسب.