ربما سمعت عن تقنية التزييف العميق للصور ومقاطع الفيديو. تلك مقاطع الفيديو الواقعية المخيفة التي تم إنشاؤها باستخدام الذكاء الاصطناعي؟ الآن ، يبدو أن Meta (المعروفة سابقًا باسم Facebook) قد طورت نموذجًا جديدًا للذكاء الاصطناعي يسمى Voicebox والذي يدور حول الصوت. إنه يشبه نظام تحويل النص إلى كلام فائق الشحن الذي يمكنه إنشاء أصوات اصطناعية من مجرد مطالبة نصية.
انقر للحصول على النشرة الإخبارية الإلكترونية لـ KURT مجانًا مع تنبيهات أمنية ونصائح سريعة واستعراضات تقنية وطريقة سهلة لجعلك أكثر ذكاءً
ما هو فويس بوكس؟
يعد Voicebox في جوهره نموذجًا للذكاء الاصطناعي يقوم بإنشاء أصوات اصطناعية بناءً على مطالبات نصية بسيطة. بعبارة أخرى ، تعطيها بعض النصوص ، وسوف تقرأها بصوت عالٍ بصوتٍ يبدو بشريًا. إنها تشبه وظيفة تحويل النص إلى كلام التي قد تستخدمها على هاتفك أو جهاز الكمبيوتر الخاص بك ، ولكنها تأخذ الأشياء إلى مستوى جديد تمامًا.
الشيء الوحيد الذي يميز Voicebox هو قدرته على تكرار أنماط صوتية معينة بناءً على عينة صوتية قصيرة جدًا – نحن نتحدث في أقل من ثانيتين! هذا يعني أنه من المحتمل أن يكون لديك صوت اصطناعي يشبه شخصيتك المفضلة أو حتى صوتك. يشبه الأمر تقريبًا وجود ممثل صوت عند الطلب ، وعلى استعداد لقراءة أي شيء تريده بأسلوب الصوت الذي تختاره.
نماذج صوت AI المتنافسة
ألقى خطابا
Speechify و ElevenLabs هم أيضًا لاعبون في لعبة تحويل النص إلى كلام. Speechify هو تطبيق يحول أي نص إلى صوت. يمكنه قراءة الكتب والمقالات والملاحظات ورسائل البريد الإلكتروني وملفات PDF والصور وصفحات الويب بصوت عالٍ. تدعي Speechify أيضًا أنها توفر ميزات استنساخ الصوت وتحرير الصوت وأخذ العينات الصوتية. يقدم Speechify المئات من الكتب الصوتية المجانية الخالدة ، ويحتوي على تطبيق سطح مكتب ، وهو مصمم لمساعدة الأشخاص الذين يعانون من صعوبات في القراءة.

شعار Meta على الهاتف (Costfoto / NurPhoto عبر Getty Images)
تجذب خيوط مارك زوكيربيرج “القاتل على تويتر” المستخدمين في جمع البيانات الضخمة: “بالقرب من الخصوصية الصفرية
أحد عشر مختبرات
من ناحية أخرى ، فإن شركة ElevenLabs هي شركة ناشئة تستخدم الذكاء الاصطناعي لتوليد أصوات اصطناعية ذات عواطف ذات صلة بالسياق وفهم للغة الطبيعية. إنها توفر منصة لإنشاء وتخصيص صوت منطوق عالي الجودة بأي صوت وأسلوب لمختلف الصناعات ، مثل ألعاب الفيديو والرسوم المتحركة والمساعدين الرقميين والتعليم والترفيه والإعلان والبودكاست. لديهم أيضًا أداة لاكتشاف الأصوات الاصطناعية والتحقق من صحتها. يعمل ElevenLabs مع الممثلين الذين يقدمون عينات من أصواتهم ويتقاضون رواتبهم عند استخدام نسخهم الصوتية. يستخدمون نماذج التعلم العميق الخاصة لإنشاء خطاباتهم التي يتم تسليمها بواسطة الذكاء الاصطناعي.
كلاهما رائع ، لكنهما لا يتمتعان بنفس التنوع مثل Voicebox ، والذي يمكنه تقليد الأصوات الحقيقية من بضع ثوانٍ فقط من الصوت. إنه يشبه مقارنة سكين الجيش السويسري ببضع ملاعق جيدة حقًا. لديهم جميعًا استخداماتهم ، لكن أحدها بالتأكيد متعدد الأغراض.
قوة فويس بوكس
لكن الأمر لا يتعلق فقط بإنشاء أصوات مزيفة. يمكن لـ Voicebox أيضًا تنظيم الصوت عن طريق إزالة ضوضاء الخلفية المزعجة – دعنا نقول ، كلب ينبح أثناء محاولتك التسجيل. ولا يتعلق الأمر باللغة الإنجليزية فقط. يتحدث الذكاء الاصطناعي هذا الفرنسية والإسبانية والألمانية والبولندية والبرتغالية أيضًا ، ويمكنه أيضًا ترجمة مقاطع من لغة إلى أخرى مع الحفاظ على نفس أسلوب الصوت.
تحرك أكثر ، سيري: الكتاب الصوتي الجديد من Apple ، أصوات الذكاء الاصطناعي مثل الإنسان

يمثل شعار Meta (المعروف سابقًا باسم Facebook) مدخل مقر الشركة الرئيسي في مينلو بارك ، كاليفورنيا في 09 نوفمبر 2022. – سيقوم مالك Facebook Meta بتسريح أكثر من 11000 من موظفيه في “أصعب التغييرات التي أجريناها في Meta التاريخ ، قال رئيسه مارك زوكربيرج يوم الأربعاء. (جوش إيدلسون / وكالة الصحافة الفرنسية عبر غيتي إيماجز)
صندوق صوت Meta: اختراق أم تهديد؟
لسوء الحظ ، أو لحسن الحظ ، بناءً على موقفك فيما يتعلق بالذكاء الاصطناعي ، لا تخطط Meta لفتح مصدر Voicebox على الفور. هذا جعل الناس يتساءلون عما إذا كانوا يحاولون تجنب بعض المشكلات المحتملة. على سبيل المثال ، يمكن استخدام تقنية الصوت بالذكاء الاصطناعي بشكل سلبي ، كما هو الحال في حملات التحرش. أو ربما يكون لدى Meta بعض الخطط المستقبلية لكسب بعض المال من هذا النموذج.
مصدر بيانات التدريب الهائلة لـ Voicebox
أحد الأشياء المثيرة للاهتمام حول Voicebox هو أنه تم تدريبه على الكثير من البيانات – أكثر من 60.000 ساعة من الكلام من الكتب الصوتية الإنجليزية و 50000 ساعة أخرى من الكتب الصوتية متعددة اللغات. تقول Meta إنهم استخدموا الكتب الصوتية للمجال العام كمصدر رئيسي للبيانات ، لكنهم استخدموا أيضًا مصادر أخرى مثل البودكاست والخطب والبرامج الإذاعية. ومع ذلك ، ترتبط بعض التحديات والقيود باستخدام الكتب المسموعة في المجال العام ، مثل الجودة والاتساق والمحاذاة وهوية المتحدث. تدعي Meta أنها عالجت بعض هذه المشكلات من خلال معالجة البيانات وتصميم النموذج.
بالنسبة لي تنبيهات أمنية ، اشترك في النشرة الإخبارية المجانية لتقرير CYBERGUY عن طريق التوجه إلى CYBERGUY.COM/NEWSLETTER
سيف التكنولوجيا ذو الحدين
أمر المحكمة “الغبية” لأوباما أيه جي بعد اتصال القاضي بايدن بشركات وسائل الإعلام الاجتماعية
يعد صعود أصوات الذكاء الاصطناعي موضوعًا حساسًا بعض الشيء ، خاصة بالنسبة للممثلين الصوتيين ومؤخرًا الكتاب. إنهم قلقون بشأن استخدام الشركات للذكاء الاصطناعي لتجميع أصواتهم دون الدفع لهم. ينمو سوق الكتب المسموعة بشكل كبير ، وتتطلع الشركات دائمًا إلى خفض التكاليف ، لذلك قد ينتهي الأمر بمشكلة أخرى لمحترفي الصوت.
لا تكن مخطئا ، ومع ذلك ؛ لا يتعلق الأمر بالوظائف فقط. هناك بعض المخاوف الحقيقية حول مدى عمق استخدام الأصوات المزيفة في عمليات الاحتيال. على سبيل المثال ، كانت هناك حالة تم فيها استخدام صوت اصطناعي ينتحل شخصية رئيس تنفيذي في عملية سرقة كبرى. هناك أيضًا قلق من إمكانية استخدام الأصوات المزيفة للتلاعب بأشياء مثل أنظمة المقاييس الحيوية الصوتية ، والتي تُستخدم لأشياء مثل الخدمات المصرفية عبر الإنترنت.
كما ترى ، كما تبدو هذه التكنولوجيا رائعة ، هناك جانب أكثر قتامة لها. تخيل أنك تلقيت مكالمة من رئيسك في العمل يطلب منك تحويل مبلغ ضخم من المال لإغلاق حساب. أنت تفعل ما قيل لأنه ، حسنًا ، هو رئيسك في العمل. باستثناء ، لم يكن كذلك. صحيح؛ لقد كان صوتًا اصطناعيًا مزيفًا تم إنشاؤه باستخدام الذكاء الاصطناعي والذي بدا تمامًا مثل رئيسك في العمل. وايلد ، أليس كذلك؟ لكن هذه ليست حبكة فيلم. لقد حدث بالفعل! كانت هذه واحدة من المرات الأولى التي تم فيها استخدام صوت مزيف في سرقة ، وترك خبراء إنفاذ القانون والذكاء الاصطناعي في حيرة من أمرهم.

كان كوندو متفائلاً بشأن مستقبل الذكاء الاصطناعي. (جاكوب بورزيكي / نور فوتو عبر غيتي إيماجز)
DALLE-2 ضد. BING CREATOR – أيهما يأتي في المقدمة في عرض AI هذا؟
وهي ليست مجرد سرقات. يمكن استخدام أصوات Deepfake لخداع الأنظمة التي تعتمد على التعرف على الصوت. نحن نتحدث عن أشياء مثل الخدمات المصرفية عبر الإنترنت ، والتي تستخدم صوتك كشكل من أشكال التعريف. إذا كان بإمكان المجرمين إنشاء صوت مزيف مقنع عنك ، فمن المحتمل أن يتمكنوا من الوصول إلى حساباتك. إنه يشبه إلى حد ما تزوير توقيع ولكن بصوتك بدلاً من ذلك.
مواجهة تهديد التزييف العميق
لذلك ، بينما نتعجب من الأشياء المدهشة التي يمكن أن تقوم بها التكنولوجيا ، من المهم أيضًا أن نكون على دراية بالمخاطر المحتملة وأن نبقى متقدمًا بخطوة. إنها تشبه لعبة القط والفأر عالية التقنية ، حيث يعمل خبراء الذكاء الاصطناعي والشركات بجد لاكتشاف وإيقاف هذه الأصوات المزيفة قبل أن تتمكن من إلحاق أي ضرر.
لحسن الحظ ، هناك أشخاص يحاولون مقاومة إساءة الاستخدام المحتملة للأصوات المزيفة. على سبيل المثال ، بدأت بعض البلدان في إصدار قوانين لتنظيم التزييف العميق. أيضًا ، هناك مشاريع مثل الانتحال التلقائي للتحقق من السماعات وتحدي الإجراءات المضادة (ASVspoof) ، حيث يعمل العلماء والمهندسون على طرق لمواجهة الهجوم الصوتي العميق
الوجبات السريعة الرئيسية لكورت
نحن في عصر تتطور فيه التكنولوجيا بسرعة فائقة وتغير طريقة عملنا والتواصل وحتى سماع الأشياء. في حين أن إمكانات الذكاء الاصطناعي مثل Meta Voicebox مثيرة بلا شك ، فمن الواضح أننا بحاجة أيضًا إلى السير بحذر. هناك خط رفيع بين الابتكار والغزو ، وهو توازن ما زلنا نحققه.

يجادل الخبراء بأن الاختلاف بين استثمار الذكاء الاصطناعي في الصين والولايات المتحدة هو حقيقة أن النموذج الأمريكي تحركه شركات خاصة بينما تتخذ الصين نهجًا حكوميًا (JOSEP LAGO / AFP عبر Getty Images)
انقر هنا للحصول على تطبيق FOX NEWS
مع كل هذه التطورات والمخاطر المحتملة ، ما هو شعورك حيال مستقبل الذكاء الاصطناعي وتقنية التزييف العميق؟ هل تراه نعمة أم نقمة؟ أخبرنا عن طريق الكتابة إلينا على Cyberguy.com/Contact
لمزيد من تنبيهات الأمان الخاصة بي ، اشترك في النشرة الإخبارية المجانية لتقرير CyberGuy من خلال التوجه إلى Cyberguy.com/Newsletter
حقوق النشر 2023 CyberGuy.com. كل الحقوق محفوظة.