تقنية تحول إشارات الدماغ إلى كلام طبيعي بسرعة فائقة

10:11
05-04-2025
تقنية تحول إشارات الدماغ إلى كلام طبيعي بسرعة فائقة

في إنجاز علمي مهم يجمع بين علوم الأعصاب والذكاء الاصطناعي، نجح باحثون من جامعتي كاليفورنيا في بيركلي وسان فرنسيسكو في تطوير واجهة دماغ-حاسوب (BCI) قادرة على استعادة القدرة على الكلام الطبيعي للأشخاص المصابين بشلل حاد. نُشرت نتائج الدراسة هذا الأسبوع في مجلة "نيتشور نيوروساينس" (Nature Neuroscience)، مما يمثل خطوة كبيرة نحو تحقيق التواصل الصوتي الفوري عبر إشارات الدماغ، ويعطي الأمل والفرصة للاستقلالية لأولئك الذين فقدوا القدرة على التحدث.

تقنية بلا تأخير ... تعتمد هذه التقنية المتقدمة على نظام مدعوم بالذكاء الاصطناعي لتحويل الإشارات الدماغية إلى كلام مسموع في الوقت الفعلي تقريباً، وهو ما يعد تقدمًا كبيرًا في حل مشكلة التأخير الزمني الذي طالما واجهته هذه الأنواع من التقنيات. ويوضح الدكتور جوبالا أنومانشيباللي، أستاذ مساعد في قسم الهندسة الكهربائية وعلوم الحاسوب في جامعة كاليفورنيا-بيركلي والمحقق الرئيسي المشارك في الدراسة، أن هذا النظام يعرض قدرة فك شفرة الكلام بسرعة مشابهة لما نراه في أجهزة مثل "أليكسا" و"سيري"، ولكن لخدمة المرضى.

لقد كانت مشكلة التأخير بين المتحدث والكلام الناتج عن واجهات الدماغ والحاسوب عائقًا رئيسيًا في تحقيق التواصل الطبيعي. في التجارب السابقة، كان على المستخدم الانتظار نحو 8 ثوانٍ قبل سماع جملة واحدة، أما النظام الجديد فقد قلّص هذه المدة إلى أقل من ثانية، مما سمح بتدفق الكلام بشكل طبيعي ومستمر.

تحسين جودة الحياة ... يعتبر الدكتور إدوارد تشانغ، جراح الأعصاب في "UCSF" والمحقق الرئيسي الآخر في الدراسة، أن هذه التكنولوجيا قد تحدث تحولًا جذريًا في حياة المرضى، موضحًا أن هذه التقنية تمتلك إمكانات هائلة لتحسين نوعية حياة الأشخاص المصابين بشلل يؤثر على قدرتهم على الكلام. كما أشار إلى أن التقدم السريع في الذكاء الاصطناعي قد جعل هذه الواجهات أقرب إلى الواقع. ومن أبرز مميزات هذه التقنية أنها تعمل مع مجموعة متنوعة من الأجهزة، مثل الأقطاب الدقيقة المزروعة في الدماغ أو أجهزة الاستشعار على الوجه التي تقيس النشاط العضلي. ويوضح كايلو ليتلجون، طالب الدكتوراه في بيركلي، أن الخوارزمية نفسها يمكن تطبيقها على تقنيات متعددة طالما كانت هناك إشارات دماغية واضحة.

ترجمة إشارات الدماغ ... يبدأ النظام في تفسير الإشارات من منطقة القشرة الحركية في الدماغ، المسؤولة عن التحكم في عضلات النطق. حيث يتم التقاط الإشارات العصبية وفك تشفيرها باستخدام نماذج ذكية مدربة مسبقًا للتعرف على الأنماط المتعلقة بالكلام. يشرح شاول جون تشو، المؤلف المشارك في الدراسة، أن الإشارات تترجم بعد أن يقرر الشخص ما يريد قوله، ويختار الكلمات والحركات اللازمة للنطق.

لتدريب النظام، تعاون الباحثون مع مريضة فقدت القدرة على الكلام بسبب إصابتها بسكتة دماغية. في جلسات التدريب، كانت المريضة تنظر إلى شاشة تعرض جملة مثل "مرحبًا، كيف حالك؟"، وتحاول قولها بصمت. وعلى الرغم من عدم قدرتها على النطق، تمكن النظام من ربط النشاط العصبي بالجملة المقصودة.

محاكاة الصوت الأصلي ... نظرًا لأن المريضة لم تكن قادرة على النطق الفعلي، لم يكن لدى الباحثين تسجيلات صوتية حديثة للمقارنة. لذلك، استخدموا نموذج ذكاء اصطناعي مسبق التدريب لإنشاء صوت اصطناعي يحاكي صوتها قبل الإصابة. ووفقًا لأنومانشيباللي، فإن سماع المريضة لصوتها القديم في الوقت الفعلي جعل التجربة أكثر شعورًا بالتحكم والانخراط. وللتأكد من قدرة النظام على تجاوز حدود البيانات التي تدرب عليها، جرب الباحثون النموذج باستخدام كلمات جديدة مثل أسماء حروف الناتو الصوتية "ألفا، برافو، تشارلي"، فنجح النظام في إنتاج أصوات مفهومة ودقيقة، مما أظهر أن النموذج لا يكرر فحسب بل يتعلم فعليًا كيفية بناء الصوت.

المثير في هذا النظام أنه حافظ على دقته العالية رغم السرعة الكبيرة. يقول ليتلجون: "لم يكن معروفًا سابقًا ما إذا كان بالإمكان بث كلام واضح في الزمن الحقيقي مباشرة من الدماغ، ولكن الآن لدينا الإثبات على ذلك".

لغة تحمل العاطفة ... يتطلع الفريق البحثي إلى المستقبل، حيث يعملون على تحسين الجوانب العاطفية والتعبيرية للكلام، مثل النبرة والحِدة ومستوى الصوت، لتعكس المشاعر والانفعالات الطبيعية في الحديث. وفي عالم يزداد فيه التفاعل بين الدماغ والتكنولوجيا، تمثل هذه الخطوة نقطة تحول مهمة في استعادة القدرة على التعبير الصوتي، مما يعيد ربط الإنسان بالعالم من خلال واحدة من أهم أدوات التواصل: الصوت.