الذكاء الاصطناعي يتحسن في قراءة الأفكار
فكر في الكلمات التي تدور في رأسك: تلك النكتة التي لا طعم لها والتي احتفظت بها بحكمة على العشاء ؛ انطباعك الصريح عن الشريك الجديد لأفضل صديق لك. تخيل الآن أن شخصًا ما يمكنه الاستماع.
يوم الاثنين ، قطع علماء من جامعة تكساس ، أوستن ، خطوة أخرى في هذا الاتجاه. في دراسة نُشرت في مجلة Nature Neuroscience ، وصف الباحثون ذكاءً اصطناعيًا يمكنه ترجمة الأفكار الخاصة للأفراد من خلال تحليل فحوصات الرنين المغناطيسي الوظيفي ، والتي تقيس تدفق الدم إلى مناطق مختلفة في الدماغ.
لقد طور الباحثون بالفعل طرقًا لفك تشفير اللغة لالتقاط محاولة الكلام للأشخاص الذين فقدوا القدرة على الكلام ، والسماح للأشخاص المشلولين بالكتابة أثناء التفكير في الكتابة فقط. لكن وحدة فك ترميز اللغة الجديدة هي من أوائل من لا يعتمدون على الغرسات. في الدراسة ، كان قادرًا على تحويل الكلام المتخيل للشخص إلى كلام حقيقي ، وعندما عُرض على الأشخاص أفلام صامتة ، يمكن أن يولد أوصافًا دقيقة نسبيًا لما كان يحدث على الشاشة.
قال ألكسندر هوث ، عالم الأعصاب بالجامعة الذي ساعد في قيادة البحث: “هذا ليس مجرد محفز لغوي”. نحن نحصل على المعنى ، شيء ما حول فكرة ما يحدث. وحقيقة أن هذا ممكن أمر مثير للغاية “.
ركزت الدراسة على ثلاثة مشاركين جاءوا إلى مختبر الدكتور هوث لمدة 16 ساعة على مدار عدة أيام للاستماع إلى “العثة” وغيرها من البودكاست السردي. أثناء الاستماع ، سجل ماسح الرنين المغناطيسي الوظيفي مستويات الأوكسجين في الدم في أجزاء من أدمغتهم. ثم استخدم الباحثون نموذجًا لغويًا كبيرًا لمطابقة الأنماط في نشاط الدماغ بالكلمات والعبارات التي سمعها المشاركون.
يتم تدريب نماذج اللغات الكبيرة مثل GPT-4 من OpenAI و Google’s Bard على كميات هائلة من الكتابة للتنبؤ بالكلمة التالية في جملة أو عبارة. في هذه العملية ، تنشئ النماذج خرائط تشير إلى كيفية ارتباط الكلمات ببعضها البعض. قبل بضع سنوات ، لاحظ الدكتور هوث أن قطعًا معينة من هذه الخرائط – ما يسمى بتضمينات السياق ، والتي تلتقط السمات الدلالية ، أو المعاني ، للعبارات – يمكن استخدامها للتنبؤ بكيفية إضاءة الدماغ استجابة للغة.
قال شينجي نيشيموتو ، عالم الأعصاب بجامعة أوساكا والذي لم يشارك في البحث ، بالمعنى الأساسي ، “نشاط الدماغ هو نوع من الإشارات المشفرة ، وتوفر النماذج اللغوية طرقًا لفك تشفيرها”.
في دراستهم ، عكس الدكتور هوث وزملاؤه العملية بشكل فعال ، باستخدام ذكاء اصطناعي آخر لترجمة صور الرنين المغناطيسي الوظيفي للمشارك إلى كلمات وعبارات. اختبر الباحثون وحدة فك التشفير من خلال جعل المشاركين يستمعون إلى تسجيلات جديدة ، ثم رؤية مدى تطابق الترجمة مع النص الفعلي.
كانت كل كلمة تقريبًا في غير مكانها في النص الذي تم فك تشفيره ، ولكن تم الحفاظ على معنى المقطع بشكل منتظم. في الأساس ، كانت أجهزة فك التشفير تعيد الصياغة.
النسخة الأصلية: “نهضت من مرتبة الهواء وضغطت على وجهي على زجاج نافذة غرفة النوم متوقعًا أن أرى العيون تحدق في وجهي ولكن بدلاً من ذلك أجد الظلام فقط.”
فك الشفرة من نشاط الدماغ: “واصلت السير نحو النافذة وفتح الزجاج. وقفت على أصابع قدمي ونظرت إلى الخارج. لم أر أي شيء وبحثت مرة أخرى. انا لم ارى شيء.”
أثناء إجراء التصوير بالرنين المغناطيسي الوظيفي ، طُلب من المشاركين أيضًا تخيل سرد قصة بصمت ؛ بعد ذلك ، كرروا القصة بصوت عالٍ للرجوع إليها. هنا أيضًا ، استحوذ نموذج فك التشفير على جوهر النسخة غير المعلنة.
نسخة المشارك: “ابحث عن رسالة من زوجتي تقول إنها غيرت رأيها وأنها ستعود”.
نسخة فكلرؤيتها لسبب ما اعتقدت أنها ستأتي إلي وتقول إنها تفتقدني.
أخيرًا ، شاهد الأشخاص فيلمًا قصيرًا وصامتًا للرسوم المتحركة ، مرة أخرى أثناء خضوعهم لفحص الرنين المغناطيسي الوظيفي. من خلال تحليل نشاط أدمغتهم ، يمكن للنموذج اللغوي فك شفرة ملخص تقريبي لما كانوا يشاهدونه – ربما وصفهم الداخلي لما كانوا يشاهدونه.
تشير النتيجة إلى أن مفكك الشفرة للذكاء الاصطناعي لم يكن يلتقط الكلمات فحسب ، بل المعنى أيضًا. “إدراك اللغة هو عملية مدفوعة من الخارج ، في حين أن الخيال هو عملية داخلية نشطة.” قال نيشيموتو. وأظهر المؤلفون أن الدماغ يستخدم تمثيلات مشتركة عبر هذه العمليات.
قالت جريتا تاكوت ، عالمة الأعصاب في معهد ماساتشوستس للتكنولوجيا والتي لم تشارك في البحث ، إن هذا كان “السؤال رفيع المستوى”.
“هل يمكننا فك شفرة المعنى من الدماغ؟” واصلت. “في بعض النواحي يظهرون ذلك ، نعم ، يمكننا ذلك.”
لاحظ الدكتور هوث وزملاؤه أن طريقة فك ترميز اللغة هذه لها قيود. على سبيل المثال ، تعتبر ماسحات التصوير بالرنين المغناطيسي الوظيفي ضخمة ومكلفة. علاوة على ذلك ، يعد تدريب النموذج عملية طويلة ومملة ، ولكي تكون فعالة يجب أن يتم إجراؤها على الأفراد. عندما حاول الباحثون استخدام وحدة فك ترميز تم تدريبها على شخص لقراءة نشاط دماغ شخص آخر ، فشلت ، مما يشير إلى أن كل دماغ لديه طرق فريدة لتمثيل المعنى.
تمكن المشاركون أيضًا من حماية مونولوجاتهم الداخلية ، والتخلص من وحدة فك التشفير من خلال التفكير في أشياء أخرى. قد يكون الذكاء الاصطناعي قادرًا على قراءة أفكارنا ، ولكن في الوقت الحالي سيتعين عليه قراءتها واحدة تلو الأخرى ، وبإذن منا.