به گزارش سیناپرس همدان، یک سیستم هوش مصنوعی جدید به نام رمزگشای معنایی میتواند فعالیت مغز یک فرد را، در حین گوش دادن به یک داستان یا تصور ذهنی از شنیدن یک داستان، به یک جریان متنی پیوسته تبدیل کند. سیستم توسعه یافته توسط محققان دانشگاه تگزاس در آئوستین ممکن است به افرادی که هوشیاری ذهنی دارند و در عین حال قادر به صحبت کردن فیزیکی نیستند، مانند افرادی که در اثر سکته مغزی ضعیف شدهاند، کمک کند تا دوباره به طور قابل درک با دیگران ارتباط برقرار کنند.
این مطالعه که در مجله Nature Neuroscience منتشر شد، توسط جری تانگ، دانشجوی دکترای علوم کامپیوتر و الکس هاث، استادیار علوم اعصاب و علوم کامپیوتر در دانشگاه UT Austin هدایت شد. این کار تا حدی بر یک مدل ترانسفورماتور متکی است، شبیه به مدلهایی که ChatGPT در Open AI و Bard Google را تامین میکنند.
برخلاف دیگر سیستمهای رمزگشایی زبان در حال توسعه، این سیستم نیازی به کار گذاشتن ایمپلنت به وسیله جراحی برای افراد ندارد و این فرآیند را غیرتهاجمی اجرا میکند. شرکت کنندگان همچنین نیازی به استفاده از کلمات از لیست تعیین شده ندارند. فعالیت مغز با استفاده از یک اسکنر fMRI پس از آموزش گسترده رمزگذاری شده اندازه گیری می شود که در آن فرد ساعت ها به پادکست های موجود در اسکنر گوش می دهد. بعداً، مشروط بر اینکه شرکتکننده برای رمزگشایی افکار خود آماده باشد، گوش دادن به یک داستان جدید یا تصور داستان نقل شده، به ماشین این امکان را میدهد تا متن مربوطه را تنها از فعالیت مغز تولید کند.
هاث گفت: برای یک روش غیرتهاجمی، این یک جهش واقعی به جلو در مقایسه با آنچه قبلا انجام شده است، که معمولا کلمات یا جملات کوتاه هستند، می باشد. ما در حال دریافت مدلی برای رمزگشایی زبان پیوسته برای مدت زمان طولانی با ایده های پیچیده هستیم.
نتیجه یک رونوشت کلمه به کلمه نیست. در عوض، محققان آن را به گونه ای طراحی کردند که اصل چیزی که گفته می شود یا فکر می شود، هر چند ناقص، به متن تبدیل شود. تقریباً نیمی از زمانهایی که رمزگشا برای نظارت بر فعالیت مغز شرکتکننده آموزش دیده است، دستگاه متنی را تولید میکند که دقیقاً با معانی مورد نظر کلمات اصلی مطابقت دارد.
برای مثال، در آزمایشها، شرکتکنندهای که به سخنران گوش میدهد و میگوید: «هنوز گواهینامه رانندگیام را ندارم»، افکارش به این صورت ترجمه میشد: «او هنوز شروع به یادگیری رانندگی نکرده است». گوش دادن به کلمات «نمیدانستم فریاد بزنم، گریه کنم یا فرار کنم. در عوض، گفتم: مرا رها کن!» به این صورت رمزگشایی شد: «شروع کرد به جیغ زدن و گریه کردن، و بعد او فقط گفت: من به تو گفتم که مرا تنها بگذار.»
با شروع نسخه قبلی مقاله که به صورت پیش چاپ آنلاین منتشر شد، محققان به سوالاتی در مورد سوء استفاده احتمالی از فناوری پرداختند. این مقاله توضیح میدهد که چگونه رمزگشایی تنها با مشارکتکنندگانی که با میل در آموزش رمزگشا شرکت کردهاند، کار میکند. نتایج برای افرادی که رمزگشا بر روی آنها آموزش ندیده بود، نامفهوم بود، و اگر شرکتکنندگانی که رمزگشا بر روی آنها آموزش دیده بود، بعداً مقاومت کردند، مثلاً با فکر کردن به افکار دیگر، نتایج بهطور مشابه غیرقابل استفاده بودند.
تانگ گفت: ما نگرانیها را در مورد استفاده از آن برای مقاصد بد بسیار جدی میگیریم و برای جلوگیری از آن تلاش کردهایم. ما میخواهیم مطمئن شویم که مردم فقط زمانی که بخواهند از این نوع فناوریها استفاده میکنند و این به آنها کمک میکند.
علاوه بر اینکه شرکتکنندگان به داستانها گوش میدادند یا درباره آنها فکر میکردند، محققان از آزمایش شوندگان خواستند تا چهار ویدیوی کوتاه و بیصدا را در حین حضور در اسکنر تماشا کنند. رمزگشای معنایی توانست از فعالیت هوش مصنوعی خود برای توصیف دقیق رویدادهای خاص از ویدیوها استفاده کند.
این سیستم در حال حاضر برای استفاده در خارج از آزمایشگاه عملی نیست زیرا به زمان نیاز به دستگاه fMRI وابسته است. اما محققان فکر میکنند که این کار میتواند به سایر سیستمهای تصویربرداری مغز قابل حملتر، مانند طیفسنجی عملکردی مادون قرمز نزدیک (fNIRS) منتقل شود.
هاث گفت: fNIRS جایی که جریان خون کم و بیش در مغز در مقاطع مختلف زمانی وجود دارد را اندازه گیری می کند، که به نظر می رسد دقیقاً همان سیگنالی است که fMRI اندازه گیری می کند. بنابراین، نوع دقیق رویکرد ما باید به fNIRS ترجمه شود، اگرچه، او خاطرنشان کرد، وضوح با fNIRS کمتر خواهد بود.
منبع: Nature Neuroscience
مترجم: سید سپهر ارومیهء