تفاوت بنیادین میان سازوکار توجه در انسان و هوش مصنوعی

پژوهشگران با استفاده از یک آزمون روان‌شناسی قدیمی نشان دادند مدل‌های پیشرفته‌ای مانند GPT-۵، Claude و Gemini در حفظ تمرکز طولانی‌مدت دچار مشکل می‌شوند؛ ضعفی که می‌تواند تفاوت بنیادین میان ذهن انسان و هوش مصنوعی را آشکار کند.

به گزارش سیناپرس، پژوهشگران در مطالعه‌ای جدید نشان داده‌اند که برخی از پیشرفته‌ترین مدل‌های هوش مصنوعی جهان از جمله GPT-۵ در آزمونی کلاسیک از روان‌شناسی شناختی با چالشی جدی روبه‌رو می‌شوند. نتایج این تحقیق نشان می‌دهد که سازوکار توجه در هوش مصنوعی ممکن است تفاوت‌های اساسی با نحوه تمرکز و کنترل ذهنی انسان داشته باشد.

به گزارش ساینس دیلی، این پژوهش که به سرپرستی سوکتو پاتل انجام شده عملکرد مدل‌های زبانی بزرگ (LLM) از جمله GPT-۵، Claude و Gemini را در آزمون استروپ (Stroop Task) بررسی کرده است. آزمایشی مشهور که دهه‌ها برای مطالعه توجه، تمرکز و کنترل شناختی انسان مورد استفاده قرار می‌گیرد.

آزمون استروپ چیست؟

در آزمون استروپ افراد با کلماتی روبه‌رو می‌شوند که نام رنگ‌ها را نشان می‌دهند برای مثال قرمز یا آبی این کلمات با رنگ‌های مختلف نمایش داده می‌شوند. گاهی رنگ جوهر با معنای کلمه یکسان است اما در برخی موارد با آن تضاد دارد؛ برای نمونه کلمه قرمز ممکن است با رنگ آبی نوشته شده باشد.

شرکت‌کنندگان باید رنگ جوهر را تشخیص دهند و معنای کلمه را نادیده بگیرند. اگرچه این کار ساده به نظر می‌رسد اما در عمل نوعی تعارض ذهنی ایجاد می‌کند زیرا مغز انسان به‌طور خودکار تمایل به خواندن کلمات دارد. غلبه بر این تمایل نیازمند کنترل اجرایی است، قابلیتی که به افراد اجازه می‌دهد روی هدف مشخصی تمرکز کنند و عوامل مزاحم را کنار بگذارند.

انسان‌ها معمولا در مواجهه با کلمات و رنگ‌های متناقض کمی کندتر پاسخ می‌دهند اما حتی در آزمون‌های طولانی نیز دقت بالایی را حفظ می‌کنند و دستورالعمل اصلی را فراموش نمی‌کنند.

عملکرد امیدوارکننده هوش مصنوعی در آغاز آزمایش

برای بررسی توانایی مدل‌های هوش مصنوعی در این آزمون پژوهشگران فهرست‌هایی از کلمات رنگی را در اختیار چند مدل پیشرفته قرار دادند.

در آزمون‌های کوتاه شامل پنج کلمه متناقض نتایج بسیار امیدوارکننده بود. مدل GPT-۴o توانست به دقت ۹۱ درصدی دست یابد و مدل Claude ۳.۵ Sonnet نیز عملکرد قابل‌توجهی از خود نشان داد. این نتایج اولیه نشان می‌داد که مدل‌های زبانی قادرند دستورالعمل آزمون را دنبال کرده و معنای کلمات را نادیده بگیرند، اما با طولانی‌تر شدن فهرست کلمات، وضعیت به‌طور چشمگیری تغییر کرد.

دقت GPT-۴o از ۹۱ درصد در فهرست‌های پنج‌تایی به ۵۷ درصد در فهرست‌های ۱۰ کلمه‌ای کاهش یافت. هنگامی که تعداد کلمات به ۴۰ مورد رسید دقت این مدل تنها ۱۵ درصد بود. مدل Claude ۳.۵ Sonnet مقاومت بیشتری از خود نشان داد و تا فهرست‌های ۲۰ کلمه‌ای عملکرد نسبتا پایداری داشت، اما در فهرست‌های ۴۰ کلمه‌ای دقت آن نیز به ۲۴ درصد سقوط کرد.

پژوهشگران الگو‌های مشابهی را در مدل‌های GPT-۵، Claude Opus ۴.۱ و Gemini ۲.۵ نیز مشاهده کردند. شرایط زمانی پیچیده‌تر شد که کلمات همخوان و ناهمخوان به‌طور هم‌زمان در یک فهرست قرار گرفتند. در این حالت دقت مدل‌ها در تشخیص موارد متناقض تقریبا به صفر رسید.

تفاوت بنیادین میان ذهن انسان و هوش مصنوعی

به گفته محققان این نتایج نشان‌دهنده تفاوت مهمی میان شناخت انسانی و نحوه پردازش اطلاعات در مدل‌های زبانی بزرگ است. هم انسان‌ها و هم مدل‌های هوش مصنوعی آموزش بسیار بیشتری برای تشخیص و تفسیر کلمات نسبت به شناسایی رنگ‌ها دریافت کرده‌اند؛ بنابراین هر دو به‌طور طبیعی تمایل دارند روی معنای کلمات تمرکز کنند.

با این حال انسان‌ها معمولا قادرند این واکنش خودکار را مهار کرده و حتی در توالی‌های طولانی روی هدف اصلی متمرکز بمانند. در مقابل مدل‌های زبانی با ادامه آزمون به‌تدریج به عادت اصلی خود بازمی‌گردند و به جای نام بردن از رنگ‌ها، کلمات را می‌خوانند به بیان دیگر آنها هدف اولیه را از دست می‌دهند.

پژوهشگران معتقدند این مسئله نشان می‌دهد سازوکار‌های توجه در مدل‌های مبتنی بر معماری ترنسفورمر با سیستم‌های توجه زیستی در مغز انسان تفاوت‌های بنیادینی دارند.

پنجره‌ای به محدودیت‌های پنهان هوش مصنوعی

اگرچه مدل‌های زبانی بزرگ در زمینه‌هایی مانند تولید متن، برنامه‌نویسی، استدلال و مکالمه توانایی‌های چشمگیری از خود نشان داده‌اند اما این مطالعه یادآور می‌شود که عملکرد قدرتمند آنها لزوما به معنای پردازش اطلاعات به شیوه‌ای مشابه انسان نیست.

به نقل از برنا، یافته‌های این پژوهش نشان می‌دهد که هوش مصنوعی امروزی ممکن است در وظایفی که به تمرکز پایدار، مهار پاسخ‌های خودکار و حفظ طولانی‌مدت دستورالعمل‌ها نیاز دارند با محدودیت‌های قابل‌توجهی مواجه باشد.

محققان تاکید می‌کنند که با گسترش استفاده از هوش مصنوعی در زندگی روزمره، شناخت و درک این نقاط ضعف به همان اندازه آگاهی از توانمندی‌های آن اهمیت خواهد داشت.

میترا کردی۱۴۰۵-۰۳-۲۵