تفاوت بنیادین میان سازوکار توجه در انسان و هوش مصنوعی

پژوهشگران با استفاده از یک آزمون روانشناسی قدیمی نشان دادند مدلهای پیشرفتهای مانند GPT-۵، Claude و Gemini در حفظ تمرکز طولانیمدت دچار مشکل میشوند؛ ضعفی که میتواند تفاوت بنیادین میان ذهن انسان و هوش مصنوعی را آشکار کند.
به گزارش سیناپرس، پژوهشگران در مطالعهای جدید نشان دادهاند که برخی از پیشرفتهترین مدلهای هوش مصنوعی جهان از جمله GPT-۵ در آزمونی کلاسیک از روانشناسی شناختی با چالشی جدی روبهرو میشوند. نتایج این تحقیق نشان میدهد که سازوکار توجه در هوش مصنوعی ممکن است تفاوتهای اساسی با نحوه تمرکز و کنترل ذهنی انسان داشته باشد.
به گزارش ساینس دیلی، این پژوهش که به سرپرستی سوکتو پاتل انجام شده عملکرد مدلهای زبانی بزرگ (LLM) از جمله GPT-۵، Claude و Gemini را در آزمون استروپ (Stroop Task) بررسی کرده است. آزمایشی مشهور که دههها برای مطالعه توجه، تمرکز و کنترل شناختی انسان مورد استفاده قرار میگیرد.
آزمون استروپ چیست؟
در آزمون استروپ افراد با کلماتی روبهرو میشوند که نام رنگها را نشان میدهند برای مثال قرمز یا آبی این کلمات با رنگهای مختلف نمایش داده میشوند. گاهی رنگ جوهر با معنای کلمه یکسان است اما در برخی موارد با آن تضاد دارد؛ برای نمونه کلمه قرمز ممکن است با رنگ آبی نوشته شده باشد.
شرکتکنندگان باید رنگ جوهر را تشخیص دهند و معنای کلمه را نادیده بگیرند. اگرچه این کار ساده به نظر میرسد اما در عمل نوعی تعارض ذهنی ایجاد میکند زیرا مغز انسان بهطور خودکار تمایل به خواندن کلمات دارد. غلبه بر این تمایل نیازمند کنترل اجرایی است، قابلیتی که به افراد اجازه میدهد روی هدف مشخصی تمرکز کنند و عوامل مزاحم را کنار بگذارند.
انسانها معمولا در مواجهه با کلمات و رنگهای متناقض کمی کندتر پاسخ میدهند اما حتی در آزمونهای طولانی نیز دقت بالایی را حفظ میکنند و دستورالعمل اصلی را فراموش نمیکنند.
عملکرد امیدوارکننده هوش مصنوعی در آغاز آزمایش
برای بررسی توانایی مدلهای هوش مصنوعی در این آزمون پژوهشگران فهرستهایی از کلمات رنگی را در اختیار چند مدل پیشرفته قرار دادند.
در آزمونهای کوتاه شامل پنج کلمه متناقض نتایج بسیار امیدوارکننده بود. مدل GPT-۴o توانست به دقت ۹۱ درصدی دست یابد و مدل Claude ۳.۵ Sonnet نیز عملکرد قابلتوجهی از خود نشان داد. این نتایج اولیه نشان میداد که مدلهای زبانی قادرند دستورالعمل آزمون را دنبال کرده و معنای کلمات را نادیده بگیرند، اما با طولانیتر شدن فهرست کلمات، وضعیت بهطور چشمگیری تغییر کرد.
دقت GPT-۴o از ۹۱ درصد در فهرستهای پنجتایی به ۵۷ درصد در فهرستهای ۱۰ کلمهای کاهش یافت. هنگامی که تعداد کلمات به ۴۰ مورد رسید دقت این مدل تنها ۱۵ درصد بود. مدل Claude ۳.۵ Sonnet مقاومت بیشتری از خود نشان داد و تا فهرستهای ۲۰ کلمهای عملکرد نسبتا پایداری داشت، اما در فهرستهای ۴۰ کلمهای دقت آن نیز به ۲۴ درصد سقوط کرد.
پژوهشگران الگوهای مشابهی را در مدلهای GPT-۵، Claude Opus ۴.۱ و Gemini ۲.۵ نیز مشاهده کردند. شرایط زمانی پیچیدهتر شد که کلمات همخوان و ناهمخوان بهطور همزمان در یک فهرست قرار گرفتند. در این حالت دقت مدلها در تشخیص موارد متناقض تقریبا به صفر رسید.
تفاوت بنیادین میان ذهن انسان و هوش مصنوعی
به گفته محققان این نتایج نشاندهنده تفاوت مهمی میان شناخت انسانی و نحوه پردازش اطلاعات در مدلهای زبانی بزرگ است. هم انسانها و هم مدلهای هوش مصنوعی آموزش بسیار بیشتری برای تشخیص و تفسیر کلمات نسبت به شناسایی رنگها دریافت کردهاند؛ بنابراین هر دو بهطور طبیعی تمایل دارند روی معنای کلمات تمرکز کنند.
با این حال انسانها معمولا قادرند این واکنش خودکار را مهار کرده و حتی در توالیهای طولانی روی هدف اصلی متمرکز بمانند. در مقابل مدلهای زبانی با ادامه آزمون بهتدریج به عادت اصلی خود بازمیگردند و به جای نام بردن از رنگها، کلمات را میخوانند به بیان دیگر آنها هدف اولیه را از دست میدهند.
پژوهشگران معتقدند این مسئله نشان میدهد سازوکارهای توجه در مدلهای مبتنی بر معماری ترنسفورمر با سیستمهای توجه زیستی در مغز انسان تفاوتهای بنیادینی دارند.
پنجرهای به محدودیتهای پنهان هوش مصنوعی
اگرچه مدلهای زبانی بزرگ در زمینههایی مانند تولید متن، برنامهنویسی، استدلال و مکالمه تواناییهای چشمگیری از خود نشان دادهاند اما این مطالعه یادآور میشود که عملکرد قدرتمند آنها لزوما به معنای پردازش اطلاعات به شیوهای مشابه انسان نیست.
به نقل از برنا، یافتههای این پژوهش نشان میدهد که هوش مصنوعی امروزی ممکن است در وظایفی که به تمرکز پایدار، مهار پاسخهای خودکار و حفظ طولانیمدت دستورالعملها نیاز دارند با محدودیتهای قابلتوجهی مواجه باشد.
محققان تاکید میکنند که با گسترش استفاده از هوش مصنوعی در زندگی روزمره، شناخت و درک این نقاط ضعف به همان اندازه آگاهی از توانمندیهای آن اهمیت خواهد داشت.





