تشخیص احساسات از روی چهره با هوش مصنوعی

در سال‌های اخیر فناوری هوش مصنوعی در بسیاری از کاربردها از قبیل اتومبیل‌های بدون سرنشین، تعامل انسان با کامپیوتر، آموزش و همچنین حمل‌ونقل هوشمند پیشرفت زیادی داشته است. دراین‌بین شناخت احساسات انسان نقش بسیار مهمی در کاربردهای مختلف هوش مصنوعی داشته است. به همین دلیل، مطالعه شناسایی خودکار احساسات انسان و بهبود آن به‌وسیله ماشین، یکی از زمینه‌های تحقیقاتی مهم در هوش مصنوعی و یادگیری ماشین است.

به گفته متخصصان، انسان‌ها به‌طور اساسی احساسات خود را با روش‌های مختلفی مانند زبان گفتار، حالات چهره، زبان بدن و کلمات بیان می‌کنند. مطالعات نشان می‌دهند که برای درک احساسات افراد، ۳۸ درصد اطلاعات به‌وسیله ریتم گفتار، ۷ درصد از طریق کلمات و ۵۵ درصد به‌وسیله حالات چهره به دست می‌آیند. به همین دلیل این موضوع محققان را تشویق می‌کند تا درزمینه تجزیه‌وتحلیل شناسایی حالات مختلف چهره مطالعه کنند. در سال ۱۹۷۱ شش احساس پایه شامل انزجار، ترس، شادی، تعجب، ناراحتی و خشم مطرح شدند که در جوامع جهانی و قومیت‌های مختلف ثابت هستند و همین موارد اصلی نیز برای ماشینی کردن استخراج حالات مختلف انسانی مورد استفاده قرار گرفته‌اند.

در این خصوص، محققانی از دانشگاه گیلان و دانشگاه فنی و حرفه‌ای این استان، پژوهشی جالب را انجام داده‌اند که در آن به بررسی روش‌های مختلف شناسایی احساسات چهره و کاربردها و چالش‌های آن‌ها پرداخته شده است.

در این تحقیق، در کنار بررسی حالات مختلف چهره ناشی از خشم، ترس، انزجار، شادی، غم و تعجب، 9 پایگاه داده تصویری که در پژوهش‌های تشخیص حالات چهره مورد استفاده قرار می‌گیرند نیز با هم مقایسه شده‌اند.

بررسی‌های این تحقیق نشان داد که روش‌های مبتنی بر شبکه عصبی پیچشی نسبت به بقیه روش‌ها دارای بالاترین دقت در تشخیص حالات چهره هستند. ولی تنوع داده‌های تصویری چهره ازنظر سن، جنسیت، نژاد، شرایط انسداد، تغییرات روشنایی، دوری و نزدیکی و همچنین تشخیص حالات دیگر از قبیل هیجان، تأسف و خستگی از چالش‌های پیش روی این صنعت هستند.

در این رابطه، اسدالله شاه بهرامی، دانشیار گروه مهندسی کامپیوتر دانشکده فنی دانشگاه گیلان و همکارانش می‌گویند: «یک سیستم تشخیص حالات چهره، دارای دو بخش مهم استخراج ویژگی و طبقه‌بندی حالات است. برخی از روش‌های استخراج ویژگی شامل مدل ظاهری، هیستوگرام گرادیان جهت‌دار و الگوی دودویی محلی و برخی روش‌های طبقه‌بندی حالات چهره نیز شامل ماشین بردار پشتیبان و شبکه عصبی پیچشی هستند».

به گفته آن‌ها، «بر اساس تحقیقات موجود به‌طورکلی مراحل شناسایی حالات چهره را می‌توان به دو بخش استخراج ویژگی و طبقه‌بندی حالات تقسیم‌بندی کرد. در مرحله اول ویژگی‌های هندسی یا ظاهری صورت از تصویر ورودی چهره استخراج می‌شوند. سپس در مرحله دوم، با توجه به ویژگی‌های استخراج‌شده از یک طبقه بند استفاده می‌شود تا به تصویر ورودی یک برچسب از ۶ حالت پایه اختصاص داده شود».

همه این بررسی‌ها نشان داد که روش‌های مبتنی بر شبکه عصبی پیچشی نسبت به بقیه روش‌ها دارای بالاترین دقت در تشخیص حالات چهره هستند و می‌توان از آن‌ها برای توسعه بیشتر سیستم‌های تشخیصی استفاده نمود.

شایان ذکر است این یافته‌های علمی در مجله «علوم رایانشی» متعلق به انجمن انفورماتیک ایران منتشر شده‌اند.

گزارش: محمدرضا دلفیه

No tags for this post.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا