در سالهای اخیر فناوری هوش مصنوعی در بسیاری از کاربردها از قبیل اتومبیلهای بدون سرنشین، تعامل انسان با کامپیوتر، آموزش و همچنین حملونقل هوشمند پیشرفت زیادی داشته است. دراینبین شناخت احساسات انسان نقش بسیار مهمی در کاربردهای مختلف هوش مصنوعی داشته است. به همین دلیل، مطالعه شناسایی خودکار احساسات انسان و بهبود آن بهوسیله ماشین، یکی از زمینههای تحقیقاتی مهم در هوش مصنوعی و یادگیری ماشین است.
به گفته متخصصان، انسانها بهطور اساسی احساسات خود را با روشهای مختلفی مانند زبان گفتار، حالات چهره، زبان بدن و کلمات بیان میکنند. مطالعات نشان میدهند که برای درک احساسات افراد، ۳۸ درصد اطلاعات بهوسیله ریتم گفتار، ۷ درصد از طریق کلمات و ۵۵ درصد بهوسیله حالات چهره به دست میآیند. به همین دلیل این موضوع محققان را تشویق میکند تا درزمینه تجزیهوتحلیل شناسایی حالات مختلف چهره مطالعه کنند. در سال ۱۹۷۱ شش احساس پایه شامل انزجار، ترس، شادی، تعجب، ناراحتی و خشم مطرح شدند که در جوامع جهانی و قومیتهای مختلف ثابت هستند و همین موارد اصلی نیز برای ماشینی کردن استخراج حالات مختلف انسانی مورد استفاده قرار گرفتهاند.
در این خصوص، محققانی از دانشگاه گیلان و دانشگاه فنی و حرفهای این استان، پژوهشی جالب را انجام دادهاند که در آن به بررسی روشهای مختلف شناسایی احساسات چهره و کاربردها و چالشهای آنها پرداخته شده است.
در این تحقیق، در کنار بررسی حالات مختلف چهره ناشی از خشم، ترس، انزجار، شادی، غم و تعجب، 9 پایگاه داده تصویری که در پژوهشهای تشخیص حالات چهره مورد استفاده قرار میگیرند نیز با هم مقایسه شدهاند.
بررسیهای این تحقیق نشان داد که روشهای مبتنی بر شبکه عصبی پیچشی نسبت به بقیه روشها دارای بالاترین دقت در تشخیص حالات چهره هستند. ولی تنوع دادههای تصویری چهره ازنظر سن، جنسیت، نژاد، شرایط انسداد، تغییرات روشنایی، دوری و نزدیکی و همچنین تشخیص حالات دیگر از قبیل هیجان، تأسف و خستگی از چالشهای پیش روی این صنعت هستند.
در این رابطه، اسدالله شاه بهرامی، دانشیار گروه مهندسی کامپیوتر دانشکده فنی دانشگاه گیلان و همکارانش میگویند: «یک سیستم تشخیص حالات چهره، دارای دو بخش مهم استخراج ویژگی و طبقهبندی حالات است. برخی از روشهای استخراج ویژگی شامل مدل ظاهری، هیستوگرام گرادیان جهتدار و الگوی دودویی محلی و برخی روشهای طبقهبندی حالات چهره نیز شامل ماشین بردار پشتیبان و شبکه عصبی پیچشی هستند».
به گفته آنها، «بر اساس تحقیقات موجود بهطورکلی مراحل شناسایی حالات چهره را میتوان به دو بخش استخراج ویژگی و طبقهبندی حالات تقسیمبندی کرد. در مرحله اول ویژگیهای هندسی یا ظاهری صورت از تصویر ورودی چهره استخراج میشوند. سپس در مرحله دوم، با توجه به ویژگیهای استخراجشده از یک طبقه بند استفاده میشود تا به تصویر ورودی یک برچسب از ۶ حالت پایه اختصاص داده شود».
همه این بررسیها نشان داد که روشهای مبتنی بر شبکه عصبی پیچشی نسبت به بقیه روشها دارای بالاترین دقت در تشخیص حالات چهره هستند و میتوان از آنها برای توسعه بیشتر سیستمهای تشخیصی استفاده نمود.
شایان ذکر است این یافتههای علمی در مجله «علوم رایانشی» متعلق به انجمن انفورماتیک ایران منتشر شدهاند.
گزارش: محمدرضا دلفیه
No tags for this post.