روشی برای بهبود طبقهبندی هوشمند تصاویر
در خصوص طبقهبندی عکس، روشی به نام «کدگذاری تنک» یا Sparse Coding Approach وجود دارد که میتواند تصاویر را با استفاده از تعداد کمی از ضرایب فعال نمایش دهد. بنابراین تفسیر و بهکارگیری نمایشهای تنک آسان بوده و نمایهسازی و بازیابی مؤثر تصاویر محتوایی را ساده میسازد.
در سالهای اخیر، دامنه روشهای کدگذاری تنک هرروزه در بسیاری از زمینهها مانند شناسایی الگو، یادگیری ماشینی و پردازش سیگنال، تشخیص چهره، طبقهبندی تصویر و تشخیص حرکت گسترشیافته است. به گفته محققین، مهمترین اهداف کدگذاری تنک، حفظ بیشترین وفاداری سیگنال و نیز بهبود کیفیت نمایشی است. برای رسیدن به این اهداف، کارهای زیادی برای اصلاح محدودیت پراکندگی شده است.
در سالهای اخیر، دامنه روشهای کدگذاری تنک هرروزه در بسیاری از زمینهها مانند شناسایی الگو، یادگیری ماشینی و پردازش سیگنال، تشخیص چهره، طبقهبندی تصویر و تشخیص حرکت گسترشیافته است.
در رابطه با این تکنیک، پژوهشگرانی از کشورمان دست به کار شده و برای بهبود کارکرد آن بهمنظور بهترشدن شناسایی چهره و حرکات انسان مطالعهای پژوهشی را انجام دادهاند
دکتر محسن نیک پور، محقق دانشگاه صنعتی نوشیروانی بابل و یکی از مجریان این پروژه تحقیقی در خصوص انگیزه و هدف از اجرای این پروژه، در گفتگویی اختصاصی به خبرنگار سیناپرس گفت: «معمولاً در مکانهای مختلف مانند فرودگاهها، مکانهای امنیتی و بانکها از تکنیکها و دستگاههای تشخیص چهره استفاده میشود. ولی هر روشی که ارائه میشود، مشکلات خاص خودش را دارد و لذا هدف ما در این تحقیق، آن بود که دقت این کار را بالا برده و مقداری از مشکلات روشهای قبلی را برطرف نماییم».
به گفته دکتر نیک پور و همکارانش، در پروژه تحقیقی آنها، بهمنظور بهبود روش کدگذاری تنک، محدودیتی غیرمنفی به عملکرد هدف روش پایه آن افزوده شده است.
محققین فوق، بهمنظور آزمایش روش ارائهشده خود که «کدگذاری تنک با نمودار وابسته تعدیلشده» نامگذاری شده، دو آزمایش مختلف انجام دادند که نتایج آنها نشان داد که روش ارائهشده، عملکرد بسیار بهتری نسبت به دو روش مبنا دارد و دقت تا 91 درصد را در طبقهبندی صحیح عکسها ارائه میدهد.
بهعلاوه، نتایج بهدستآمده از تحقیق دکتر نیک پور و همکارانش در این پژوهش، نشان از آن دارد که روش ارائهشده را میتوان برای مجموعه دادههای شناسایی حرکات انسان نیز به کار برد.
این محقق در خصوص کارکرد فعلی سیستمهای تشخیص چهره در ایران به خبرنگار سیناپرس گفت: «در حال حاضر، استفاده از چنین سیستمهایی بهصورت گسترده و قابلتوجه در کشور ما وجود ندارد. فقط در فرودگاهها از دوربین استفاده میشود. بااینحال تشخیص چهره شاید فقط توسط بانکها انجام شود که البته آنهم بهصورت پکیج آماده از خارج از کشور و بهطور ویژه از کشور چین وارد میشود».
نیک پور در مورد مشکلات موجود بر سر راه عملی شدن روشهای تشخیص چهره و عدم استفاده از آنها بهصورت گستردهتر اعتقاد دارد: «دلیل اول آن است که هزینه این کار بالا است و بسیاری از شرکتها حاضر به سرمایهگذاری در این مورد نیستند. دلیل بعدی عدم اطمینان کافی از نتیجهبخش بودن کار است. ما در این خصوص به شرکتهایی نیاز داریم که حاضر باشند روی ایدههای جدید سرمایهگذاری کنند. ولی آنها در حال حاضر، چنین ریسکی را نمیپذیرند و سراغ مواردی میروند که امتحان خود را پس داده و سرمایهگذاری در آنها مطمئنتر است. از طرفی وجود واسطهها در این میان، باعث شده است که دستگاههای آماده با هزینه پایینتری وارد کشور شوند».
این محقق در ادامه افزود: «تعداد بسیاری واسطه وجود دارند که مانع از عملی شدن پروژههای اینچنینی میشوند. در این رابطه، افراد خلاقی وجود دارند که تا مرحله ثبت اختراع پیش رفتهاند، ولی به دلیل وجود همین موانع و واسطهها نتوانستهاند ایده خود را اجرایی و تجاریسازی کنند».
شایانذکر است دکتر نیک پور و همکاران پژوهشی او که نتایج مطالعه خود را در نشریه بینالمللیInformation Systems & Telecommunication وابسته به پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی منتشر نمودهاند، در کارهای آینده قصد دارند روش ارائهشده را برای مجموعه دادههای مربوط به شناسایی حرکات مصنوعی و واقعی به کار ببرند تا از این طریق، روش ارائهشده را بهتر ارزیابی کنند.
گزارش و گفتگو: دکتر محمدرضا دلفیه
منبع: Information Systems & Telecommunication
No tags for this post.