نماد سایت خبرگزاری سیناپرس

روشی برای بهبود طبقه‌بندی هوشمند تصاویر

در خصوص طبقه‌بندی عکس، روشی به نام «کدگذاری تنک» یا Sparse Coding Approach وجود دارد که می‌تواند تصاویر را با استفاده از تعداد کمی از ضرایب فعال نمایش دهد. بنابراین تفسیر و به‌کارگیری نمایش‌های تنک آسان بوده و نمایه‌سازی و بازیابی مؤثر تصاویر محتوایی را ساده می‌سازد.

در سال‌های اخیر، دامنه روش‌های کدگذاری تنک هرروزه در بسیاری از زمینه‌ها مانند شناسایی الگو، یادگیری ماشینی و پردازش سیگنال، تشخیص چهره، طبقه‌بندی تصویر و تشخیص حرکت گسترش‌یافته است. به گفته محققین، مهم‌ترین اهداف کدگذاری تنک، حفظ بیشترین وفاداری سیگنال و نیز بهبود کیفیت نمایشی است. برای رسیدن به این اهداف، کارهای زیادی برای اصلاح محدودیت پراکندگی شده است.

در سال‌های اخیر، دامنه روش‌های کدگذاری تنک هرروزه در بسیاری از زمینه‌ها مانند شناسایی الگو، یادگیری ماشینی و پردازش سیگنال، تشخیص چهره، طبقه‌بندی تصویر و تشخیص حرکت گسترش‌یافته است.

در رابطه با این تکنیک، پژوهشگرانی از کشورمان دست به کار شده و برای بهبود کارکرد آن به‌منظور بهترشدن شناسایی چهره و حرکات انسان مطالعه‌ای پژوهشی را انجام داده‌اند

دکتر محسن نیک پور، محقق دانشگاه صنعتی نوشیروانی بابل و یکی از مجریان این پروژه تحقیقی در خصوص انگیزه و هدف از اجرای این پروژه، در گفتگویی اختصاصی به خبرنگار سیناپرس گفت: «معمولاً در مکان‌های مختلف مانند فرودگاه‌ها، مکان‌های امنیتی و بانک‌ها از تکنیک‌ها و دستگاه‌های تشخیص چهره استفاده می‌شود. ولی هر روشی که ارائه می‌شود، مشکلات خاص خودش را دارد و لذا هدف ما در این تحقیق، آن بود که دقت این کار را بالا برده و مقداری از مشکلات روش‌های قبلی را برطرف نماییم».

به گفته دکتر نیک پور و همکارانش، در پروژه تحقیقی آن‌ها، به‌منظور بهبود روش کدگذاری تنک، محدودیتی غیرمنفی به عملکرد هدف روش پایه آن افزوده شده است.

محققین فوق، به‌منظور آزمایش روش ارائه‌شده خود که «کدگذاری تنک با نمودار وابسته تعدیل‌شده» نام‌گذاری شده، دو آزمایش مختلف انجام دادند که نتایج آن‌ها نشان داد که روش ارائه‌شده، عملکرد بسیار بهتری نسبت به دو روش مبنا دارد و دقت تا 91 درصد را در طبقه‌بندی صحیح عکس‌ها ارائه می‌دهد.

به‌علاوه، نتایج به‌دست‌آمده از تحقیق دکتر نیک پور و همکارانش در این پژوهش، نشان از آن دارد که روش ارائه‌شده را می‌توان برای مجموعه داده‌های شناسایی حرکات انسان نیز به کار برد.

این محقق در خصوص کارکرد فعلی سیستم‌های تشخیص چهره در ایران به خبرنگار سیناپرس گفت: «در حال حاضر، استفاده از چنین سیستم‌هایی به‌صورت گسترده و قابل‌توجه در کشور ما وجود ندارد. فقط در فرودگاه‌ها از دوربین استفاده می‌شود. بااین‌حال تشخیص چهره شاید فقط توسط بانک‌ها انجام شود که البته آن‌هم به‌صورت پکیج آماده از خارج از کشور و به‌طور ویژه از کشور چین وارد می‌شود».

نیک پور در مورد مشکلات موجود بر سر راه عملی شدن روش‌های تشخیص چهره و عدم استفاده از آن‌ها به‌صورت گسترده‌تر اعتقاد دارد: «دلیل اول آن است که هزینه این کار بالا است و بسیاری از شرکت‌ها حاضر به سرمایه‌گذاری در این مورد نیستند. دلیل بعدی عدم اطمینان کافی از نتیجه‌بخش بودن کار است. ما در این خصوص به شرکت‌هایی نیاز داریم که حاضر باشند روی ایده‌های جدید سرمایه‌گذاری کنند. ولی آن‌ها در حال حاضر، چنین ریسکی را نمی‌پذیرند و سراغ مواردی می‌روند که امتحان خود را پس داده و سرمایه‌گذاری در آن‌ها مطمئن‌تر است. از طرفی وجود واسطه‌ها در این میان، باعث شده است که دستگاه‌های آماده با هزینه پایین‌تری وارد کشور شوند».

این محقق در ادامه افزود: «تعداد بسیاری واسطه وجود دارند که مانع از عملی شدن پروژه‌های این‌چنینی می‌شوند. در این رابطه، افراد خلاقی وجود دارند که تا مرحله ثبت اختراع پیش رفته‌اند، ولی به دلیل وجود همین موانع و واسطه‌ها نتوانسته‌اند ایده خود را اجرایی و تجاری‌سازی کنند».

شایان‌ذکر است دکتر نیک پور و همکاران پژوهشی او که نتایج مطالعه خود را در نشریه بین‌المللیInformation Systems & Telecommunication وابسته به پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی منتشر نموده‌اند، در کارهای آینده قصد دارند روش ارائه‌شده را برای مجموعه داده‌های مربوط به شناسایی حرکات مصنوعی و واقعی به کار ببرند تا از این طریق، روش ارائه‌شده را بهتر ارزیابی کنند.

گزارش و گفتگو: دکتر محمدرضا دلفیه

منبع: Information Systems & Telecommunication

No tags for this post.
خروج از نسخه موبایل