شناسایی رابطه تقابل در گفتمان فارسی

گفتمان به هر قطعه یا پاره ای از زبان گفته می شود كه به قصد برقراری ارتباط به كاربرده شده باشد. سامانه شناسایی روابط موجود در گفتمان، روابط موجود بین واحدهای متنی یك گفتمان را شناسایی می كند. یكی از روابط موجود در گفتمان های زبان فارسی رابطه تقابل است كه شناسایی آن به توانایی تولید و درك گفتمان كمك می كند و در سامانه های متعددی مانند خلاصه ساز، تفسیر و… كاربرد دارد.

رابطه تقابل می تواند به كمك نقش نماهای خاص رابطه تقابل مانند «اما» و «ولی» شناسایی شود؛ اما در بعضی موارد این نقش نماها حذف می شوند و شناسایی رابطه را با مشكل مواجه می كنند و باید از ویژگی هایی مانند زمان فعل ها، جفت كلمات و … برای شناسایی استفاده كرد. به همین دلیل نیز به تازگی تحقیقاتی در این زمینه انجام شده است.

برای انجام این آزمایش ها، تعداد ده هزار نمونه از رابطه تقابل و سایر روابط از پیكره متنی پژوهشكده هوشمند علائم به عنوان مجموعه داده توسط محققان گردآوری شد. از این نمونه ها، بردار ویژگی استخراج شد و در نهایت برای دسته بندی و تشخیص رابطه تقابل از چند روش یادگیری با سرپرستی شامل ماشین بردار پشتیبان، K نزدیك ترین همسایه، پنجره پارزن و همچنین تركیب این دسته بندها استفاده شد. در نهایت نیز پژوهشگران اعلام کرده اند که تحقیقات آنها نشان داده است که بهترین میزان صحت 13/ 87 و مربوط به تركیب دسته بندها در بهترین حالت است.

منبع:‌ حبیب خدادادی، سعید راحتی قوچانی، اعظم استاجی،1394، شناسایی رابطه تقابل در گفتمان فارسی به كمك روش های یادگیری با سرپرستی. فصلنامه پردازش علائم و داده ها، سال دوازدهم، شماره 2 (پیاپی 24).

لینک منبع

No tags for this post.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا