گفتمان به هر قطعه یا پاره ای از زبان گفته می شود که به قصد برقراری ارتباط به کاربرده شده باشد. سامانه شناسایی روابط موجود در گفتمان، روابط موجود بین واحدهای متنی یک گفتمان را شناسایی می کند. یکی از روابط موجود در گفتمان های زبان فارسی رابطه تقابل است که شناسایی آن به توانایی تولید و درک گفتمان کمک می کند و در سامانه های متعددی مانند خلاصه ساز، تفسیر و… کاربرد دارد.
رابطه تقابل می تواند به کمک نقش نماهای خاص رابطه تقابل مانند «اما» و «ولی» شناسایی شود؛ اما در بعضی موارد این نقش نماها حذف می شوند و شناسایی رابطه را با مشکل مواجه می کنند و باید از ویژگی هایی مانند زمان فعل ها، جفت کلمات و … برای شناسایی استفاده کرد. به همین دلیل نیز به تازگی تحقیقاتی در این زمینه انجام شده است.
برای انجام این آزمایش ها، تعداد ده هزار نمونه از رابطه تقابل و سایر روابط از پیکره متنی پژوهشکده هوشمند علائم به عنوان مجموعه داده توسط محققان گردآوری شد. از این نمونه ها، بردار ویژگی استخراج شد و در نهایت برای دسته بندی و تشخیص رابطه تقابل از چند روش یادگیری با سرپرستی شامل ماشین بردار پشتیبان، K نزدیک ترین همسایه، پنجره پارزن و همچنین ترکیب این دسته بندها استفاده شد. در نهایت نیز پژوهشگران اعلام کرده اند که تحقیقات آنها نشان داده است که بهترین میزان صحت 13/ 87 و مربوط به ترکیب دسته بندها در بهترین حالت است.
منبع: حبیب خدادادی، سعید راحتی قوچانی، اعظم استاجی،1394، شناسایی رابطه تقابل در گفتمان فارسی به کمک روش های یادگیری با سرپرستی. فصلنامه پردازش علائم و داده ها، سال دوازدهم، شماره 2 (پیاپی 24).

