تشخیص اسپم در شبکه های اجتماعی

شبکه های اجتماعی به مردم فرصتی برای دسترسی به اخبار و رویدادهای جدید در سراسر جهان را می دهند.
در میان این شبکه ها توییتر به فضایی محبوب برای تبادل اطلاعات و نظرات در جهان تبدیل شده است. این میزان محبوبیت و جامعیت، هدف مناسبی برای فعالیت های مخرب و اسپمرها شده است. اسپم یا هرزنامه، یک پست الکترونیکی ناخواسته است. اسپم معمولاً تبلیغاتی است که برای برخی از محصولات به لیست پستی ارسال میشود.
اسپم ها علاوه بر هدر دادن وقت افراد، مقدار زیادی از پهنای باند شبکه را نیز اشغال میکنند. در نتیجه، سازمانها و افراد برای مبارزه با اسپم، تکنیکهای مختلفی را اتخاذ کردهاند. اما چون اینترنت یک پلتفرم عمومی است، روشهای محدودی برای جلوگیری از اسپم وجود دارد. چون جلوگیری از ایمیلهای ناخواسته امکان پذیر نیست، با این حال برخی از خدمات آنلاین، سیاستهایی را برای جلوگیری از اسپم آغاز کردهاند.
در راستای مقابله با اسپم مطالعات فراوانی با رویکردهای یادگیری ماشین صورت گرفته است و محققان نتایج امیدوار کننده ای به دست آورده اند.
در سال های اخیر الگوریتم های یادگیری ترکیبی به عنوان یکی از تکنیک های یادگیری نظارتی مدرن با توجه به دقت بالای آن یکی از گزینه های مناسب در فرآیند داده کاوی مورد استفاده قرار گرفته است.
در مقاله «تشخیص اسپم در شبکه های اجتماعی با استفاده از یادگیری ترکیبی» که در پنجمین کنفرانس وب پژوهی ارائه شده است. استفاده از یادگیری ترکیبی برای تشخیص اسپم در شبکه اجتماعی توییتر پیشنهاد شده است. در روش پیشنهادی پس از جمع آوری داده ای، پیش پردازی، استخراج و انتخاب ویژگی های مناسب، سپس طبقه بندی توسط یادگیری ترکیبی با استفاده از درخت تصمیم، نزدیکترین همسایه و بیز ساده صورت گرفته است و نتایج حاصل در مقایسه با سایر الگوریتم های طبقه بندی مورد مقایسه و ارزیابی قرار گرفته است.
بر اساس این گزارش، مقاله ای تحت عنوان «تشخیص اسپم در شبکه های اجتماعی با استفاده از یادگیری ترکیبی» که در پنجمین کنفرانس وب پژوهی ارائه شد توسط محمد مهدی کاوسی، علیرضا رضوانیان از پژوهشکده علوم کامپیوتر، پژوهشگاه دانش های بنیادی (IPM) ایران تالیف شده است.
No tags for this post.