بهبود عملکرد دسته‌بند k نزدیک‌ترین همسایه با الگوریتم بهینه‌‌سازی ازدحام گربه‌‌ها برای تشخیص ایمیل‌‌های هرزنامه

نوع مقاله: مقاله پژوهشی

نویسندگان

چکیده

با گسترش اینترنت و شبکه‌‌های آنلاین و پیوستن کاربران به این شبکه‌‌ها باعث شده است که هر تبلیغی بر روی آن‌ها انجام شود و نظر کاربران را با روش‌‌های گوناگون جلب کنند. مهم‌ترین روشی که از آن به‌عنوان روشی برای تبلیغ استفاده می‌‌شود، ایمیل است. کاربران از طریق هرز نامه‌نویس‌ها با انبوهی از ایمیل هرزنامه‌‌ها مواجه هستند و زمان و حافظه آن‌ها با این ایمیل‌‌ها مختل می‌‌شود. یک مشکل دیگر در ایمیل هرزنامه این است که برخی از هرز نامه‌نویس‌ها از ایمیل هرزنامه به‌منظور اهداف امنیتی و دزدی هویتی استفاده می‌‌کنند و با این روش وارد کامپیوتر کاربر و حساب‌‌های شخصی کاربر می‌‌شوند. لذا چالش اصلی در تشخیص ایمیل هرزنامه، تفکیک ایمیل‌‌های هرزنامه از غیر هرزنامه است. برای حل این مشکل باید ویژگی‌‌های ایمیل مانند عنوان، متن و کاراکترها تشخیص داده شود. در این مقاله مدل ترکیبی برمبنای k نزدیک‌ترین همسایه و الگوریتم بهینه‌‌سازی اجتماع گربه برای تشخیص ایمیل هرزنامه استفاده‌شده است. از الگوریتم بهینه‌‌سازی اجتماع گربه برای انتخاب ویژگی و جستجو در فضای بردارهای ویژگی و از k نزدیک‌ترین همسایه برای طبقه‌‌بندی داده‌‌ها استفاده‌شده است. نتایج ارزیابی بر روی مجموعه داده Spambase نشان داده که دقت تشخیص مدل پیشنهادی برمبنای 20 بار تکرار برابر با 97.61 درصد می‌باشد.

کلیدواژه‌ها