خوشه‌بندی مبتنی بر ماشین بردار پشتیبان دوقلو به منظور انتخاب ویژگی در مساله دسته‌بندی داده‌های ریزآرایه

نوع مقاله: مقاله پژوهشی

نویسندگان

گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

چکیده

طبقه‌بندی سرطان، به عنوان مسئله‌ای مهم در تشخیص و درمان سرطان به شمار می‌رود. یکی از موثرترین روش‌ها در طبقه‌بندی سرطان، شناسایی ژن‌هایی مرتبط و تبعیض‌آمیز برای طبقه‌بندی نمونه‌ها در آنالیز بیانی ژن می‌باشد. در روش پیشنهادی در این مقاله، با خوشه‌بندی ویژگی‌ها و اعمال انتخاب ویژگی درون خوشه‌ها، انتظار می‌رود که متمایز کننده‌ترین و مهم‌ترین ویژگی‌ها استخراج شوند. در روش پیشنهادی، به منظور کاهش ابعاد مجموعه داده، تکنیک انتخاب ویژگی مبتنی بر اهمیت ویژگی‌ها به کار گرفته می‌شود، ویژگی‌های رتبه بالا استخراج شده و جهت خوشه‌بندی به ماشین بردار پشتیبان دوقلو برای خوشه‌بندی ارائه می‌شوند. پس از خوشه‌بندی، با به کار گرفتن تکنیک انتخاب ویژگی مبتنی بر همبستگی، قابل اعتمادترین ویژگی‌ها انتخاب شده و توسط طبقه‌بند پرسپترون چندلایه، طبقه‌بندی می‌شوند. جهت ارزیابی روش پیشنهادی، از چهار مجموعه داده‌ی SRBCT، Leukemia، DLBCL و Prostate استفاده شده است. نتایج آزمایشات بیانگر بهبود عملکرد دقت طبقه‌بندی می‌باشد.

کلیدواژه‌ها