کاهش بعد داده ها ضمن حفظ خوشه های داده

نوع مقاله: مقاله پژوهشی

نویسندگان

گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

چکیده

در این مقاله، با توجه به موفقیت روش­های خوشه­بندی مبتنی بر k-means، یک روش کاهش ویژگی بر پایه k-means وزن دار ارائه می­شود. در روش پیشنهادی، نخست با استفاده از روش k-means وزن دار، به ویژگی­های داده­ها وزن داده می­شود. ویژگی­های وزین تر ضرورتا ویژگی­های مهمتر نیستند و وزن هر ویژگی، تنها بازه هر ویژگی را به نحوی تغییر می­دهد که خوشه­بندی بهتری صورت بگیرد. لذا، سپس با استفاده از یک مدل ریاضی جدید، کسری از ویژگی­های وزندار شده داده­های هر خوشه انتخاب می­شود به نحوی که کمترین تغییر در خوشه ها حاصل شود. تعداد ویژگی­های منتخب هر خوشه در روش پیشنهادی، برخلاف روش­های مشابهی چون k-means تنک و fuzzy c-means تنک بصورت صریح تعیین می­شود. درضمن، آزمایش­های تجربی روی چهار مجموعه داده واقعی نشان می­دهد که روش پیشنهادی، از دقت بیشتری نسبت به روش­های L1PCA, LLE و روش K-means تُنُک برخوردار است.

کلیدواژه‌ها