چکیده
1. مقدمه
2. مدل پیشنهادی
3. نتایج شبیهسازی و بحث
4. نتیجهگیری
منابع
چکیده
در حال حاضر اکثریت مردم به اشتراکگذاری ایدهها، بازخوردها، پیشنهاد برای هر موضوع مجزا در وبگاهها ، انجمنهای اینترنتی و بلاگها علاقهمند هستند. بنابراین، مصرفکنندگان قبل از خرید محصول یا بهرهوری از خدمات، به ارزیابیها و نقدهای پیشین اتکا میکنند. هرچند تمام نقدهای موجود در اینترنت معتبر نیستند. هرزنامهها نقدها را به نفع خود، کاهش ارزش یا ارتقای محصول، دستکاری میکنند. بنابراین، مشتریها تحت تاثیر نقدهای جعلی، مانند محتوای اسپم ، تصمیم اشتباه اتخاذ میکنند. برای حل این مشکل، روش دوگانهی بهبود بهینهسازی ازدحام ذرات دودویی و الگوریتم جهش قورباغهی آمیخته پیشنهاد شده تا ابعاد بزرگ مجموعهی ویژگی کاهش و زیرمجموعهی بهینهسازی شدهی ویژگی انتخاب شود. روش ما به نادیدهگرفتن نقدهای جعلی توسط مشتریها کمک کرده و عملکرد طبقهبندی را با تامین نقدهای مطمئن افزایش میدهد. برای طبقهبندی از دستهبندیکنندههای بیز ساده ، نزدیکترین همسایه K ، ماشین بردار پشتیبانی استفاده شده است. با توجه به نتایج روش دوگانهی پیشنهادی انتخاب ویژگی، یک زیرمجموعهی بهینهی ویژگی ارائه کرده و از دقت بالای طبقهبندی برخوردار است.
مدل پیشنهادی
مدل پیشنهادی از الگوریتم فرگشتی برای FS استفاده میکند تا زیرمجموعهی ویژگی برای دستیابی به نتایج بهتر دستهبندی و شناسایی نقدهای جعلی حاصل شود. این مدل شامل چهار مرحله به نامهای پیشپردازش ، استخراج ویژگی ، انتخاب ویژگی بر اساس iBPSO و SFLA دوگانه، و دستهبندی است. نمودار بلوکی سیستم پیشنهادی در تصویر 1 آورده شده است.
پردازش داده
مرحلهی پیشپردازش شامل چهار فاز نشانهگذاری ، حذف کلمات توقف ، ریشهیابی و سِنتیوُردنِت است. ابتدا با روند نشانهگذاری رشتهها به نشانهها تبدیل میشود. سپس، هر سند به نشانهها تقسیم میشود. بعد از فاز نشانهگذاری، کلمات توقف از مجموعهی داده حذف میشود. بهدنبال آن با ریشهیابی، ریشهی واژه از کلمه انتخاب میشود. در نهایت با استفاده از سنتیوردنت، استخراج ویژگیها انجام میشود [17]. هدف سنتیوردنت تامین یک افزونه برای ورد نت است، بهگونهای که تمام مجموعههای مترادف با مقادیر منفی، مثبت یا بیطرف ضمنی ارتباط داده شوند. نمرههای مثبت و منفی برای نقد با محاسبهی میانگین نمرات مثبت و منفی تعیین میشود. سپس نمرهی بیطرف با معادلهی (1) محاسبه میشود. اگر نمرهی بیطرف کمتر از آستانه باشد، کلمات حذف میشوند در غیر اینصورت، کلمات برای پردازش بیشتر به مرحلهی بعدی فرستاده میشوند.