ترجمه مقاله دسته بندی اسناد متنی بر اساس ماشین های دارای بردار پشتیبان مربع حداقل با تجزیه مقدار واحد
عنوان فارسی: | دسته بندی اسناد متنی بر اساس ماشین های دارای بردار پشتیبان مربع حداقل با تجزیه مقدار واحد |
عنوان انگلیسی: | Text Document Classification based-on Least Square Support Vector Machines with Singular Value Decomposition |
تعداد صفحات مقاله انگلیسی : 6 | تعداد صفحات ترجمه فارسی : 12 |
سال انتشار : 2011 | فرمت مقاله انگلیسی : PDF |
فرمت ترجمه مقاله : ورد تایپ شده | کد محصول : F667 |
محتوای فایل : zip | حجم فایل : 826.85Kb |
رشته های مرتبط با این مقاله: مهندسی کامپیوتر و فناوری اطلاعات |
گرایش های مرتبط با این مقاله: مدیریت سیستمهای اطلاعات و رایانش ابری |
مجله: مجله بین المللی کاربرد های کامپیوتر - International Journal of Computer Applications |
دانشگاه: گروه CSE هندوستان |
کلمات کلیدی: طبقه بندی متن، ماشین های دارای بردار پشتیبان مربع حداقل، تجزیه مقدار واحد |
وضعیت ترجمه عناوین تصاویر : ترجمه شده است |
وضعیت ترجمه متون داخل تصاویر : ترجمه نشده است |
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است |
چکیده
1.مقدمه
2. پیش پردازش
2.1 روش انتخاب کلمات کلیدی
2.2 مدل فضای برداری
3. تجزیه مقدار واحد
3.1 روش تجزیه به کمک SVD
4. طبقه بندی
4.1 ماشین های بردار پشتیبان
4.1.1 حالت خطی قابل جداسازی
4. 2 SVM مربع حداقل
5. راه کار ما
6. نتایج آزمایشی
7. نتیجه گیری و تحقیقات آینده
ABSTRACT
Due to rapid growth of on-line information, text classification has become one of key technique for handling and organizing text data. One of the reasons to build taxonomy of documents is to make it easier to find relevant documents, content filtering and topic tracking. LS-SVM is the classifier, used in this paper for efficient classification of text documents. Text data is normally highdimensional characteristic, to reduce the high-dimensionality also possible with SVM. In this paper we are improving classification accuracy and dimensionality reduction of a large text data by Least Square Support Vector Machines along with Singular Value Decomposition.
چکیده
به دلیل رشد سریع اطلاعات آنلاین، طبقه بندی متون به یکی از تکنیک های کلیدی در مدیریت و سازماندهی داده های متنی تبدیل شده است. یکی از دلایل طبقه بندی اسناد، سادهتر کردن کشف اسناد مرتبط، پالایش و فیلتر کردن محتوا و پیگیری عناوین است.
LS-SVM یک نوع طبقه بندی است که در این مقاله برای طبقه بندی مناسب اسناد متنی از آن استفاده شده است. دادههای متنی معمولاً مشخصاتی چند بعدی هستند که کاهش ابعاد آنها را هم میتوان با SVM انجام داد. در این مقاله، با استفاده از ماشین های دارای بردار پشتیبان مربع حداقل و تجزیه مقدار واحد، دقت طبقهبندی را افزایش و ابعاد داده های متنی بزرگ را کاهش می دهیم.