ترجمه مقاله مدل های زبان روان و سلیس شکلک های اینترنتی برای تحلیل احساسات توییتر - نشریه ACM

ترجمه مقاله مدل های زبان روان و سلیس شکلک های اینترنتی برای تحلیل احساسات توییتر - نشریه ACM
قیمت خرید این محصول
۲۹,۰۰۰ تومان
دانلود مقاله انگلیسی
عنوان فارسی
مدل های زبان روان و سلیس شکلک های اینترنتی برای تحلیل احساسات توییتر
عنوان انگلیسی
Emoticon Smoothed Language Models for Twitter Sentiment Analysis
صفحات مقاله فارسی
19
صفحات مقاله انگلیسی
7
سال انتشار
2012
رفرنس
دارای رفرنس در داخل متن و انتهای مقاله
نشریه
ACM
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
فونت ترجمه مقاله
بی نازنین
سایز ترجمه مقاله
14
نوع مقاله
ISI
نوع ارائه مقاله
کنفرانس
کد محصول
F1533
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است ✓
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است ☓
وضعیت ترجمه منابع داخل متن
به صورت انگلیسی درج شده است ✓
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است
بیس
نیست ☓
مدل مفهومی
ندارد ☓
پرسشنامه
ندارد ☓
متغیر
ندارد ☓
رفرنس در ترجمه
در داخل متن و انتهای مقاله درج شده است
رشته و گرایش های مرتبط با این مقاله
مهندسی کامپیوتر، فناوری اطلاعات، هوش مصنوعی، اینترنت و شبکه های گسترده
کنفرانس
مجموعه مقالات بیست و ششم کنفرانس AAAI در مورد هوش مصنوعی
دانشگاه
گروه علوم کامپیوتر و مهندسی، دانشگاه جیانگ تانگ شانگهای، چین
فهرست مطالب
چکیده
مقدمه
کارهای مرتبط
رویکرد ما
مدل های زبانی برای SA
مدل شکلک های اینترنتی
ESLAM
آزمایشات
مجموعه داده ها
طرح ارزیابی و معیارها
اثر شکلک های اینترنتی
اثر داده های برچسب گذاری شده دستی
حساسیت به پارامترها
نتیجه گیری
نمونه چکیده متن اصلی انگلیسی
Abstract

Twitter sentiment analysis (TSA) has become a hot research topic in recent years. The goal of this task is to discover the attitude or opinion of the tweets, which is typically formulated as a machine learning based text classification problem. Some methods use manually labeled data to train fully supervised models, while others use some noisy labels, such as emoticons and hashtags, for model training. In general, we can only get a limited number of training data for the fully supervised models because it is very labor-intensive and time-consuming to manually label the tweets. As for the models with noisy labels, it is hard for them to achieve satisfactory performance due to the noise in the labels although it is easy to get a large amount of data for training. Hence, the best strategy is to utilize both manually labeled data and noisy labeled data for training. However, how to seamlessly integrate these two different kinds of data into the same learning framework is still a challenge. In this paper, we present a novel model, called emoticon smoothed language model (ESLAM), to handle this challenge. The basic idea is to train a language model based on the manually labeled data, and then use the noisy emoticon data for smoothing. Experiments on real data sets demonstrate that ESLAM can effectively integrate both kinds of data to outperform those methods using only one of them.

نمونه چکیده ترجمه متن فارسی
چکیده
در سال های اخیر, تحلیل احساسات توییتر (TSA) به موضوع پژوهشی داغی تبدیل شده است. هدف از پژوهش حاضر, کشف نگرش یا عقیده توییت ها است که نوعاً به عنوان یک مسئله طبقه بندی متن مبتنی بر دانش ماشین تنظیم می شود. برخی روش ها از داده های برچسب گذاری شده دستی برای آموزش مدل های کامل نظارت شده استفاده می کنند, در حالیکه دیگر روش ها از برخی از برچسب های صدادار استفاده می کنند, مانند شکلک های اینترنتی یا هشتگ ها. به طور کلی, ما تنها می توانیم تعداد محدودی از داده های آموزش را برای مدل های کاملاً نظارت شده به دست آوریم, زیرا برچسب گذاری دستی توییت ها بسیار زمانبر و سخت است. در روش های به کار برده شده برای مدل های صدادار, دستیابی به عملکرد رضایت بخش به دلیل نویز (صدای) موجود در برچسب ها سخت است, هرچند دستیابی به میزان زیادی از داده ها برای آموزش آسان می باشد. از اینرو, بهترین راهبرد, استفاده از داده های برچسب گذاری شده دستی و داده های برچسب گذاری شده است. هرچند, نحوه ادغام بی عیب و ایراد این دو نوع متفاوت از داده ها در یک چارچوب آموزش, هنوز یک چالش است. در این مقاله, ما یک مدل جدید را ارائه می دهیم که مدل های زبان روان و سلیس شکلک های اینترنتی (ESLAM) نامیده می شود که این چالش را برطرف خواهد نمود. ایده اصلی این روش, آموزش یک مدل زبانی بر اساس داده های برچسب گذاری شده دستی و سپس استفاده از داده های شکلک اینترنتی صدادار برای روانسازی است. آزمایشات روی مجموعه داده های واقعی نشان می دهد که ESLAM می تواند به طور موثر هر دو نوع داده را برای عملکرد برتر نسبت به هر یک از این روش ها ادغام نماید.

بدون دیدگاه