دانلود ترجمه مقاله برچسب گذاری موازی داده های انبوه XML با مپ ردیوس - مجله اشپرینگر

دانلود ترجمه مقاله برچسب گذاری موازی داده های انبوه XML با مپ ردیوس - مجله اشپرینگر
قیمت خرید این محصول
۴۱,۰۰۰ تومان
دانلود رایگان نمونه دانلود مقاله انگلیسی
عنوان فارسی
برچسب گذاری موازی داده های انبوه XML با مپ ردیوس
عنوان انگلیسی
Parallel labeling of massive XML data with MapReduce
صفحات مقاله فارسی
49
صفحات مقاله انگلیسی
30
سال انتشار
2014
نشریه
اشپرینگر - Springer
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
رفرنس
دارد
کد محصول
4049
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه شده است
رشته های مرتبط با این مقاله
مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
مهندسی الگوریتم ها و محاسبات، مهندسی نرم‌افزار و هوش مصنوعی
مجله
مجله ابر محاسبات
دانشگاه
گروه علوم کامپیوتر، جمهوری کره
کلمات کلیدی
محاسبه موازی، XML ، الگوریتم برچسب گذاری درختی، مپ ردیوس
فهرست مطالب
چکیده
۱ مقدمه
۲ کلیات
۱ ۲ طرحهای برچسب گذاری درختی و XML
۱ ۱ ۲ طرح برچسب گذاری بر مبنای بازه
۲ ۱ ۲ طرح برچسب گذاری بر مبنای پیشوند
۲ ۲ مپ ردیوس
۳ برچسب گذاری موازی XML با مپ ردیوس
۱ ۳ تقسیم داده های XML با XMLInput format
۲ ۳ الگوریتم برچسب گذاری موازی بر مبنای بازه
۳ ۳ الگوریتم برچسب گذاری موازی بر مبنای پیشوند
۴ بهینه سازیها
۱ ۴ توازن حجم کاردر زمان اجرا
۲ ۴ پارتیشن بندی یا بخش بندی مجدد داده ها
۵ مطالعه عملکرد
۱ ۵ راه اندازی آزمایش
۲ ۵ تحلیل عملکرد
۳ ۵ بهینه سازی
۶ کارهای وابسته
۷ نتیجه گیری
نحوه خرید نسخه پاورپوینت این مقاله
نمونه چکیده متن اصلی انگلیسی
Abstract

The volume of XML data has become enormous and still grows very quickly as many data have been typed in XML by virtue of its simplicity and extensibility. While a tree labeling algorithm has a crucial role in XML query processing, conventional algorithms are all sequential so that they fail to label a large volume of XML data in a timely manner. To address this issue, we devise parallel tree labeling algorithms for massive XML data. Specifically, we focus on how to efficiently label a single large XML file in parallel. We first propose parallel versions of two prominent tree labeling schemes based on the MapReduce framework. We then present techniques for runtime workload balancing and data repartition to solve performance issues caused by data skewness and MapReduce’s inherited limitation. Through extensive experiments with synthetic and real-world datasets on 15 nodes, we show that our parallel labeling algorithms are up to 17 times faster than conventional algorithms, providing strong durability against data skewness.

نمونه چکیده ترجمه متن فارسی
چکیده
حجم داده های XML به حد بسیار زیادی رسیده و با طبقه بندی در XML به خاطر سهولت و بسط پذیری اش، به سرعت رشد می کند. اگرچه الگوریتم برچسب گذاری درختی نقش کلیدی در پردازش پرس و جوی XML ایفا می کند، اما الگوریتم های معمولی همگی به صورت متوالی می باشند به گونه ای که قادر به برچسب گذاری به موقع حجم بزرگی از داده های XML نیستند. به منظور بررسی این مسئله، الگوریتم های برچسب گذاری درختی موازی را برای داده های انبوه XML توصیه می کنیم. مخصوصاً بر نحوه برچسب گذاری کارآمد یک فایل بزرگ XML به صورت موازی تاکید می کنیم. ابتدا ورژن های موازی دو طرح برچسب گذاری درختی بر اساس چارچوب را پیشنهاد می کنیم. سپس تکنیک هایی برای توازن حجم کار و پارتیشن بندی (بخش بندی) مجدد داده ها برای حل مسائل عملکردی ناشی از چولگی داده ها و محدودیت ذاتی مطرح می کنیم. از طریق آزمایشات گسترده با مجموعه داده های واقعی و مصنوعی برروی 15 گره، نشان می دهیم که الگوریتم های برچسب گذاری موازی 17 بار سریعتر از الگوریتم های معمولی عمل کرده و در برابر چولگی داده ها دوام بسیار زیادی دارند.

بدون دیدگاه