ترجمه مقاله نقش ضروری ارتباطات 6G با چشم انداز صنعت 4.0
- مبلغ: ۸۶,۰۰۰ تومان
ترجمه مقاله پایداری توسعه شهری، تعدیل ساختار صنعتی و کارایی کاربری زمین
- مبلغ: ۹۱,۰۰۰ تومان
As technology advances both in increasing bandwidth and in reducing latency for I/O buses and devices, moving I/O data in/out memory has become critical. In this paper, we have observed the different characteristics of I/O and CPU memory reference behavior, and found the potential benefits of separating I/O data from CPU data. We propose a DMA cache technique to store I/O data in dedicated on-chip storage and present two DMA cache designs. The first design, Decoupled DMA Cache (DDC), adopts additional on-chip storage as the DMA cache to buffer I/O data. The second design, Partition-Based DMA Cache (PBDC), does not require additional on-chip storage, but can dynamically use some ways of the processor’s last level cache (LLC) as the DMA cache. We have implemented and evaluated the two DMA cache designs by using an FPGA-based emulation platform and the memory reference traces of real-world applications. Experimental results show that, compared with the existing snooping-cache scheme, DDC can reduce memory access latency (in bus cycles) by 34.8% on average (up to 58.4%), while PBDC can achieve about 80% of DDC’s performance improvements despite no additional on-chip storage.
با پیشرفت فناوری در هر دوی افزایش پهنای باند و کاهش نهفتگی برای دستگاهها و گذرگاههای I/O، حرکت حافظهی درونی/بیرونی دادههای I/O، حیاتی شده است. ما در این مقاله، مشخصات مختلف I/O و رفتار مرجع حافظهی CPU را مشاهده کردهایم و مزایای بالقوهی جداسازی دادههای I/O از دادههای CPU را کشف کردهایم. ما یک تکنیک مخزن DMA را برای ذخیرهی دادههای I/O در ذخیرهسازی اختصاصی تراشهای پیشنهاد میکنیم و دو طرح مخزن DMA را ارائه میدهیم. طرح اول، مخزن جدای DMA (DDC)، ذخیرهی تراشهای اضافی را به عنوان مخزن DMA برای ذخیرهی دادههای I/O استفاده میکند. طرح دوم، مخزن مبتنی بر افراز DMA (PBDC)، نیاز به ذخیرهی تراشهای اضافی ندارد، اما میتواند به طور پویا از برخی روشهای مخزن سطح نهایی پردازشگر (LLC) به عنوان مخزن DMA استفاده کند.
ما دو طرح مخزن DMA را با استفاده از یک پلتفرم شبیهسازی مبتنی بر FPGA و مسیرهای حافظهی مرجع برنامههای جهان واقعی اجرا و ارزیابی کردهایم. نتایج تجربی نشان میدهند که در مقایسه با طرح مخزن جاسوسی موجود، DDC میتواند نهفتگی دسترسی حافطه (در چرخههای گذرگاه ) به طور متوسط به اندازهی ۳۴/۸ درصد (تا ۵۸/۴ درصد) کاهش دهد. در حالی که PBDC میتواند حدود ۸۰ درصد از پیشرفتهای عملکردی DDC را علیرغم عدم ذخیرهی تراشهای اضافی حاصل کند.