ترجمه مقاله روش تقسیم بندی جدید برای متن فارسی با هر فونت – نشریه الزویر

عنوان فارسی: | روش تقسیم بندی جدید برای متن فارسی با هر فونت |
عنوان انگلیسی: | A new segmentation technique for omnifont Farsi text |
تعداد صفحات مقاله انگلیسی : 8 | تعداد صفحات ترجمه فارسی : 12 |
سال انتشار : 2001 | نشریه : الزویر - Elsevier |
فرمت مقاله انگلیسی : PDF | فرمت ترجمه مقاله : ورد تایپ شده |
نوع مقاله : ISI | نوع نگارش : مقاله کوتاه (Short Communication) |
پایگاه : اسکوپوس | کد محصول : 9519 |
محتوای فایل : rar | حجم فایل : 1.17Mb |
رشته های مرتبط با این مقاله: مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله: مهندسی الگوریتم ها و محاسبات، هوش مصنوعی |
مجله: اسناد تشخیص الگو - Pattern Recognition Letters |
دانشگاه: گروه مهندسی برق، دانشگاه تربیت مدرس، تهران، ایران |
کلمات کلیدی: متن فارسی. با هر فونت. تقسیم بندی کاراکتر. ردیابی حد فاصل. کد زنجیره ای |
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است ✓ |
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه شده است ✓ |
وضعیت ترجمه منابع داخل متن: به انگلیسی درج شده است ✓ |
doi یا شناسه دیجیتال: https://doi.org/10.1016/S0167-8655(00)00086-6 |
چکیده
1- مقدمه
2- پیش پردازش
2-1- محاسبه اندازه قلم
2-2 تشخیص خط مبنای کلی
2-3- تنظیم خط مبنای موضعی
3- الگوریتم تقسیم بندی
3- 1- برچسب گذاری حد فاصل
3-2 تقسیم بندی کاراکتر
4- پس از پردازش
5- نتایج تجربی
6- نتیجه گیری
Abstract
A new segmentation algorithm based on the conditional labeling of the upper contour is presented. A pre-processing technique is proposed that adjusts the local base line for each subword. The algorithm was tested on a data set of printed Farsi texts in 20 fonts. 98.5% of the connected characters were correctly segmented.
چکیده
یک الگوریتم تقسیم بندی جدید بر اساس برچسب گذاری مشروط حد فاصل فوقانی ارائه شده است. یک روش پیش پردازش پیشنهاد شده است که خط مبنای موضعی برای هر زیرکلمه تنظیم می کند. این الگوریتم روی یک مجموعه داده ها از متون فارسی چاپ شده در 20 فونت مورد آزمایش قرار گرفت. 98.5% از کاراکترهای متصل شده به درستی تقسیم بندی شدند.