ترجمه مقاله طبقه بندی و پس پردازشی اسناد با استفاده از تجزیه کننده تصحیح خطا – نشریه IEEE

عنوان فارسی: | طبقه بندی و پس پردازشی اسناد با استفاده از تجزیه کننده تصحیح خطا |
عنوان انگلیسی: | Classification and Postprocessing of Documents Using an Error-correcting Parser |
تعداد صفحات مقاله انگلیسی : 5 | تعداد صفحات ترجمه فارسی : 10 |
سال انتشار : 1995 | نشریه : آی تریپل ای - IEEE |
فرمت مقاله انگلیسی : PDF | فرمت ترجمه مقاله : ورد تایپ شده |
کد محصول : 5352 | رفرنس : دارد |
محتوای فایل : zip | حجم فایل : 1.31Mb |
رشته های مرتبط با این مقاله: ریاضی، مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله: ریاضی کاربردی، مهندسی الگوریتم و محاسبات |
مجله: تجزیه و تحلیل سند و شناخت |
دانشگاه: موسسه علوم کامپیوتر و ریاضی کاربردی، دانشگاه برن سویس |
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است |
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است |
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است |
چکیده
1. مقدمه
۲. اصول تئوری
3. شرح مسئله و راه حل پیشنهادی
۴. نتایج و آزمایشها
۵. بحث و نتیجهگیری
1 Introduction
The recognition of machine printed characters has been intensively studied during the past years and significant progress has been made [l]. For example, there exist commercial OCR systems that achieve a correct recognition rate of over 99% today [a]. But depending on the particular application, such a high recognition rate may be still insufficient. In order to further improve recognition accuracy, contextual postprocessing is often very useful. Different contextual postprocessing methods have been proposed in the literature. A recent survey has been given in [3]. For earlier overviews see [4, 51. In the present paper we propose the application of finite state automata and error-correcting parsing to solve a particular postprocessing problem occurring in the context of automatic check reading. The proposed method is not only an aid to recover from OCR errors but also to classify a document, i.e. a check, based on its contents in the presence of OCR errors. The present paper is a shortened version of [6].
1. مقدمه
شناسایی کاراکترهای چاپی ماشینی در طول سالهای گذشته بهشدت موردمطالعه قرار گرفته است و به پیشرفتهای قابلتوجهی دست یافته است. بهطور مثال، امروزه سیستمهای OCR تجاری که به دقت شناسایی با نرخی بالاتر از ۹۹٪ رسیدهاند، وجود دارند. اما بسته به یک کاربرد خاص چنین نرخ شناسایی بالایی ممکن است هنوز ناکافی باشد. بهمنظور بهبود بیشتر دقت شناسایی، اغلب پس پردازش متنی بسیار مفید است. روشهای پس پردازشی متنی متفاوتی در ادبیات پیشنهاد شدهاند. بررسی تازهای در[۳] آورده شده است. برای مطالعات اخیر [۴ و۵] را ببینید.
در مقاله حاضر کاربرد نظریه ماشینهای خودکار (اتوماتای) حالت محدود و تجزیهکننده تصحیح خطا را برای حل یک مسئله پس پردازشی خاص که در زمینه خواندن خودکار چک رخ میدهد، ارائه میدهیم. روش پیشنهادی نهتنها به اصلاح خطاهای OCR کمک میکند بلکه یک سند؛ بهعبارتی، یک چک، را بر اساس محتوای آن در حضور خطاهای OCR طبقهبندی میکند. مقاله حاضر یک نسخه کوتاهشده از [6] میباشد.