روشی احتمالی برای بازیابی کلیدواژه در تصاویر اسناد دست نویس
عنوان انگلیسی
A probabilistic method for keyword retrieval in handwritten document images
صفحات مقاله فارسی
8
صفحات مقاله انگلیسی
6
سال انتشار
2006
نشریه
الزویر - Elsevier
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
رفرنس
ندارد
کد محصول
5021
رشته های مرتبط با این مقاله
فناوری اطلاعات IT و مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
اینترنت و شبکه های گسترده، سیستم های چند رسانه ای، مدیریت سیستم های اطلاعات و مهندسی الگوریتم ها و محاسبات
مجله
الگو شناسی (Pattern Recognition)
دانشگاه
گروه مهندسی و علوم کامپیوتر، دانشگاه بوفالو، ایالات متحده آمریکا
کلمات کلیدی
بازیابی اطلاعات، تشخیص دست خط
۰.۰(بدون امتیاز)
امتیاز دهید
فهرست مطالب
چکیده
1.مقدمه
2. پس زمینه بازیابی کلیدواژه های دست نویس
1.2. انطباق تصویر با تصویر- جستجوی واژه
2.2. بازیابی کلیدواژه با استفاده از واژه شناس ها
3. بازیابی کلیدواژه، یک جزء مهم از موتور جستجو برای دست نویس آفلاین
1.3. یک موتور جستجو برای دست نویس آفلاین
2.3. جستجوی واژه با استفاده از احتمالات جداسازی
1.2.3. مدل جستجوی واژه
2.2.3. برآورد احتمال جداسازی واژه
3.2.3. برآورد احتمال شناسایی واژه
4. نتایج آزمایشی
1.4. پیش پردازش
2.4. معیارهای ارزیابی
5. نتیجه گیری
نمونه چکیده متن اصلی انگلیسی
A B S T R A C T Keyword retrieval in handwritten document images is a challenging task because handwriting recognition does not perform adequately to produce the transcriptions, especially when using large lexicons. Existing methods build indices using OCR distances or image features for the purpose of retrieval. These alternative methods are complimentary to the traditional approaches that build indices on OCR'ed text. In this paper, we describe an improvement to the existing keyword retrieval (word spotting) methods by modeling imperfect word segmentation as probabilities and integrating these probabilities into the word spotting algorithm. The scores returned by the word recognizer are also converted into probabilities and integrated into the probabilistic word spotting model.
نمونه چکیده ترجمه متن فارسی
چکیده
بازیابی کلیدواژه در تصاویر اسناد دست نویس، کار مشکلیاست زیرا شناسایی دست نوشتهبرای ایجاد رونوشت به درستی انجام نمی شود خصوصاً در هنگام استفاده از واژه نامه های بزرگ. روش های موجود به منظور بازیابی،نمایه ها را با استفاده از فواصل OCR یا ویژگی های تصویر ایجاد می کنند. این روش های جایگزین، مکمل روش های قدیمی هستند که نمایه ها را بر روی متن OCR شده ایجاد می کنند. ما در این مقاله، پیشرفتی در روش های بازیابی کلیدواژه (جستجوی واژه ها) را با مدلسازی جداسازی واژه های ناقص به عنوان احتمالات و ترکیب این احتمالات در الگوریتم جستجوی واژه ها توضیح می دهیم. امتیازات داده شده از سوی واژه شناس نیز به احتمالات تبدیل شده است و در مدل احتمالی جستجوی واژه ها ترکیب شده است.