فراتفکیکپذیری مبتنی بر نمونه تکتصویر متن با روش نزول گرادیان ناهمزمان ترتیبی
محورهای موضوعی : electrical and computer engineering
علی عابدی
1
,
احساناله کبیر
2
1 - دانشگاه تربیت مدرس
2 - دانشگاه تربیت مدرس
کلید واژه: بهسازی تصویر متن افزایش تفکیکپذیری فراتفکیکپذیری بیزی فراتفکیکپذیری مبتنی بر نمونه الگوریتم نزول گرادیان,
چکیده مقاله :
در اين مقاله، یک روش جدید برای افزایش تفکیکپذیری تکتصویری تصاویر متن ارائه میشود. این روش مبتنی بر نمونه است یعنی برای فراتفکیکپذیری از یک مجموعه نمونه آموزشی که شامل وصلههای با تفکیکپذیری بالا و پایین است استفاده میشود. بر اساس قاعده بیزی، یک تابع به عنوان درستنمایی و سه تابع به عنوان دانش اولیه در نظر گرفته میشوند. تابع مربوط به درستنمایی میزان شباهت با تصویر اولیه را توصیف میکند. سه تابع مربوط به دانش اولیه خصوصیات دومُدی بودن تصویر متن، یکنواختبودن نواحی پسزمینه و متن و نزدیکبودن به مجموعه نمونه آموزشی را توصیف میکنند. با کمینهکردن این توابع انرژی طی فرایند تکرارشونده نزول گرادیان ناهمزمان ترتیبی، تصویر با تفکیکپذیری بالا به دست میآید. به جای کمینهکردن همزمان ترکیب خطی توابع، آنها به ترتیب و با توجه به این که در تکرارهای متوالی الگوریتم چه تغییراتی در تصویر متن رخ میدهد کمینه میگردند. به این ترتیب دیگر نیازی به تعیین ضرایب ترکیب خطی توابع که برای تصاویر مختلف متغیر هستند نخواهد بود. نتایج آزمایشها روی بیست تصویر متن با قلمها، تفکیکپذیریها، تارشدگیها و نویزهای مختلف عملکرد بهتر و با حجم محاسباتی کمتر روش ارائهشده نسبت به روشهای مشابه قبلی را نشان میدهد.
In this paper, a new method for resolution enhancement of single document images is presented. The proposed method is example based using an example set of low-resolution and high-resolution training patches. According to the Bayes rule, one function is considered as the likelihood or data-fidelity term that measures the fidelity of the output high-resolution to the input low-resolution image. As well, three other functions are considered as the regularization terms containing the prior knowledge about the desired high-resolution document image. Three priors which are fulfilled by the regularization terms are bimodality of document images, smoothness of background and text regions, and similarity to the patches in the example set. By minimizing these four energy functions through the iterative procedure of asynchronous sequential gradient descent, the HR image is reconstructed. Instead of synchronous minimization of the linear combination of these functions, they are minimized in order and according to the gradual changes in their values and in the updating HR image. Therefore, determining the coefficients of the linear combination, which are variable for input images, is no longer required. In the experimental results on twenty document images with different fonts, at different resolutions, and with different amounts of noise and blurriness, the proposed method achieves significant improvements in visual image quality and in reducing the computational complexity.