OCR مخفف Optical Character Recognition است. OCR فارسی کار پیچیدهای است که توسط بینایی ماشین، پردازش تصویر و الگوریتمهای هوشمصنوعی، متن تصاویر را تشخیص میدهد. به دلیل حروف زبان فارسی، این تکنولوژی در زبان فارسی پیچیدهتر است. ما این تکنولوژی را برای زبان فارسی پیاده کردهایم. سایت myOCR یک موتور OCR فارسی است که استفاده از آن کاملا رایگان است.
در چند سال اخیر، با توجه به پیشرفت هوشمصنوعی، علم OCR هم پیشرفت کرده است. OCR فارسی، به دلیل خط الرسم خاص، دستخط های مختلف و به هم چسبیده بودن حروف، کار پیچیدهتری است. هم اکنون نرم افزارهایی مانند freeocr و Readiris وجود دارند. اکثر این نرم افزارها، زبان فارسی را پشتیبانی نمیکنند یا خروجی مناسبی نمیدهند. سایت myOCR با استفاده از بروزترین تکنولوژیهای دنیا، این فرآیند پیچیده را برای شما آسان کرده است.
شاید شما هم به این فکر کرده باشید که وقتی فایل خود را آپلود میکنید، این فایل کجا ذخیره میشود. ما به شما تضمین میدهیم که فایلهای شما، هیچکجا ذخیره نمیشوند. بلافاصله بعد از استخراج متن از عکس شما، عکس از روی سرور پاک میشود. در هنگام ocr هم عکس شما جایی ذخیره نمیشود و همه کارها به صورت آنلاین انجام میشود.
شما علاوهبر آپلود عکس، این امکان را دارید که لینک عکس خود را از هرکجای اینترنت به ما بدهید. در صورت درست بودن لینک، OCR فارسی با همان دقت روی عکس شما انجام میشود. محدودیت تعدادی برای دادن لینک وجود ندارد. شما میتوانید بینهایت بار از این سرویس استفاده کنید. توجه داشته باشید که لینک دادهشده نباید فیلتر باشد و باید از ip ایران قابل دسترسی باشد.
با اینکه استخراج متن از روی عکس ما دقیق است، متن شما باید در عکس معلوم باشد. چند نمونه از عکسهای مناسب و نامناسب را میتوانید در زیر مشاهده کنید. دقت داشته باشید که کیفیت عکس باید طوری باشد که متن تصویر شما واضح باشد. مقدار وضوح تصویر نسبت مستقیمی با دقت ocr دارد. هر چه متن در تصویر معلومتر باشد، دقت ocr بیشتر است.
تکنولوژیهای استفاده شده عبارتند از:
۱. پایتون
۲. ++c
۳. جاوا
۴. Ruby
پایتون برای طراحی سایت(فریم ورک Django)، و بقیه زبانها برای ocr فارسی استفاده شدهاند. با وجود زیاد بودن تکنولوژیها، پردازش متن از روی عکس شما، بین ۵ تا ۲۰ ثانیه زمان میبرد. زمان پردازش عکس، متغییر است و حتی ممکن است کمتر از ۱ ثانیه یا بیشتر از ۱ دقیقه باشد.
محدودیتی در مقدار متن موجود در عکس شما وجود ندارد. شما میتوانید متنی با یک کلمه یا متنی سرتاسر نوشته آپلود کنید. محدودیت موجود، کیفیت عکس شما است. هر چقدر کیفیت عکس شما بیشتر باشد و متن شما در عکس واضحتر باشد، دقت متن خروجی هم بیشتر خواهدشد. نهایت سعی خود را بکنید تا اشیاء اضافه در عکس نباشند. در صورتی که شیء نامرتبطی در عکس باشد، آن را تشخیص داده و آن قسمت از عکس را نخواهیم خواند.
سایت myOCR قابلیت تبدیل به اپلیکیشن اندروید را دارد. این سایت از استاندارد pwa گوگل استفاده میکند. این استاندارد این امکان را به شما میدهد که از این سایت، مانند یک برنامه روی گوشی خود استفاده کنید. برای این کار، شما باید این سایت را با کروم باز کرده و دکمه Add to home screen را بزنید. این قابلیت برای دسکتاپ هم وجود دارد. شما میتوانید در گوگل کروم، با زدن دکمه Install app این سایت را به صفحه دسکتاپ خود اضافه کنید.
درباره این سایت