فناوری OCR یا نویسه خوان نوری چیست و چه کاربردی دارد؟

1402/03/23 - خواندن 5 دقیقه - نویسنده: علیرضا همتی
فناوری ocr چیست

آیا تا به حال با این مشکل روبه رو بودید که نوشته داخل یک تصویر را بخواهید به متن در کامپیوتر تبدیل کنید؟ در بسیاری از موارد افراد به دنبال تبدیل بسیاری از نوشته‌های دست نویس یا چاپی به متن در کامپیوتر بودند. این کار توسط فناوری OCR انجام می‌گیرد. در این مقاله اینکه فناوری OCR چیست و چگونه کار می‌کند را بررسی می‌کنیم و کاربردها متفاوت آن را معرفی خواهیم کرد. با ما همراه باشید.

فناوری OCR چیست؟

فناوری OCR در واقع مخفف Optical Character Recognition است که با این فناوری می‌توان کاراکترهای یک متن چاپ شده یا دست‌نویس را در یک تصویر تشخیص داد. معادل فارسی این فناوری به نام نویسه خوان نوری شناخته می‌شود. با کمک این فناوری شما می‌توانید تمامی متن‌های که در یک تصویر دیجیتال وجود دارد را به داده‌های متنی قابل خواندن توسط ماشین دربیاورید. در بسیاری از موارد این کار پیچیدگی‌هایی مانند تشخیص زبان یا تشخیص دست خط هم دارد که می‌توان به کمک هوش مصنوعی این موارد را هم در کنار خواندن متن در اختیار داشت.

در بسیاری از اوقات برای تبدیل کتاب‌ها و اسناد به یک متن داخل کامپیوتر از این سیستم استفاده می‌کنند. احتمالاً شما هم برای تبدیل عکس یک نوشته به متن استفادده کردید. یک سوال مهم در مورد این فناوری این است که OCR چگونه کار می‌کند؟

فناوری OCR چگونه کار می‌کند؟

فناوری ocr چیست و چه کاربردی دارد

این فرآیند معمولاً چند مرحله دارد. در مرحله اول ابتدا شما باید از آن نوشته یک تصویر تهیه کنید. در واقع ورودی این پروژه‌ها در ابتدا یک تصویر است که نوشته مدنظر بر روی آن قرار دارد. این کار یا توسط یک دوربین یا یک اسکنر انجام می‌شود. قطعاً دقت و کیفیت دوربین یا اسکنر بر نتیجه‌ی کار تاثیر مستقیم دارد.

در مرحله دوم پس از ورود این تصاویر به نرم افزار OCR ، ابتدا باید محلی که نوشته روی آن قرار دارد در صفحه مشخص شود. در اینجا برای پروژه‌های مختلف ممکن است راه‌های متفاوتی انتخاب شود. به طور مثال برای پیدا کردن نوشته بر روی یک صفحه ابتدا کل تصویر تبدیل به یک نسخه سیاه و سفید می‌شود. سپس این نسخه به صورت کامل تجزیه و تحلیل می‌شود و بخش‌های سفید به عنوان پس زمینه و بخش‌های روی این پس زمینه کاراکترهای نوشته شناسایی می‌شوند.

البته برای موردی مانند پلاک خوان خودرو ابتدا شما باید محل پلاک را پیدا کنید که از روش‌های پیچیده‌تری برای پیدا کردن این بخش استفاده می‌شود. اما بعد از مرحله شناسایی نوشته یادگیری ماشین به کمک فهم نوشته می‌آید.

تشخیص دقیق نوشته به کمک یادگیری ماشین

روشی که هوش مصنوعی برای تشخیص نوشته دارد، استفاده از یادگیری ماشین است . به این صورت شما نرم افزار OCR مدنظر خودتان را در یک موضوع خاص آموزش می‌دهید. در این حالت با پیدا کردن الگوهای مشخص، نرم افزار می‌تواند ماهیت تصاویر و شباهت آنها با نمونه‌هایی که از قبل آموخته را متوجه شود. برای مثال شما در نظر بگیرید در پلاک خوان عدد ۰ تا ۹ را به صورت‌های مختلف و در بخش‌های مختلف پلاک به ماشین آموزش داده باشید. در این صورت بعد از پیدا کردن بخش پلاک می‌تواند تک تک کاراکتر‌ها را به صورت کامل تشخیص دهد و پس از کنار هم گذاشتن این کاراکترها، شما می‌توانید تمامی پلاک را در اختیار داشته باشید.

این فناوری در بسیاری از حوزه‌ها و فعالیت‌ها کاربرد اساسی دارد و می‌تواند در قسمت‌های مختلفی کارساز باشد.

کاربردهای فناوری OCR چیست؟

حال که متوجه شدید که فناوری OCR چیست و چگونه کار می‌کند، بهتر است با کاربردهای آن هم آشنا باشید. این فناوری در حوزه‌های پزشکی، امنیت، بخش‌های اداری، موتورهای جست و جو، فعالیت‌های روزمره، کمک به نابینایان، کتاب‌ها و اسناد تاریخی، بانک‌ها و ... قابل استفاده است که تمامی این موارد را بررسی می‌کنیم.

OCR در پزشکی

Ocr در پزشکی چیست

از این فناوری برای موارد مختلفی در پزشکی استفاده کرد. یکی از این موارد بررسی سوابق بیمار از جمله درمان‌ها و آزمایش‌هاست. شما می‌توانید تمامی این موارد را به کمک OCR در زمان کمی وارد سیستم کنید و این کارها را به صورت دستی انجام ندهید. یکی دیگر از استفاده‌های آن برای بیمه‌ها در زمینه‌ی پزشکی است. بسیاری از بیمه‌ها برای ارائه خدمات درخواست نسخه‌های را می‌کنند که می‌توان به کمک این فناوری این فرآیند را تسریع کرد.

داروخانه‌ها هم می‌توانند نسخه‌های نوشتاری یا تایپی را به کمک OCR وارد سیستم کنند تا مراحل دریافت دارو با سرعت بیشتری انجام گیرد.

استفاده از OCR در امنیت

در مقوله امنیت، می‌توان به پلاک خوان اشاره کرد. با استفاده از OCR پلاک خوانده و شناسایی می‌شود. به این ترتیب شما می‌توانید بخش عظیمی از کنترل تردد خودروها در محل‌های متنوع را به پلاک خوان بسپارید.

فعالیت‌های روزمره

در بسیاری از فعالیت‌های روزمره شما برای تبدیل یک عکس به متن با مشکل روبه رو هستید. در حال حاضر برنامه‌هایی مانند Google doc یا مشابه آن می‌تواند برای این نوع تبدیل به شما کمک کند. البته این موارد با توجه به اینکه در زبان فارسی قوی نیستند خطای بالایی دارند.

کمک به نابینایان

کاربردهای ocr

برای نابینایان خواندن متون و کتاب‌های معمولی و حتی متن سایت‌ها بسیار سخت و در بیشتر اوقات نشدنی است. اما با استفاده از OCR می‌توان تمامی این متن‌ها را شناسایی کرد و سپس توسط یک فناوری دیگر این متن‌ها به صورت صوت در اختیار کاربران قرار گیرد. از این مورد برای تبدیل کردن متون به صوت هم می‌توان استفاده کرد.

بانک‌ها

در بسیاری از بانک‌ها، مشتریان برای انجام کارهای بانکی فیش یا چک بانکی پر می‌کنند. با استفاده از OCR شما می‌توانید با سرعت بالا تمامی اعداد و نوشته‌های روی فیش و چک بانکی را بخوانید و سرعت پاسخگویی را افزایش دهید. این مورد می‌تواند به کارایی بیشتر کارمندان بانک هم کمک کند.

کتاب‌های و اسناد تاریخی

بسیاری از کتب و اسناد قدیمی نیاز است که برای ماندگاری متون، آنها را تبدیل به متون کامپیوتری کرد. این مورد موجب کمک می‌کند که متن تمامی این اسناد در اختیار بسیاری از افراد قرار گیرد. برای این کار می‌تواند از OCR کمک گرفت تا با سرعت بالا تمام متون را پیداسازی کند.

فعالیت‌های اداری

در فعالیت‌های اداری، درخواست‌ها و پرونده‌های مختلفی وجود دارند که باید وارد سیستم شوند. تمامی این موارد و کارهایی از این قبیل می‌تواند به صورت خودکار و توسط OCR وارد سیستم شود. به این وسیله بسیاری از کارها می‌تواند سریع‌تر انجام شود و خطای کمتری هم داشته باشد.

برنامه و نرم افزار OCR فارسی

برنامه‌های متفاوتی وجود دارند که از OCR برای پیشبرد فعالیت خود استفاده می‌کنند. یکی از این محصولات پلاک خوان خودرو دیدبان هست که با استفاده از پردازش تصویر و OCR کار پلاک خوانی را انجام می‌دهد. هم‌چنین در صورتی که نیاز دارید تا برنامه‌ای مختص به فعالیت‌های شما گسترش پیدا کند و بتوانید از این تکنولوژی استفاده کنید، فرم مشاوره سایت دیدبان را پر کنید تا کارشناسان ما اطلاعات بیشتری در اختیار شما بگذارند.

مزایای OCR

کاربردهای ocr

استفاده از این تکنولوژی چندین مزیت بارز دارد:

۱- ذخیره کردن زمان: با استفاده از این فناوری شما می‌توانید زمان زیادی را برای خود ذخیره کنید. OCR به شما کمک می‌کند تا بسیاری از کارها را سیستمی کنید تا بتوانید کارهای مشخص شده را در زمان بسیار کوتاه‌تری انجام دهید.

۲- کاهش خطا: وقتی فعالیت‌ها توسط انسان انجام می‌شود بالطبع خطاهای بیشتری خواهیم داشت. این مورد با توجه به وضعیت فرد و خستگی او ممکن است بسیار بیشتر هم بشود. به همین دلیل با استفاده از OCR می‌توانید خطا را بسیار کاهش دهید و همیشه فعالیت‌ها را در یک سطح انجام دهید.

۳-کاهش هزینه‌ها: تعدادی از فعالیت‌ها قبلاً با هزینه‌ی بالایی امکان‌پذیر بودند اما در حال حاضر با کمک این فناوری با هزینه‌ی بسیار پایین قابلیت انجام دارند. به طور مثال در گذشته کنترل تردد خودروها و جریمه‌ی آنها بسیار هزینه‌ی نیروی انسانی بالایی داشت ولی با اضافه شدن دوربین‌های پلاک‌خوان این کار با دقت بیشتر و هزینه‌ی پایینتر انجام می‌شود.