انتشار الگوریتم قدرتمند تشخیص اشیاء YOLOv4

بعد از مدت‌ها انتظار بالاخره الگوریتم تشخیص اشیاء YOLOv4 توسط توسعه دهنده‌های آن منتشر گردید. این الگوریتم که از خانواده‌ی الگوریتم‌های YOLO است، از دقت و سرعت بهینه‌تری نسبت به نسخه‌های قبلی این سری از الگوریتم‌ها می‌باشد.


Yolo


YOLO از حروف اولیه‌ی You Only Look Once تشکیل شده است و به معنای تشخیص اجسام با یکبار ورودِ ماتریس تصویر به الگورتیم است. این الگوریتم از فیلترهای پیچشی نیرو گرفته است و از روش‌های سنتی مانند پنجره‌ی لغزشی (sliding window) بسیار سریع‌تر است. الگوریتم‌های YOLO به دلیل سرعت و دقت مناسب، از قوی‌ترین و پرکاربردترین الگوریتم‌های تشخیص اجسام و اشیاء هستند.


روش‌های زیادی برای بهبود دقت شبکه‌های عصبی پیچشی (CNN) وجود دارد که در نسخه‌ی چهارم الگوریتم YOLO (یا همان YOLOv4) از بسیاری از آن‌ها استفاده شده است. در این الگوریتم از ویژگی‌های WRC، CSP، CmBN و SAT استفاده شده است. در تصویر زیر مقایسه‌ای بین سرعت و دقت این الگوریتم با الگوریتم‌های دیگر نشان داده شده است. الگوریتمی در این نمودار بهتر است که در در قسمت سمت راست و بالای آن باشد.


You Only Look Once


نتایج تست این الگوریتم بر روی داده‌های COCO حاکی از دقت 65.7% AP50 و سرعت 65 FPS بر روی کارت گرافیک Tesla V100 بوده است.


لینک اصلی مقاله:


https://arxiv.org/abs/2004.10934


نحوه‌ی استفاده در Github:


https://github.com/AlexeyAB/darknet


انتظار می‌رود با توجه به پیشرفت‌های شگرف بینایی ماشین، بازهم این این الگوریتم‌ها در نسخه‌های بعدی از قدرت و دقت بالاتری برخوردار باشند