سیستم GAN چیست؟

سیستم های GAN یا Generative Adversarial Networks یک سیستم بسیار جدید و کاربردی در هوش مصنوعی است که در سال 2014 توسط یان گودفیلوی 29 ساله و دانشجوی سابق استنفورد ابداع شد.
یکی از محققان واحد هوش مصنوعی فیسبوک گفته که GAN باحالترین ایده هوش مصنوعی در 10 سال اخیر است!


اگر بخواهیم دقیقتر بگوییم، این سیستم از دو شبکه مجزا تشکیل شده که یکی "تولید کننده" یا به اختصار G نام دارد و دیگری "تشخیص دهنده" یا D.


بطور خلاصه و مفید:
شبکه G یک سیگنال معنی دار مانند یک تصویر، یک یک صوت یا ... را تولید می کند،
و شبکه D هم باید تشخيص دهد این خروجی «اصل» است یا خیر (یعنی این تصویر یا صوت شبیه یک تصویر یا صوت واقعی هست یا نه).


بیایید با یک مثال پیش برویم:
فرض کنید G بجای چیزهای مزخرف و پیچیده (یعنی سیگنال) یک دستگاه اتوماتیک برای تولید شراب است! به این دستگاه هر ماده ای که برای تولید انواع شراب لازم است از قبل داده شده مثل: انگور، سیب، آلبالو، انواع مخمرها، ...
و وظیفه آن فقط یافتن روش و فرمول مناسب برای استخراج شراب است.

اما D در عوض یک شراب شناس قهار است، که یک لیوان مایعات را (از G) گرفته تست می کند و می تواند بگوید که این مایع شراب است یا نه.
اما او این مهارت را چگونه فرا گرفته؟ ما با در اختیار قرار دادن چندین مدل شراب اصل به او یاد داده ایم که شراب اصل چیست.


در حقیقت ایده کار همینجاست: ما به G نه تنها هیچ فرمولی را یاد نمی دهیم که حتی هیچ شرابی را به او نشان نمی‌دهیم، که او بتواند ویژگی های آن را یاد بگیرد و کپی برداری کند، او فقط از طریق سعی و خطا و پاسخی که از D دریافت می کند یاد خواهد گرفت که چه چیزی را تولید کند و نهایتا به فرمولهای ساخت شراب برسد. و نهایتا بتواند D را متقاعد کند که او هم شراب‌ساز است.


اما نوآوری این سیستم در کجاست؟
در حقیقت نوآوری سیستم این است که ما میتوانیم D را با طیف شرابهای «متنوع» آشنا کنیم (و نه فقط یک نوع شراب)، در نتیجه G نه فقط یک مدل شراب شبیه شراب های قبلی که حتی شراب هایی جدید می آفریند که تا بحال هیچ ساقی ای بلد نبوده!
بعبارت دیگر تنها یک جواب درست وجود ندارد و در عوض «طیف قابل قبول»ی از جوابها وجود دارد.


حالا مثال عملی تر تولید «چهره انسان جذاب» است! بدون اینکه بخواهیم فرمولی برای یک چهره جذاب تعریف کنیم. ما این کار را با نشان دادن تعدادی عکس از چهره‌های جذاب (بقولی سلبریتی) به D انجام می‌دهیم. نتایج شگفت انگیز هستند.



ویدیویی از تولید چهره های جذاب توسط شبکه های GAN


هیچ کدام از چهره ها در این ویدئو واقعی نیستند و محصول تخیل ماشین اند.


 



تصاویری از چهره های جذاب تولید شده توسط شبکه های GAN
هیچ کدام از چهره ها در این تصویر واقعی نیستند و محصول تخیل ماشین اند.


 


منبع:
Medium Artificial Intelligence