DeepDream: الگوریتمی برای تولید عکس‌های خیالی و شگفت‌انگیز

DeepDream: الگوریتمی برای تولید عکس‌های خیالی و شگفت‌انگیز

تصاویر و عکس‌ها یکی از اجزای جدایی‌ناپذیر زندگی ما هستند. ابزارهای بسیاری برای ویرایش عکس‌ها یا تولید تصاویر جدید و ابتکاری که با خلاقیت کاربران آنها به وجود می‌آیند در دسترس قرار دارند اما گوگل تکنولوژی‌ای را به بازار عرضه کرده است که با استفاده از آن، کامپیوتر با بهره‌گیری از هوش مصنوعی رؤیاپردازی می‌کند و تصاویر خیالی و شگفت‌آوری تولید می‌کند!

استفاده از شبکه‌های عصبی برای درک تصاویر
برای آنکه بفهمیم کامپیوترها چگونه رؤیاپردازی می‌کنند ابتدا باید ببینیم آنها چه‌طور یاد می‌گیرند. گوگل برای پردازش تصاویر از شبکه‌های عصبی مصنوعی (Artificial Neural Network) استفاده می‌کند که روش‌هایی برای پردازش داده‌ها و یادگیری هستند و با الگوبرداری از شبکه‌های عصبی بیولوژیکی هم چون مغز انسان طراحی شده‌اند.

محققین گوگل برای آنکه به یک شبکهٔ عصبی بفهمانند مثلاً یک گُل چیست، میلیون‌ها تصویر از گُل‌های مختلف را به آن نشان می‌دهند و هر یک از تصاویر را به عنوان چیزی که یک گُل می تواند باشد مشخص می‌کنند. آنگاه شبکه‌های مصنوعی هر تصویر را از زوایا و رنگ آن گرفته تا طرح و شکل کلی آن به دقت بررسی می‌کنند تا در نهایت ایده‌ای از ماهیت یک گُل بسازند و بفهمند که یک گُل به طور کلی چه اجزایی می‌تواند داشته باشد. 

محققیق گوگل متوجه شدند از فرآیندی که برای تشخیص تصاویر استفاده می‌شود، به طور مشابهی می‌توان برای تولید تصاویر هم استفاده کرد. از این روی، گوگل شبکه‌های عصبی را به کار گرفت تا الگوهایی را که آنها در تصاویر می‌بینند مشخص کنند. هر لایهٔ عصبی مصنوعی از یک نظر تصویر را بررسی می‌کند؛ بعضی زوایای آن و برخی دیگر شکل و رنگ آن را مطالعه می‌کنند. پس از آنکه آنها این فرآیند را اجرا کردند، یافته‌ها را در اختیار شبکه می‌گذارند و شبکهٔ عصبی آنچه را تشخیص داده است نمایش می‌دهد.

در این بین، محققین متوجه شکل عجیب درک شبکه از یک تصویر شدند. مثلاً اگر تکه ابری شبیه به پرنده بود، تصویری که شبکه از آن ابر می‌ساخت به شکل پرنده بود و این کار را بارها و بارها انجام می‌داد و به نوعی از الگویی عجیب در شناخت تصویر استفاده می‌کرد. 

پس از تصویرسازی اولیه، محققان تصویر تولید شده را به عنوان تصویر جدیدی برای پردازش در اختیار شبکه قرار دادند و یک فرایند تکراری را ایجاد کردند که هر بار اندکی روی تصویر قبلی زوم می‌کرد. طولی نکشید که شبکه شروع به ساخت جریان بی‌پایانی از برداشت‌های جدید کرد که به این ترتیب، حتی زمانی که شبکه با نویز سفید کار را آغاز می‌کرد، تصویری ارائه می‌داد که کاملاً توسط خود آن طراحی شده بود. محققان این تصاویر را «رؤیاهای شبکهٔ عصبی» نامیدند، که کاملاً برداشت ذهنی کامپیوتر را از اشیای جهان واقعی نمایش می‌دادند.

بر اساس این فرایند تجسم و تصویرسازی شبکه‌های عصبی مصنوعی، گوگل الگوریتم DeepDream که یک برنامهٔ هوش مصنوعی است را خلق کرد که می‌تواند تصاویری خیالی و عجیب تولید کند. در اول جولای 2015، گوگل توزیع اپن‌سورس کدهای DeepDream که به زبان پایتون نوشته شده بودند را در اختیار عموم قرار داد.