DeepDream: الگوریتم اپن‌سورس گوگل برای تولید عکس‌های خیالی با استفاده از شبکه‌های عصبی

تصاویر یکی از اجزای جدایی‌ناپذیر زندگی ما هستند و ابزارهای بسیاری برای ویرایش عکس‌ یا تولید تصاویر جدید که با خلاقیت به وجود می‌آیند در دسترس قرار دارند اما گوگل دستاوردی را به صورت اپن‌سورس عرضه کرده که با استفاده از آن کامپیوتر با بهره‌گیری از هوش مصنوعی شروع به رؤیاپردازی می‌کند و تصاویر خیالی و شگفت‌آوری تولید می‌کند!

استفاده از شبکه‌های عصبی برای درک تصاویر

برای آنکه بفهمیم کامپیوترها چگونه رؤیاپردازی می‌کنند، ابتدا باید ببینیم چه‌طور یاد می‌گیرند. گوگل برای پردازش تصاویر از شبکه‌های عصبی مصنوعی یا اصطلاحاً Artificial Neural Network استفاده می‌کند که روش‌هایی برای پردازش داده‌ها و یادگیری هستند که با الگوبرداری از شبکه‌های عصبی بیولوژیکی همچون مغز انسان طراحی شده‌اند.

محققین گوگل برای آنکه به یک شبکهٔ عصبی بفهمانند مثلاً یک گُل چیست، میلیون‌ها تصویر از گُل‌های مختلف را به آن نشان می‌دهند و هر یک از تصاویر را به عنوان چیزی که یک گُل می‌تواند باشد مشخص می‌کنند و در ادامه هوش مصنوعی هر تصویر را، از زوایا و رنگ آن گرفته تا طرح و شکل کلی‌اش، به دقت بررسی می‌کنند تا در نهایت ایده‌ای از ماهیت یک گُل بسازد و بفهمد که یک گُل به طور کلی چه اجزایی می‌تواند داشته باشد.

محققیق گوگل متوجه شدند از فرآیندی که برای تشخیص تصاویر استفاده می‌شود، به طور مشابهی می‌توان برای تولید تصاویر هم استفاده کرد و از این روی شبکه‌های عصبی را به کار گرفتند تا الگوهایی را که در تصاویر می‌بینند برای خلق آثار هنری به کار گیرند به طوری که هر لایهٔ عصبی مصنوعی تصویر را از یک بُعد بررسی می‌کند؛ بعضی زوایای آن و برخی دیگر شکل و رنگ آن را مطالعه می‌کنند و پس از آنکه این فرآیند اجرا شد، یافته‌ها در اختیار شبکهٔ عصبی گذاشته شده و شبکهٔ عصبی هم آنچه را تشخیص داده است نمایش می‌دهد (در این بین، محققین متوجه شکل عجیب درک شبکه از یک تصویر شدند به طوری که مثلاً اگر تکه ابری شبیه به پرنده بود، تصویری که شبکه از آن ابر می‌ساخت به شکل پرنده بود و این کار را بارها و بارها انجام می‌داد و به نوعی از الگویی عجیب در شناخت تصویر استفاده می‌کرد.)

پس از تصویرسازی اولیه، محققان تصویر تولید شده را به عنوان تصویر جدیدی برای پردازش در اختیار همان شبکه قرار دادند و یک فرایند تکراری را ایجاد کردند که هر بار اندکی روی تصویر قبلی زوم می‌کرد و طولی نکشید که شبکه شروع به ساخت جریان بی‌پایانی از برداشت‌های جدید کرد که بدین ترتیب، حتی زمانی که شبکه با نویز سفید کار را آغاز می‌کرد، تصویری ارائه می‌داد که کاملاً توسط خود آن طراحی شده بود! محققان این تصاویر را «رؤیاهای شبکهٔ عصبی» نامیدند که کاملاً برداشت ذهنی کامپیوتر را از اشیای جهان واقعی نمایش می‌دادند.

بر اساس این فرایند تجسم و تصویرسازی شبکه‌های عصبی مصنوعی، گوگل الگوریتم DeepDream که یک برنامهٔ هوش مصنوعی است را خلق کرد که می‌تواند تصاویری خیالی و عجیب تولید کند و در اول جولای 2015، گوگل توزیع اپن‌سورس کدهای DeepDream که به زبان پایتون نوشته شده بودند را در اختیار عموم قرار داد.