تصاویر یکی از اجزای جداییناپذیر زندگی ما هستند و ابزارهای بسیاری برای ویرایش عکس یا تولید تصاویر جدید که با خلاقیت به وجود میآیند در دسترس قرار دارند اما گوگل دستاوردی را به صورت اپنسورس عرضه کرده که با استفاده از آن کامپیوتر با بهرهگیری از هوش مصنوعی شروع به رؤیاپردازی میکند و تصاویر خیالی و شگفتآوری تولید میکند!
استفاده از شبکههای عصبی برای درک تصاویر
برای آنکه بفهمیم کامپیوترها چگونه رؤیاپردازی میکنند، ابتدا باید ببینیم چهطور یاد میگیرند. گوگل برای پردازش تصاویر از شبکههای عصبی مصنوعی یا اصطلاحاً Artificial Neural Network استفاده میکند که روشهایی برای پردازش دادهها و یادگیری هستند که با الگوبرداری از شبکههای عصبی بیولوژیکی همچون مغز انسان طراحی شدهاند.
محققین گوگل برای آنکه به یک شبکهٔ عصبی بفهمانند مثلاً یک گُل چیست، میلیونها تصویر از گُلهای مختلف را به آن نشان میدهند و هر یک از تصاویر را به عنوان چیزی که یک گُل میتواند باشد مشخص میکنند و در ادامه هوش مصنوعی هر تصویر را، از زوایا و رنگ آن گرفته تا طرح و شکل کلیاش، به دقت بررسی میکنند تا در نهایت ایدهای از ماهیت یک گُل بسازد و بفهمد که یک گُل به طور کلی چه اجزایی میتواند داشته باشد.
محققیق گوگل متوجه شدند از فرآیندی که برای تشخیص تصاویر استفاده میشود، به طور مشابهی میتوان برای تولید تصاویر هم استفاده کرد و از این روی شبکههای عصبی را به کار گرفتند تا الگوهایی را که در تصاویر میبینند برای خلق آثار هنری به کار گیرند به طوری که هر لایهٔ عصبی مصنوعی تصویر را از یک بُعد بررسی میکند؛ بعضی زوایای آن و برخی دیگر شکل و رنگ آن را مطالعه میکنند و پس از آنکه این فرآیند اجرا شد، یافتهها در اختیار شبکهٔ عصبی گذاشته شده و شبکهٔ عصبی هم آنچه را تشخیص داده است نمایش میدهد (در این بین، محققین متوجه شکل عجیب درک شبکه از یک تصویر شدند به طوری که مثلاً اگر تکه ابری شبیه به پرنده بود، تصویری که شبکه از آن ابر میساخت به شکل پرنده بود و این کار را بارها و بارها انجام میداد و به نوعی از الگویی عجیب در شناخت تصویر استفاده میکرد.)
پس از تصویرسازی اولیه، محققان تصویر تولید شده را به عنوان تصویر جدیدی برای پردازش در اختیار همان شبکه قرار دادند و یک فرایند تکراری را ایجاد کردند که هر بار اندکی روی تصویر قبلی زوم میکرد و طولی نکشید که شبکه شروع به ساخت جریان بیپایانی از برداشتهای جدید کرد که بدین ترتیب، حتی زمانی که شبکه با نویز سفید کار را آغاز میکرد، تصویری ارائه میداد که کاملاً توسط خود آن طراحی شده بود! محققان این تصاویر را «رؤیاهای شبکهٔ عصبی» نامیدند که کاملاً برداشت ذهنی کامپیوتر را از اشیای جهان واقعی نمایش میدادند.
بر اساس این فرایند تجسم و تصویرسازی شبکههای عصبی مصنوعی، گوگل الگوریتم DeepDream که یک برنامهٔ هوش مصنوعی است را خلق کرد که میتواند تصاویری خیالی و عجیب تولید کند و در اول جولای 2015، گوگل توزیع اپنسورس کدهای DeepDream که به زبان پایتون نوشته شده بودند را در اختیار عموم قرار داد.