گوگل هوش مصنوعی جدید خود که حاصل همکاری دانشگاه آکسفورد و شرکت DeepMind است را معرفی کرد. نام این هوش مصنوعی WLAS (مخفف دیدن، گوش کردن، حضور یافتن و هجی کردن) است. این دستگاه با هدف لب خوانی تولید شده است. به این صورت که یک ویدئوی ویرایش نشده را نگاه کرده و از روی حرکت لب ها، مکالمه را تشخیص می دهد. این هوش مصنوعی در آزمایشات انجام شده توانست حتی دست خالقش را هم از پشت ببندد! برای بررسی بیشتر، با سکان آکادمی همراه شوید.
محققان شرکت DeepMind (در زیرمجموعه های گوگل واقع در کشور انگلستان) با همکاری محققان دانشگاه آکسفورد توانستند با استفاده از هوش مصنوعی، نرم افزاری برای لب خوانی تهیه کنند. این شبکه ی عصبی که با نام WLAS شناخته می شود حاصل تحلیل حدود 5000 ساعت از محتوای تلویزیونی شبکه ی BBC است. ویدئوهای مربوطه از برنامه هایی چون World Today ، Breakfast، Newsnight و... بدست آمده و شامل 118116 جمله و 17428 کلمه ی متفاوت است.
طبق نتایج بدست آمده، این دستگاه می تواند از ویدئوهای در حال پخش با دقت 46.8% لب خوانی کند. این دستگاه توانست طی آزمایشات رقیب انسانی خود را شکست دهد. یک لب خوان حرفه ای همین محتوا را تماشا کرد و توانست تنها 12.4% از مطالب را لب خوانی کند.
محققان پس از انجام آزمایشات اعلام کردند که سیستم WLAS توانست در زمینه ی حدس زدن مکالمات تمامی رقبای پیشین را با اختلافی قابل توجه کنار بزند. چنین سیستمی در آینده می تواند به کمک ناشنوایان بیاید و به آنان در فهم کلام دیگران کمک نماید؛ حتی می تواند به درجه ای برسد که باعث شود دستیارهای هوشمند مانند سیری و کورتانا بدون نیاز به صدا، فرمان های کاربر را اجرا نمایند.
در این حین، نباید از تلاش های دیگر کمپانی گوگل غافل ماند. تیم Google Brain اخیرا توانسته یک سیستم چند زبانی تولید کند که قادر است با استفاده از زبان مصنوعی خود، ۲ زبان مختلف را به هم تبدیل کند. از کارهای دیگر این تیم می توان به Show and Tell اشاره کرد. سیستمی که قادر است برای ویدئوها زیرنویس بسازد.
به نظر شما هوش مصنوعی تا کجای زندگی بشر پیش خواهد رفت و آیا تهدیدی برای انسان ها تلقی می گردد؟ نظرات خود را با سایر کاربران سکان آکادمی به اشتراک بگذارید.