Common Voice: سیستم جدید تشخیص گفتار موزیلا که به‌صورت اپن‌سورس عرضه خواهد شد!

Common Voice: سیستم جدید تشخیص گفتار موزیلا که به‌صورت اپن‌سورس عرضه خواهد شد!

بنیاد موزیلا اخیراً پروژهٔ اپن‌سورس خود تحت‌عنوان Common Voice را راه‌اندازی کرده‌ است که این پروژه در‌واقع یک سیستم تشخیص گفتار اپن‌سورس است که در آن افراد به‌صورت داوطلبانه نمونه صداهای خود را ثبت می‌کنند و درعین‌حال نمونه صداهای دیگران را تأیید یا رد می‌کنند. در همین راستا، موزیلا درصدد است تا ۱۰ هزار ساعت نمونه صوت برای آموزش این سیستم تشخیص گفتار جمع‌آوری کند.

سال گذشته گوگل اعلام کرد که ۲۰٪ سرچ‌های انجام شده در موبایل‌ها به‌صورت صوتی بوده‌ است و رشد سرچ صوتی در مقایسه با سرچ متنی بیشتر بوده‌ است؛ در طی چند سال گذشته، تشخیص صدا و استفاده از آن برای دیوایس‌های مطرح این تکنولوژی مثل Siri ،Cortana ،Alexa و Google Assistant به عامل مهمی تبدیل شده‌ است.

اما باید دید که در دنیای اپن‌سورس اوضاع از چه قرار است؟ آیا این غول‌های تکنولوژی، فناوری‌های تشخیص گفتار خود را به‌صورت اپن‌سورس عرضه می‌کنند تا به دولوپرها در ساخت محصولات مبتکرانه و نوآورانه کمک کنند یا خیر؟ تکلیف کمپانی‌های دیگر هنوز معلوم نیست، اما همان‌طور که گفته شد بنیاد موزیلا -سازندهٔ مرورگر محبوب فایرفاکس- از پروژهٔ اپن‌سورس تشخیص گفتار خود به‌نام Common Voice پرده‌برداری کرده‌ است.

به‌عنوان بخشی از این پروسه، موزیلا از داوطلبان خواسته تا به آموزش این سیستم تشخیص گفتار کمک کنند؛ درواقع، از دولوپرها خواسته که کمی وقت بگذارند و صدای دیگران را گوش داده و آن‌ها را اعتبارسنجی کنند و درعین‌حال صدای خود را هم در سیستم قرار دهند. هرچه صدای بیشتری فرستاده شود، این پروژه زودتر به‌ثمر رسیده و قوی‌تر خواهد شد.

درواقع، شما می‌توانید وارد سایت شوید، جملاتی که دیگران خوانده‌اند را بشنوید، آن‌ها را با علامت تیک/ضربدر رد یا تأیید کنید و اگر دوست داشتید جملاتی که در اختیار شما قرار می‌گیرند را بخوانید تا این سیستم بیشتر با نحوهٔ گفتار انسان‌ها آشنا شود. هدف موزیلا این است که ۱۰ هزار ساعت گفتار و صوت معتبر تهیه کند و برنامه دارد که دیتابیس اپن‌سورس این پروژه را در آینده‌ای نه‌چندان دور -اما در همین سال جاری- منتشر کند.

شرکت‌هایی مانند گوگل هم درحال‌حاضر درحال آموزش دادن سیستم‌های تشخیص گفتار و هوش مصنوعی خود بااستفاده از دیتای شما هستند؛ آن‌ها درواقع با ارائهٔ سرویس‌های رایگان شما را متقاعد به‌استفاده از این سرویس‌ها کرده و از همین طریق هم دیتای شما را جمع‌آوری می‌کنند. درمورد موزیلا باید گفت که علاوه بر رایگان بودن این سرویس، Common Voice اپن‌سورس هم هست که همین مسئله باعث می‌شود افراد بیشتری جذب توسعهٔ این سیستم و همکاری با آن بشوند.

منبع


نهال سهیلی‌فر