امروزه بازار استخدام مشاغل مربوط به حوزههای علم دادهها (Data Science) و يادگيرى ماشينی (Machine Learning) بسيار داغ است. در همین راستا، در اين مقاله قصد داریم به اين سؤال پاسخ دهيم كه براى پيدا كردن شغلى مناسب در اين دو حوزه، بايد به كدام زبانهاى برنامهنويسى مسلط باشيم؟
درآمدی بر دیتا ساینس و ماشین لرنینگ
در ابتدا بايد اندكى آشنايى با اين دو موضوع داشته باشيم. دیتا ساینس در حقيقت حوزهای ميان رشتهاى از علم پردازش اطلاعات است؛ وظيفهٔ اصلى علم دادهها، استخراج اطلاعات و آمار از دادههاى گوناگون است و این در حالی است که علم دادهها در ادامهٔ برخى از زمينههاى تحليل داده مانند آمار، پيشبينى آمارى، يادگيرى ماشينی و غیره به وجود آمده است.
ماشین لرنینگ هم شاخهاى از هوش مصنوعی است كه به سيستمها اجازه مىدهد بدون اينكه نياز به برنامهنويسى كامل داشته باشند، اقدام به يادگيرى مباحث گوناگون كنند. در واقع، يادگيرى ماشينی نتيجهٔ تكامل و پيشرفت علوم تشخيص الگو (Pattern Recognition) و تئورى يادگيرى محاسباتى در زمينهٔ #هوش مصنوعى است. همچنین با استفاده از يادگيرى ماشينی، مىتوان به كمک سيستمها و مطالعهٔ ساختار الگوريتمهاى گوناگون، دست به پيشبينى دادهها زد (برای آشنایی بیشتر با مقولهٔ ماشین لرنینگ، به مقالهٔ یادگیری ماشینی چیست؟ مراجعه نمایید.)
امروزه این دو مقوله به سرعت در حال پيشرفتاند به طوری که اکثر غولهاى صنعت تكنولوژى مثل گوگل، مایکروسافت، اپل و فیسبوک سرمايهگذارىهاى کلانی در زمينهٔ علم دادهها و يادگيرى ماشينی انجام دادهاند تا افزايش كيفيت محصولات و خدماتشان را تضمين كنند. از سوی دیگر، اين اقدام به معنى افزايش موقعيتهاى شغلى مناسب در اين زمينهها است.
تحلیلی از سایت Indeed در سال ۲۰۱۶
براى اينكه بتوان در اين حوزهها مشغول به كار شد، بايد به برخى زبانها و مهارتهاى برنامهنويسى تسلط داشت؛ براى دريافتن اين موضوع كه كدام زبانهاى برنامهنويسى در اين دو زمينهٔ شغلى كاربردىتر هستند، با استفاده از اطلاعات موجود در وبسايت Indeed تحلیلی صورت گرفته است که در ادامه جزئیات آن آمده است.
بر اساس این اطلاعات، در هر جستوجو، عبارتهاى Data Science و Machine Learning اكثراً همراه با اسامى زبانهاى برنامهنويسى از جمله C++ ،Java ،C و JavaScript بودند (Python و R هم كه از مشهورترين زبانهاى علم دادهها و يادگيرى ماشينی هستند در اين ليست حضور داشتند.) علاوه بر اين، زبانهای Scala و Julia هم در ميان اسامى ديده مىشوند گرچه حضوری کمرنگ داشتهاند:
اين نمودار، علاوه بر نشان دادن تعدادى از زبانهاى كاربردى اين دو حوزهٔ تكنولوژى، همچنين دربرگیرندهٔ این مسئله است كه طى سالهای گذشته، رشد بالايى را در زمينههاى علم داده و يادگيرى ماشينی شاهد بودهايم. همانطور كه میبینیم، زبان برنامهنویسی Python صدر نمودار را از آن خود كرده است و بعد از آن، R و Java در جایگاه دوم و سوم قرار دارند (همچنین توصیه میکنیم به مقالهٔ بهترین ماژولهای یادگیری ماشینی برای پایتون نیز مراجعه نمایید.) به طور خلاصه، ليست نهايى به صورت زير است:
١- پايتون
٢- جاوا
٣- آر
٤- سیپلاسپلاس
٥- سی
٦- جاوااسکریپت
٧- اسکالا
٨- جولیا
به نظر شما یادگیری کدام زبان برای ورود به این دو حوزه منطقیتر است و چرا؟ نظرات، دیدگاهها و تجربیات خود را با دیگر کاربران سکان آکادمی به اشتراک بگذارید.