Kaggle: کامیونیتی مدیریت پروژه‌های مرتبط با Data Science

Kaggle: کامیونیتی مدیریت پروژه‌های مرتبط با Data Science

امروزه کسب‌وکارهای تراز اول دنیا تکیهٔ زیادی بر دیتا ساینس (علم داده) کرده‌اند به طوری متخصصین این حوزه با به‌کارگیری از مدل‌های یادگیری ماشینی این امکان را فراهم می‌کنند تا بتوان آمار و ارقام ملموسی از داده‌های خام به دست آورد. گرچه در کلام چنین کاری ساده به نظر می‌رسد، اما واقعیت امر آن است که در عمل تبدیل Raw Data (داده‌های خام) به داده‌هایی که قابل‌درک باشند بسیار دشوار است. علاوه بر سختی این کار، نسبتاً زمان قابل‌توجهی هم نیاز است تا بتوان به داده‌های ارزشمندی دست یافت که کسب‌وکارهای مختلف بتوانند بر اساس آن‌ها درآمدزایی خود را افزایش دهند. با این تفاسیر، Kaggle پلتفرمی است که این پروسهٔ را تسهیل کرده است که در ادامه قصد داریم برخی از بارزترین ویژگی‌هایش را برشمریم.

Kaggle پلتفرمی متشکل از کامیونیتی (جامعه) متخصصین یادگیری ماشینی و دانشمندان داده است. در این وب‌سایت، شما می‌توانید دیتاست‌های خود را مدیریت کرده و مدل‌های ML را روی آن‌ها در محیط کاملاً مبتنی بر وب پیاده‌سازی کنید. همچنین این امکان فراهم شده تا بتوانید با دیگر مهندسین و متخصصین این حوزه در ارتباط باشید، تعامل کرده و از یکدیگر بیاموزید. به طور کلی، پلتفرم Kaggle از دو بخش عمده تشکل شده است که عبارتند از:

Kernels
این بخش حاوی اسکریپت‌ها و کدهای مرتبط با الگوریتم‌های یادگیری ماشینی است. به عبارتی، Kernels یک محیط محاسباتی تحت کلود است که امکان اجرا و تحلیل الگوریتم‌های یادگیری ماشینی را روی دیتاست‌های مختلف می‌دهد. 

Datasets
این بخش نیز حاوی دیتاست‌هایی است که دیگر کاربران برای استفادهٔ عموم پابلیش کرده‌اند که معمولاً در قالب JSON ،SQLite ،BigQuery و دیگر فرمت‌های رایج همچون CSV عرضه شده‌اند.