امروزه کسبوکارهای تراز اول دنیا تکیهٔ زیادی بر دیتا ساینس (علم داده) کردهاند به طوری متخصصین این حوزه با بهکارگیری از مدلهای یادگیری ماشینی این امکان را فراهم میکنند تا بتوان آمار و ارقام ملموسی از دادههای خام به دست آورد. گرچه در کلام چنین کاری ساده به نظر میرسد، اما واقعیت امر آن است که در عمل تبدیل Raw Data (دادههای خام) به دادههایی که قابلدرک باشند بسیار دشوار است. علاوه بر سختی این کار، نسبتاً زمان قابلتوجهی هم نیاز است تا بتوان به دادههای ارزشمندی دست یافت که کسبوکارهای مختلف بتوانند بر اساس آنها درآمدزایی خود را افزایش دهند. با این تفاسیر، Kaggle پلتفرمی است که این پروسهٔ را تسهیل کرده است که در ادامه قصد داریم برخی از بارزترین ویژگیهایش را برشمریم.
Kaggle پلتفرمی متشکل از کامیونیتی (جامعه) متخصصین یادگیری ماشینی و دانشمندان داده است. در این وبسایت، شما میتوانید دیتاستهای خود را مدیریت کرده و مدلهای ML را روی آنها در محیط کاملاً مبتنی بر وب پیادهسازی کنید. همچنین این امکان فراهم شده تا بتوانید با دیگر مهندسین و متخصصین این حوزه در ارتباط باشید، تعامل کرده و از یکدیگر بیاموزید. به طور کلی، پلتفرم Kaggle از دو بخش عمده تشکل شده است که عبارتند از:
Kernels
این بخش حاوی اسکریپتها و کدهای مرتبط با الگوریتمهای یادگیری ماشینی است. به عبارتی، Kernels یک محیط محاسباتی تحت کلود است که امکان اجرا و تحلیل الگوریتمهای یادگیری ماشینی را روی دیتاستهای مختلف میدهد.
Datasets
این بخش نیز حاوی دیتاستهایی است که دیگر کاربران برای استفادهٔ عموم پابلیش کردهاند که معمولاً در قالب JSON ،SQLite ،BigQuery و دیگر فرمتهای رایج همچون CSV عرضه شدهاند.