DataScience Trends: ابزاری به‌منظور بررسی گرایشات علم داده

DataScience Trends: ابزاری به‌منظور بررسی گرایشات علم داده

شرکت DataScience ابزاری عرضه کرده است که به‌وسیله آن و با مشارکت گیت‌هاب، می‌توان گرایشات علم داده -علمی که بر پایهٔ اطلاعات گرفته شده از داده‌ها می‌باشد- را بررسی کرده و نتایج آن‌را مورد استفاده قرار داد. این ابزار جدید به کاربران این توانایی را می‌دهد که بدون نیاز به نوشتن حتی یک خط کد، در یک منبع اطلاعاتی که حاوی 2.8 میلیون ریپازیتوری گیت‌هاب است جستجو کرده و نتایج آن‌‌را مشاهده کنند.

DataScience Trends نام ابزار جدید است که شرکت DataScience برای جستجو و پیش‌بینی Trend‌ها عرضه کرد؛ با استفاده از این ابزار، می‌توان گرایشات افراد نسبت به داده‌های مختلف را با استفاده از 2.8 میلیون ریپازیتوری گیت‌هاب جستجو و پیش‌بینی کرد.

با استفاده از این ابزار، کاربران به‌آسانی می‌توانند اقدامات صورت گرفته در لایبرری‌های اپن‌سورس را که در حال جایگزینی ابزارهای سنتی در کسب‌وکارهای تجاری بزرگ مرتبط با علم داده -از Deep Learning گرفته تا Distributed Processing- هستند را با هم مقایسه کنند، بدون این که نیازی به نوشتن حتی یک خط کد داشته باشند.

این ابزار به کاربران غیرفنی اجازه می‌دهد که به‌صورت بصری بیش از 20 چیز مختلف را -از کامیت‌های جدید گرفته تا پول ریکوئست‌ها- در میان ۳ ترابایت دیتا که سال گذشته توسط گیگ‌هاب و گوگل عرضه شده است، با‌هم مقایسه کنند.

به دلیل ساده بودن کار با ابزار جدید DataScience Trends، به‌سادگی می‌توان در گیگ‌هاب برای اطلاعات مورد نظر جستجو کرد. همچنین، می‌توان در یک جدول زمانی مشخص و در محدودهٔ مورد دلخواهی از داده‌ها، با این ابزار تعامل داشت. در همین راستا، ویلیام مرچان، سرپرست بخش استراتژی در دیتاساینس گفته:

دیتاساینس ترند به‌طور لحظه‌ای در حال گسترش تعداد کاربرانی هست که می‌تونن به این گنجینهٔ اطلاعاتی که پشت یک سد فنی-اطلاعاتی مخفی شده ، دسترسی داشته باشن؛ هدف ما فراهم کردن علم داده در تمامی زمینه‌هاست. درحال حاضر، کاربران ما به یک مجموعهٔ غنی از داده‌ها از منابع اپن‌سورس دسترسی دارن و براساس اطلاعات به اشتراک گذاشته شده، می‌تونن پیش‌بینی‌های خودشون رو انجام بدن. همچنان که ابزارهای اپن‌سورس ارزش و اهمیت روش‌ها و راه‌کارهای غیررایگان رو در حوزهٔ علم داد‌ه‌ در شرکت‌های تجاری بزرگ کاهش می‌دن، این اطلاعات برای طیف وسیعی از مدیران اهمیت پیدا می‌کنه که که به‌دنبال یک نرم‌افزار مناسب و اپن‌سورس برای تیم‌ تحقیقاتی دیتا ساینس خود می‌گردن. در سال گذشته، 62 درصد از متخصصان آنالیز و تجزیه‌‌وتحلیل که در پرسشنامه مربوط به Burtch Works شرکت کردن، اعلام کردن که زبان‌های اپن‌سورس Python و R را به روش سنتی به‌اصطلاح SAS ترجیح می‌دهند. این قسمتی از یک گرایش گسترده‌تر است که در سطح تجاری مشاهده می‌کنیم.

به‌دلیل این‌که این ابزار از یک منبع داده ۳ ترابایتی ساخته شده، امکانات جستجو تقریبا بی‌نهایت است. برای شروع کار، دیتاساینس ترندز اطلاعات 10000 عدد از مشهورترین ریپازیتوری‌های گیت‌هاب را در نظر گرفته است که این اطلاعات از نظر فرایند پیشرفت، محبوبیت و مشارکت قابل فیلتر شدن هستند. این نرم‌افزار همچنین شامل چندین قابلیت سودمند دیگر برای جستجو در داده‌های نرم‌افزارهای اپن‌سورس است که عبارتند از:

تاریخ‌ها و مقادیر خاص 
کاربران با نگاه داشتن نشانگر ماوس خود روی نمودارها، می‌توانند مقادیر و تاریخ مربوطه را نیز مشاهده کنند.

مقایسه پیشرفته
لایبرری‌هایی با هر اندازه و درجه‌ای از محبوبیت می‌توانند بر یک مبنا، با همدیگر مقایسه شوند. 

قابلیت‌های اشتراک‌گذاری
هر جستجو یک URL منحصربه‌فرد برای اشتراک‌گذاری ایجاد می‌کند که کاربران می‌توانند از دکمه‌های اشتراک‌گذاری در شبکه‌های اجتماعی استفاده کرده و Trendهای مد نظر را به‌طور مستقیم به اشتراک بگذارند.

به گفتهٔ سرپرست بخش استراتژی در شرکت دیتاساینس، با استفاده از این نرم‌افزار می‌توانیم قابلیت جستجوی اطلاعات را در اختیار افراد بسیار زیادی قرار دهیم چراکه اطلاعات بسیار زیادی برای جستجو در میان آرشیو گیت‌هاب وجود دارد، از ریپازیتوری‌های محبوب گرفته، تا مشارکت در پروژه‌های اپن‌سورس. ما از این ابزار برای شناسایی مشهورترین ابزارهای اپن‌سورس استفاده می‌کنیم و آن‌ها را در سرویس کلود شرکت دیتاساینس ذخیره می‌سازیم تا در آینده توسط کاربران با سهولت بیشتری قابل دسترسی باشند. 

منبع