DataScience Trends: ابزاری به‌ منظور بررسی گرایشات علم داده

DataScience Trends: ابزاری به‌ منظور بررسی گرایشات علم داده

شرکت DataScience ابزاری عرضه کرده است که به‌ وسیله آن و با مشارکت گیت‌هاب، می‌توان گرایشات علم داده را بررسی کرده و نتایج آن را مورد استفاده قرار داد. این ابزار به کاربران این امکان را می‌دهد تا بدون نیاز به نوشتن حتی یک خط کد، در یک منبع اطلاعاتی که حاوی بیش از سه میلیون ریپازیتوری گیت‌هاب است جستجو کرده و نتایج آن‌‌ را مشاهده کنند.

DataScience Trends نام ابزاری است که شرکت DataScience برای جستجو و پیش‌بینی آنچه اصطلاحاً Trend‌ است عرضه کرد؛ با استفاده از این ابزار، می‌توان گرایشات افراد نسبت به داده‌های مختلف را با استفاده از هزاران ریپازیتوری #گیت‌هاب جستجو و پیش‌بینی کرد.

در حقیقت، با استفاده از این ابزار کاربران، به‌خصوص دولوپرهای علاقمند به علم داده، می‌توانند به‌ آسانی اقدامات صورت گرفته در لایبرری‌های اپن‌سورس را که در حال جایگزینی ابزارهای سنتی در کسب‌وکارهای تجاری بزرگ مرتبط با علم داده هستند را با هم مقایسه کنند، بدون اینکه نیازی به نوشتن حتی یک خط کد داشته باشند!

DataScience Trends به کاربران غیرفنی اجازه می‌دهد تا به‌ صورت شهوی چندین مؤلفهٔ مختلف را ( از کامیت‌های جدید گرفته تا پول ریکوئست‌ها) در میان چندین ترابایت دیتا با‌ هم مقایسه کنند. همچنین به دلیل ساده بودن کار با این سرویس، به‌ سادگی می‌توان در گیگ‌هاب برای اطلاعات مورد نظر جستجو کرد. همچنین، می‌توان در یک جدول زمانی مشخص و در محدودهٔ دلخواهی از داده‌ها، با این ابزار تعامل داشت. در همین راستا، سرپرست بخش استراتژی کمپانی دیتاساینس گفته است:

دیتاساینس ترندز به‌ طور لحظه‌ای در حال گسترش تعداد کاربرانی هست که می‌تونن به این گنجینهٔ اطلاعاتی که پشت یک سد فنی-اطلاعاتی مخفی شده، دسترسی داشته باشن. در یک کلام، هدف ما سهولت کار با علم داده در تمامی زمینه‌هاست. در حال حاضر، کاربران ما به یک مجموعهٔ غنی از داده‌ها از منابع اپن‌سورس دسترسی دارن و بر اساس اطلاعات به اشتراک گذاشته شده، می‌تونن پیش‌بینی‌های خودشون رو انجام بدن. 
همچنان که ابزارهای اپن‌سورس ارزش و اهمیت روش‌ها و راه‌کارهای غیررایگان رو در حوزهٔ علم داد‌ه‌ در شرکت‌های تجاری بزرگ کاهش می‌دن، این اطلاعات برای طیف وسیعی از مدیران اهمیت پیدا می‌کنه که به‌ دنبال یک نرم‌افزار مناسب و اپن‌سورس برای تیم‌ تحقیقاتی دیتا ساینس خود می‌گردن.

به‌ دلیل اینکه این ابزار از یک منبع دادهٔ چند ترابایتی ساخته شده، امکانات جستجو تقریباً بی‌نهایت است. برای شروع کار، دیتاساینس ترندز اطلاعات 10000 عدد از مشهورترین ریپازیتوری‌های گیت‌هاب را در نظر گرفت که این اطلاعات از نظر فرایند پیشرفت، محبوبیت و مشارکت قابل فیلتر شدن بودند. این نرم‌افزار همچنین شامل چندین قابلیت سودمند دیگر برای جستجو در داده‌های نرم‌افزارهای #اپن‌سورس است که عبارتند از:

تاریخ‌ها و مقادیر خاص 
کاربران با نگاه داشتن نشانگر ماوس خود روی نمودارها، می‌توانند مقادیر و تاریخ مربوطه را نیز مشاهده کنند.

مقایسهٔ پیشرفته
لایبرری‌هایی با هر اندازه و درجه‌ای از محبوبیت می‌توانند بر یک مبنا، با همدیگر مقایسه شوند. 

قابلیت‌های اشتراک‌گذاری
هر جستجو یک لینک منحصربه‌فرد برای اشتراک‌گذاری ایجاد می‌کند که کاربران می‌توانند از دکمه‌های اشتراک‌گذاری در شبکه‌های اجتماعی استفاده کرده و تِرِندهای مد نظر را به‌ طور مستقیم با سایرین به اشتراک بگذارند.

به گفتهٔ سرپرست بخش استراتژی در شرکت دیتاساینس، با استفاده از این نرم‌افزار می‌توانیم قابلیت جستجوی اطلاعات را در اختیار افراد بسیار زیادی قرار دهیم چرا که اطلاعات بسیار زیادی برای جستجو در میان آرشیو گیت‌هاب وجود دارد؛ از ریپازیتوری‌های محبوب گرفته تا مشارکت در پروژه‌های اپن‌سورس.