کدام‌یک مناسب کسب‌وکار شماست: Big Data یا Small Data؟

کدام‌یک مناسب کسب‌وکار شماست: Big Data یا Small Data؟

سال‌ها است که جملهٔ «داده طلای نوین است!» بر سر زبان‌ها افتاده است و این در حالی است که چنین شعاری مدت‌ها است که در دنیای تجارت نرم‌افزار و شرکت‌های فناوری اطلاعات نیز رواج پیدا کرده است. اما سوال اینجا است که آیا واقعا داشتن داده‌های زیاد مفید است؟ آیا داده به‌معنای واقعی کلمه طلای نوین است؟

داستان از آنجایی آغاز شد که تقریبا هر کمپانی در هر اندازه‌ای و در هر بخش از هر صنعتی که بتوانید تصورش را بکنید روی گنجینهٔ پنهانی سرمایه‌گذاری کرده و منتظر سود این سرمایه بودند. آن‌ها فکر می‌کردند تنها کاری که باید بکنند این است که راه خود را برای رسیدن به داده‌های تجاری مناسب خود باز کنند و آن وقت است که همه چیز درست می‌شود و با استفاده از این داده‌ها، همهٔ درهای بسته باز می‌شوند؛ فکر می‌کردند که این داده‌ها فرصت‌های تجاری پنهان را برای آنان آشکار می‌کنند، منابع جدیدی برای سرمایه‌گذاری پیدا می‌کنند و سودشان بیشتر شده و تصوراتی از این دست!

اما این تصورات به اینجا ختم نشد و شرکت‌های نرم‌افزاری بزرگی چون IMB, Oracle, SAP و خیلی دیگر از غول‌های نر‌افزاری دنیا، آنقدر به داشتن داده بیشتر شاخ‌وبرگ و آب‌و‌تاب دادند که این ایده حتی صاحب یک کلیدواژهٔ اختصاصی شد تحت عنوان «Big Data» یا به زبان معیار خودمان، همان «داده‌های زیاد» و کمی بعد هم این اصطلاح وارد فهرست واژگان همه شرکت‌های تجاری شد.

اما برخلاف این همه ابهتی که به داده‌ و داشتن داد‌ه‌های زیاد داده شده است، باید در نظر داشت که تحلیل داده بسیار مشکل است و تضمینی هم وجود ندارد که تحلیل مقادیر زیادی داده، در نهایت به مفهوم معناداری ختم شود؛ به عبارت دیگر، ممکن است زمان زیادی صرف شود، اطلاعات حجیمی تحلیل شود اما در نهایت نتیجهٔ به دست آمده معنا‌دار نباشد!

امروزه، علمِ تجزیه‌و‌تحلیل نقش مهمی در بخش Internet of Things (اینترنت اشیاء) بازی می‌کند؛ این نقش هم در بُعد صنعتی و هم تجاری و مهم‌تر از همه، در ابعاد مرتبط با مشتری بسیار پررنگ است. از بُعد صنعتی، شرکت‌ها در تلاش‌اند تا به جریان‌های دادهٔ مختلف نفوذ کنند و راهی برای ارتقاء پروسه‌‌های کاری و عملکردی خود بیابند. اما ببینیم در ابعاد مرتبط با مشتری اوضاع از چه قرار است!

تحلیل داده در ابعاد مرتبط با مشتری در حوزهٔ سلامت و تناسب اندام کاربرد پیدا کرده است و در واقع روی فناوری‌های Wearable (پوشیدنی) تمرکز دارد (Wearable یعنی فناوری هوشمندی که مانند لباس بر تن می‌کنند؛ مثلا جوراب هوشمند، ساعت هوشمند و ...) البته علاوه بر حوزهٔ سلامت و تناسب اندام، به‌زودی بخشی از فناوری هوشمند رانندگی خودکار در خودروها نیز خواهند بود.

البته، همیشه هر ایده‌ای به کمال نمی‌رسد! مطمئنا داستان‌های زیادی در باب شرکت‌هایی وجود دارند که با کم کردن هزینه‌های خود برای پیدا کردن مدل‌های تجاری جدید، به موفقیت‌های چشمگیری دست پیدا کرده‌اند. از طرفی هم مطمئناً شرکت‌هایی وجود داشته‌اند که روی داده‌هایشان سرمایه‌گذاری کرده‌اند و هزینه‌های هنگفتی نیز برای این کار پرداخته‌اند و در نهایت شکست خورده‌اند!

حقیقت این است که تجزیه و تحلیل داده‌ها سخت است و تضمینی هم وجود ندارد که تحلیل مقادیر زیادی داده، در نهایت به مفهوم معناداری ختم شود. این‌که در وهلهٔ اول ندانیم که به‌دنبال چه داده‌هایی بگردیم و چگونه آن‌ها را تجزیه‌و‌تحلیل کنیم، خود چالشی است بزرگ، اما چالش واقعی زمانی شروع می‌شود که برای یک شغل مشخص، ابزارها و اپلیکیشن‌های نادرستی را به‌کار بندیم. بسیاری از سازمان‌ها پس از گذشت یک دهه یا بیشتر از انقلاب Big Data، فهمیده‌اند که همه نمی‌توانند از این عرصه آن‌طور که بایدوشاید بهره‌برداری کنند.

بخشی از مشکل اینجا است که تحلیل داده‌ها در ابعاد زیاد، نیاز به تلاش فراوان در سطوح مختلف دارد؛ مثلا برخی اوقات اهداف زیادی بزرگ‌اند، گاهی اوقات دیتابیس‌ها بسیار حجیم‌اند و گاهی اوقات نیز برای دست‌یابی باید دست به تحلیل داده‌های بیشماری بزنیم که به خودی خود فایده‌ای ندارند. اگر بخواهیم مفاهیم کلان داده و داده طلای نوین است را ساده کنیم، با یک کلمه بیشتر مواجه نخواهیم شد و آن هم چیزی نیست جز  داده هرچه بیشتر، بهتر! اما آیا از بُعد تحلیل داده نیز درست؟ آیا واقعا دادهٔ بیشتر، بهتر است؟

ممکن است کمپانی‌ها بخواهند برای این‌که توجهات بیشتری را در دنیای واقعی نسبت به IoT افزایش دهند، رویکرد خود را در زمینهٔ تحلیل داده تغییر دهند و به داده‌های کمتر توجه کنند.

به‌عنوان مثال، در دنیای IoT، بسیاری از سازمان‌ها متوجه شده‌اند که آنچه را که ما «تحلیل داده‌های کم» می‌نامیم، بسیار مفیدتر است؛ این سازمان‌ها به جای این‌که سعی در نفوذ در دیتابیس‌های بزرگ داشته‌ باشند، تمرکز خود را روی جریان‌های دادهٔ کوچک و روش‌های جمع‌آوری اطلاعات به‌صورت مستقیم مثل روش‌های حسی (Sensor-Based) قرار داده‌اند.

نتایج حاصل از تحلیل داده‌های کم، می‌تواند در شرایط زیادی در صنایع مختلف، بسیار موفقیت‌آمیز باشد؛ ممکن است برخی اوقات این‌گونه تلاش‌ها فقط به یک بینش در یک پروسهٔ بیانجامند، که کمپانی‌ها به‌سرعت از آن‌ها بهره‌برداری می‌کنند، اما نظارت مستمر بر این‌گونه پروسه‌ها می‌تواند مفید و موثر واقع شوند.

البته می‌توان درک کرد که چرا کسی مایل به حرف زدن دربارهٔ داده‌های کم -یا بهتر است بگوییم Small Data- نیست؛ چراکه این عبارت، اصلاً جذاب نیست که توجهات را به خود جلب کند و کار کردن با اطلاعات کم، به ابزارهای ساد‌ه‌تری نیاز دارد (مثلا به محیط کاری برنامه Excel روی کامپیوتر شخصی خود فکر کنید.)

البته تحلیل این داده‌ها ساده‌تر نیز هست؛ اما این بدان معنا نیست که کاربردی نیستند و ارزشی برای سازمان‌ها ندارند. درواقع، داشتن مجموعه‌ای از تحلیل این اطلاعات کم همان چیزی است که بسیاری از سازمان‌ها به آن نیاز دارند. به‌علاوه، نتایج به دست آمده از این‌گونه تحلیل‌ها، می‌تواند به شرکت‌ها در تنظیم و کنترل هزینه‌های لازم برای شروع سرمایه‌گذاری روی اینترنت اشیاء کمک کند.

اگر بخواهم عادلانه قضاوت کنیم، باید بگوییم که همهٔ اپلیکیشن‌ها برای تحلیل داده‌های کم مناسب نیستند. به‌عنوان مثال، نظارت بر عملکرد موتور جت یا موتور یک ماشین در حال حرکت، پروسه‌ای است که به داده‌های حجیم و سریعی نیاز دارند و همچنین نیازمند ابزارهای محاسباتی و تحلیل پیشرفتهٔ داده‌ها هستند. اما، ممکن است کمپانی‌ها بخواهند برای این‌که توجهات بیشتری را در دنیای واقعی نسبت به IoT افزایش دهند، رویکرد خود را در زمینهٔ تحلیل داده تغییر دهند و به داده‌های کمتر توجه کنند.

منبع