سالها است که جملهٔ «داده طلای نوین است!» بر سر زبانها افتاده است و این در حالی است که چنین شعاری مدتها است که در دنیای تجارت نرمافزار و شرکتهای فناوری اطلاعات نیز رواج پیدا کرده است. اما سوال اینجا است که آیا واقعا داشتن دادههای زیاد مفید است؟ آیا داده بهمعنای واقعی کلمه طلای نوین است؟
داستان از آنجایی آغاز شد که تقریبا هر کمپانی در هر اندازهای و در هر بخش از هر صنعتی که بتوانید تصورش را بکنید روی گنجینهٔ پنهانی سرمایهگذاری کرده و منتظر سود این سرمایه بودند. آنها فکر میکردند تنها کاری که باید بکنند این است که راه خود را برای رسیدن به دادههای تجاری مناسب خود باز کنند و آن وقت است که همه چیز درست میشود و با استفاده از این دادهها، همهٔ درهای بسته باز میشوند؛ فکر میکردند که این دادهها فرصتهای تجاری پنهان را برای آنان آشکار میکنند، منابع جدیدی برای سرمایهگذاری پیدا میکنند و سودشان بیشتر شده و تصوراتی از این دست!
اما این تصورات به اینجا ختم نشد و شرکتهای نرمافزاری بزرگی چون IMB, Oracle, SAP و خیلی دیگر از غولهای نرافزاری دنیا، آنقدر به داشتن داده بیشتر شاخوبرگ و آبوتاب دادند که این ایده حتی صاحب یک کلیدواژهٔ اختصاصی شد تحت عنوان «Big Data» یا به زبان معیار خودمان، همان «دادههای زیاد» و کمی بعد هم این اصطلاح وارد فهرست واژگان همه شرکتهای تجاری شد.
اما برخلاف این همه ابهتی که به داده و داشتن دادههای زیاد داده شده است، باید در نظر داشت که تحلیل داده بسیار مشکل است و تضمینی هم وجود ندارد که تحلیل مقادیر زیادی داده، در نهایت به مفهوم معناداری ختم شود؛ به عبارت دیگر، ممکن است زمان زیادی صرف شود، اطلاعات حجیمی تحلیل شود اما در نهایت نتیجهٔ به دست آمده معنادار نباشد!
امروزه، علمِ تجزیهوتحلیل نقش مهمی در بخش Internet of Things (اینترنت اشیاء) بازی میکند؛ این نقش هم در بُعد صنعتی و هم تجاری و مهمتر از همه، در ابعاد مرتبط با مشتری بسیار پررنگ است. از بُعد صنعتی، شرکتها در تلاشاند تا به جریانهای دادهٔ مختلف نفوذ کنند و راهی برای ارتقاء پروسههای کاری و عملکردی خود بیابند. اما ببینیم در ابعاد مرتبط با مشتری اوضاع از چه قرار است!
تحلیل داده در ابعاد مرتبط با مشتری در حوزهٔ سلامت و تناسب اندام کاربرد پیدا کرده است و در واقع روی فناوریهای Wearable (پوشیدنی) تمرکز دارد (Wearable یعنی فناوری هوشمندی که مانند لباس بر تن میکنند؛ مثلا جوراب هوشمند، ساعت هوشمند و ...) البته علاوه بر حوزهٔ سلامت و تناسب اندام، بهزودی بخشی از فناوری هوشمند رانندگی خودکار در خودروها نیز خواهند بود.
البته، همیشه هر ایدهای به کمال نمیرسد! مطمئنا داستانهای زیادی در باب شرکتهایی وجود دارند که با کم کردن هزینههای خود برای پیدا کردن مدلهای تجاری جدید، به موفقیتهای چشمگیری دست پیدا کردهاند. از طرفی هم مطمئناً شرکتهایی وجود داشتهاند که روی دادههایشان سرمایهگذاری کردهاند و هزینههای هنگفتی نیز برای این کار پرداختهاند و در نهایت شکست خوردهاند!
حقیقت این است که تجزیه و تحلیل دادهها سخت است و تضمینی هم وجود ندارد که تحلیل مقادیر زیادی داده، در نهایت به مفهوم معناداری ختم شود. اینکه در وهلهٔ اول ندانیم که بهدنبال چه دادههایی بگردیم و چگونه آنها را تجزیهوتحلیل کنیم، خود چالشی است بزرگ، اما چالش واقعی زمانی شروع میشود که برای یک شغل مشخص، ابزارها و اپلیکیشنهای نادرستی را بهکار بندیم. بسیاری از سازمانها پس از گذشت یک دهه یا بیشتر از انقلاب Big Data، فهمیدهاند که همه نمیتوانند از این عرصه آنطور که بایدوشاید بهرهبرداری کنند.
بخشی از مشکل اینجا است که تحلیل دادهها در ابعاد زیاد، نیاز به تلاش فراوان در سطوح مختلف دارد؛ مثلا برخی اوقات اهداف زیادی بزرگاند، گاهی اوقات دیتابیسها بسیار حجیماند و گاهی اوقات نیز برای دستیابی باید دست به تحلیل دادههای بیشماری بزنیم که به خودی خود فایدهای ندارند. اگر بخواهیم مفاهیم کلان داده و داده طلای نوین است را ساده کنیم، با یک کلمه بیشتر مواجه نخواهیم شد و آن هم چیزی نیست جز داده هرچه بیشتر، بهتر! اما آیا از بُعد تحلیل داده نیز درست؟ آیا واقعا دادهٔ بیشتر، بهتر است؟
ممکن است کمپانیها بخواهند برای اینکه توجهات بیشتری را در دنیای واقعی نسبت به IoT افزایش دهند، رویکرد خود را در زمینهٔ تحلیل داده تغییر دهند و به دادههای کمتر توجه کنند.
بهعنوان مثال، در دنیای IoT، بسیاری از سازمانها متوجه شدهاند که آنچه را که ما «تحلیل دادههای کم» مینامیم، بسیار مفیدتر است؛ این سازمانها به جای اینکه سعی در نفوذ در دیتابیسهای بزرگ داشته باشند، تمرکز خود را روی جریانهای دادهٔ کوچک و روشهای جمعآوری اطلاعات بهصورت مستقیم مثل روشهای حسی (Sensor-Based) قرار دادهاند.
نتایج حاصل از تحلیل دادههای کم، میتواند در شرایط زیادی در صنایع مختلف، بسیار موفقیتآمیز باشد؛ ممکن است برخی اوقات اینگونه تلاشها فقط به یک بینش در یک پروسهٔ بیانجامند، که کمپانیها بهسرعت از آنها بهرهبرداری میکنند، اما نظارت مستمر بر اینگونه پروسهها میتواند مفید و موثر واقع شوند.
البته میتوان درک کرد که چرا کسی مایل به حرف زدن دربارهٔ دادههای کم -یا بهتر است بگوییم Small Data- نیست؛ چراکه این عبارت، اصلاً جذاب نیست که توجهات را به خود جلب کند و کار کردن با اطلاعات کم، به ابزارهای سادهتری نیاز دارد (مثلا به محیط کاری برنامه Excel روی کامپیوتر شخصی خود فکر کنید.)
البته تحلیل این دادهها سادهتر نیز هست؛ اما این بدان معنا نیست که کاربردی نیستند و ارزشی برای سازمانها ندارند. درواقع، داشتن مجموعهای از تحلیل این اطلاعات کم همان چیزی است که بسیاری از سازمانها به آن نیاز دارند. بهعلاوه، نتایج به دست آمده از اینگونه تحلیلها، میتواند به شرکتها در تنظیم و کنترل هزینههای لازم برای شروع سرمایهگذاری روی اینترنت اشیاء کمک کند.
اگر بخواهم عادلانه قضاوت کنیم، باید بگوییم که همهٔ اپلیکیشنها برای تحلیل دادههای کم مناسب نیستند. بهعنوان مثال، نظارت بر عملکرد موتور جت یا موتور یک ماشین در حال حرکت، پروسهای است که به دادههای حجیم و سریعی نیاز دارند و همچنین نیازمند ابزارهای محاسباتی و تحلیل پیشرفتهٔ دادهها هستند. اما، ممکن است کمپانیها بخواهند برای اینکه توجهات بیشتری را در دنیای واقعی نسبت به IoT افزایش دهند، رویکرد خود را در زمینهٔ تحلیل داده تغییر دهند و به دادههای کمتر توجه کنند.