دورانی که در آن به سر میبریم، عصر Big Data (بیگ دیتا یا کلان داده) است که با توجه به حجم عظیم دادههای مختلف، تَسکهایی همچون مدیریت، ذخیره و پردازش دیتا اندکی با دشواری روبهرو است. برای حل این مسئله، سازمانهای مختلف از دیتابیسهای گوناگونی همچون دیتابیسهای ساختاریافته، ساختارنیافته، نیمه ساختاریافته و یا دیتابیسهای ستونی و ردیفی برای ذخیرهٔ دیتا استفاده میکنند.
باید گفت که تقریباً تمام دیتابیسهای سنتی، دیتا را به شکل ردیفی ذخیره میکنند که این بدان معنا است که در هر جدولی، اطلاعات یکی پس از دیگری ذخیره شدهاند (در مورد دیتابیسهای ستونی هم باید گفت که در آنها داده به صورت ستونی ذخیره میشود.)
دیتابیسهای ستونی (Column-based) در برابر دیتابیسهای ردیفی (Row-based)
بیشک مزایای استفاده از دیتابیسها ستونی بیشتر از دیتابیسهای ردیفی است. وقتی احتیاج به دسترسی به تمام دادهای که بر روی کل یک ستون ذخیره شده است داریم، دیتابیسهای ستونی سریعتر عمل میکنند چرا که این دیتا در یک تک ستون ذخیره شده است. مزیت دیگرش این است که این نوع پایگاههای داده دسترسی کمتری به هارد دیسک احتیاج داشته و مقادیر بیشتری قابل ذخیرهسازی در یک بلاک میباشند.
همچنین در حین اجرای عملیات آماری -مانند جمع- عملکرد پُرسرعتتری را شاهد خواهیم بود و دلیل چنین چیزی آن است که اطلاعات در کنار هم ذخیره شده، بنابراین زمان دسترسی و محاسبه در مقایسه با ذخیرهٔ داخلی کاهش پیدا میکند.
وقتی لازم باشد که یک جدول خاص در کل یک ستون تغییر کند، دیتابیس ستونی سریعتر عمل خواهد کرد؛ آن هم به این دلیل که کل دیتای موجود در این ستون در یک بلاک ذخیره شده که همین هم فِچ کردن (فراخوانی) و آپدیت آن را آسانتر میکند.
دیتابیس ستونی همچنین از لحاظ فشردهسازی هم عملکرد بهتری دارد چرا که انواع مشابهی از مقادیر در یک بلاک ذخیره شدهاند، حال آنکه در دیتابیسهای ردیفی کل تاپل -که انواع متفاوتی از مقادیر را در خودش جای داده است- در یک بلاک ذخیره شده است.
دربارهٔ دیتابیسهای ردیفی باید گفت که وقتی عملیات خواندن و درج اطلاعات مد نظر باشد، بیشتر کارآمد هستند؛ بنابراین انتخاب دیتابیس بستگی به نیازهای دولوپر دارد. دیتابیسهای ستونی بیشتر برای عملیات آماری که لازم است مقدار زیادی دیتا (داده) مدیریت و دستکاری شود بهتر جوابگو هستند.
آشنایی با دیتابیس MonetDB
MonetDB یک سیستم مدیریت دیتابیس اپنسورس و آزاد است که کاربرد اصلی آن در زمینهٔ انبارداری داده (یعنی وقتی که میزان زیادی دیتا برای مدیریت داریم) میباشد. این #دیتابیس عموماً در زمینهٔ بیگ دیتا مورد استفاده قرار میگیرد. استفاده از MonetDB همراه با ادغام زبان R در میان دادهشناسان محبوب و مورد توجه میباشد.
نحوهٔ نصب MonetDB در کنار پایتون
این سیستم مدیریت دیتابیس را میتوان در کنار زبانهای مختلفی منجمله پایتون و آر مورد استفاده قرار داد. به طور مثال، کامند زیر نحوهٔ نصب این ابزار برای زبان پایتون را نشان میدهد:
$ pip install monetdblite
لازم به ذکر است که فایل نصبی برای کاربران ویندوزی نیز موجود میباشد (در تکمیل این بحث، توصیه میکنیم به مقالهٔ درآمدی بر انواع مختلف دیتابیسهای NoSQL نیز مراجعه نمایید.)