سرفصل‌های آموزشی
آموزش ساماندهی داده‌ها با Pandas
معرفی پانداز، دیتافریم و واکاوی داده‌ها

معرفی پانداز، دیتافریم و واکاوی داده‌ها

Pandas یک ابزار متن باز سریع، قدرتمند، انعطاف پذیر و آسان برای تجزیه و تحلیل و دستکاری داده‌ها است که مبتنی بر زبان برنامه نویسی پایتون ساخته شده است. در مسیر انجام فعالیت‌های داده محور نظیر یادگیری ماشین یا آنالیز داده‌ها، اولین کار پس از جمع آوری داده‌ها، عبارت است از واکاوی، تمیز کردن و تبدیل آن مجموعه به یک دیتاست خوانا و قابل فهم. کتابخانه Pandas مسئولیت انجام این بخش از زنجیره را بر عهده دارد.

در این فصل به عنوان اولین فصل دوره آموزشی Pandas ابتدا با خود کتابخانه پانداز و کاربردهای آن آشنا می‌شویم. سپس ضمن معرفی مفهوم دیتافریم (DataFrame) بر روی ابعاد مختلف آن تمرکز می‌کنیم. در قالب حل مثال‌هایی کاربردی می‌آموزیم یک دیتافریم از چه ابعاد و اجزایی تشکیل شده و چگونه می‌توان یک دیتافریم ساخت، آن را مورد واکاوی قرار داد و حتی بررسی‌های آماری اولیه را پیاده‌سازی و از این رهگذر حدود و نواقص آن دیتاست را مشخص کرد. در ادامه نیز می‌آموزیم که چگونه یک دیتافریم را مرتب کنیم، چگونه از آن زیر مجموعه‌های مختلفی بسازیم و مبتنی بر عبارات شرطی یک دیتافریم را فیلتر کنیم. در نهایت نیز یاد می‌گیریم چگونه به یک دیتافریم ستون و سطر جدید اضافه کنیم. همه این آموزش‌ها در قالب حل مثال‌های نزدیک به مسائل واقعی و به کمک دیتاست‌های واقعی انجام می‌شود. در خلال این موارد به موضوعاتی جزئی اما مهم نظیر چگونگی خواندن فایل CSV و ساخت دیتافریم از آن، نحوه تغییر نوع داده مقادیر یک ستون دیتافریم، چگونگی دسته بندی دیتاست جهت شروع فرآیند تعلیم الگوریتم یادگیری ماشین و … پرداخته ایم.