Pandas یک ابزار متن باز سریع، قدرتمند، انعطاف پذیر و آسان برای تجزیه و تحلیل و دستکاری دادهها است که مبتنی بر زبان برنامه نویسی پایتون ساخته شده است. در مسیر انجام فعالیتهای داده محور نظیر یادگیری ماشین یا آنالیز دادهها، اولین کار پس از جمع آوری دادهها، عبارت است از واکاوی، تمیز کردن و تبدیل آن مجموعه به یک دیتاست خوانا و قابل فهم. کتابخانه Pandas مسئولیت انجام این بخش از زنجیره را بر عهده دارد.
در این فصل به عنوان اولین فصل دوره آموزشی Pandas ابتدا با خود کتابخانه پانداز و کاربردهای آن آشنا میشویم. سپس ضمن معرفی مفهوم دیتافریم (DataFrame) بر روی ابعاد مختلف آن تمرکز میکنیم. در قالب حل مثالهایی کاربردی میآموزیم یک دیتافریم از چه ابعاد و اجزایی تشکیل شده و چگونه میتوان یک دیتافریم ساخت، آن را مورد واکاوی قرار داد و حتی بررسیهای آماری اولیه را پیادهسازی و از این رهگذر حدود و نواقص آن دیتاست را مشخص کرد. در ادامه نیز میآموزیم که چگونه یک دیتافریم را مرتب کنیم، چگونه از آن زیر مجموعههای مختلفی بسازیم و مبتنی بر عبارات شرطی یک دیتافریم را فیلتر کنیم. در نهایت نیز یاد میگیریم چگونه به یک دیتافریم ستون و سطر جدید اضافه کنیم. همه این آموزشها در قالب حل مثالهای نزدیک به مسائل واقعی و به کمک دیتاستهای واقعی انجام میشود. در خلال این موارد به موضوعاتی جزئی اما مهم نظیر چگونگی خواندن فایل CSV و ساخت دیتافریم از آن، نحوه تغییر نوع داده مقادیر یک ستون دیتافریم، چگونگی دسته بندی دیتاست جهت شروع فرآیند تعلیم الگوریتم یادگیری ماشین و … پرداخته ایم.