پیش پردازش دادهها یک مرحله مهم در گردش کار یادگیری ماشین است. این فصل تکنیکهای مختلف پیش پردازش مانند مقیاسبندی، نرمالسازی، رمزگذاری متغیرهای دستهبندی و مدیریت مقادیر گمشده را پوشش میدهد که در واقع تاکیدی بر اهمیت آماده سازی داده ها قبل از وارد کردن آنها به مدل های یادگیری ماشین است. علاوه بر این، این فصل پایپ لاین (خطوط لوله) را معرفی میکند، یک ویژگی قدرتمند در scikit -Learn که جریان کار پیشپردازش و مدلسازی را ساده میکند و آن را تکرارپذیرتر و قابل مدیریتتر میکند.