
این فصل با تمرکز بر مفاهیم بنیادی مدلهای درختی، قدم اول در ورود به دنیای الگوریتمهای قدرتمند یادگیری ماشین را فراهم میکند. در این فصل، ابتدا با مفهوم درخت تصمیم برای طبقهبندی آشنا میشوید و با یک مثال عملی روی دادههای سرطان، نحوه یادگیری این درختها را بررسی میکنید. تفاوت میان مدلهای خطی و غیرخطی، تعریف نواحی تصمیمگیری، و مزایای مدلهای درختی در کار با دادههای پیچیده و بدون نیاز به نرمالسازی ویژگیها از جمله مباحث اصلی این بخش هستند.
سپس به آموزش درخت تصمیم برای رگرسیون میپردازیم؛ یعنی حالتی که هدف مدل پیشبینی یک مقدار پیوسته مانند مصرف سوخت است. در این مسیر، مفاهیم مهمی مانند خطای میانگین مربعات (MSE)، بهینهسازی معیار اطلاعات (Information Gain)، نحوه تعیین گرههای تصمیم و برگها، و همچنین مقایسه عملکرد مدلهای درختی با رگرسیون خطی پوشش داده میشود.
این فصل پایهای علمی و عملی قوی برای درک عملکرد درختهای یادگیرنده فراهم میسازد و آمادهسازی ذهنی خوبی برای ورود به مباحث پیشرفتهتر مانند Random Forest و Boosting است که در فصل دوم به آن میپردازیم.
در این بخش میآموزید که درختهای دستهبندی برای طبقهبندی دادهها به برچسبهای متفاوت استفاده میشوند. برخلاف مدلهای خطی، درختهای تصمیم میتوانند مرزهای تصمیم پیچیده را بدون نیاز به مقیاسبندی ویژگیها بیاموزند.