سرفصل‌های آموزشی
آموزش خواندن و وارد کردن داده‌ها در پایتون
خواندن فایل txt با پایتون – بخش اول

خواندن فایل txt با پایتون – بخش اول

در فصل اول با مفهوم Flat file ها آشنا می شویم. این دسته فایل ها در واقع شامل اطلاعات متنی خالص و بدون هیچ شکل و پیکربندی اضافه ای هستند؛ تنها ارقام و حروف در چینشی اغلب شبیه به سطر و ستون های جدولی دو بعدی در کنار هم و خط به خط قرار گرفته اند. در واقع از این فرمت به عنوان flat database نیز استفاده می شود؛ یعنی پایگاه داده ای تک فایلی بی هیچ ساختار رابطه ای و پیچیده. معروف ترین مثال برای flat file، فایل های CSV و فایل های txt هستند. از هر دوی این فرمت ها به دفعات استفاده می شود.
در ابتدای این فصل و در کارگاه اول، خواهیم آموخت چگونه یک فایل txt را با تابع open پایتون باز کرده و تمام اطلاعات و کاراکترهای داخلش را بخوانیم. سپس قدری راجع به مفهوم flat file ها توضیح داده و به اهمیت این فایل ها در تحلیل داده ها اشاره می کنیم. در ادامه با بهره گیری از کتابخانه NumPy و دو تابع قدرتمند loadtxt و genfromtxt ضمن خواندن اطلاعات flat file ها، از آن ها آرایه های نامپای (ndarray) می سازیم. در کارگاه آخر نیز با هدف وارد کردن اطلاعات یک flat file مثلا یک فایل CSV، از کتابخانه Pandas استفاده کرده و آن اطلاعات را به دیتافریم تبدیل می کنیم.