کتابخانه‌های پایتون برای کار با توزیع های احتمال

ابزارهای نرم‌افزاری و کتابخانه‌های مختلف برای کار با توزیع های احتمال، انجام تحلیل‌های آماری و ایجاد تصویرسازی‌ها در دسترس هستند. در این مقاله، کتابخانه‌های محبوب پایتون که معمولاً برای کار با توزیع‌ داده استفاده می‌شوند، معرفی می‌شوند.

1- NumPy

NumPy یک کتابخانه اساسی برای محاسبات عددی در پایتون است. این کتابخانه از آرایه‌ها، ماتریس‌ها و توابع ریاضی برای انجام محاسبات آماری مانند میانگین، میانه، واریانس و انحراف معیار پشتیبانی می‌کند.

import numpy as np

# تولید نمونه‌های تصادفی با توزیع نرمال
samples = np.random.normal(loc=0, scale=1, size=100)

print('نمونه‌ها:', samples)
print('میانگین نمونه‌ها:', np.mean(samples))
print('انحراف معیار نمونه‌ها:', np.std(samples))

عنوان تبلیغ: آموزش محاسبات عددی با NumPy

2- SciPy

SciPy کتابخانه‌ای است که بر اساس NumPy ساخته شده است که عملکردهای اضافی را برای محاسبات علمی از جمله بهینه‌سازی، جبر خطی و توابع آماری ارائه می‌دهد. SciPy شامل توزیع‌های احتمالی مختلف و آزمون‌های آماری است که آن را به ابزاری قدرتمند برای کار با توزیع‌های احتمال تبدیل کرده است.

from scipy.stats import norm

# محاسبه توزیع نرمال
x = np.linspace(-5, 5, 100)
pdf = norm.pdf(x, loc=0, scale=1)  # تابع چگالی احتمال

print('تابع چگالی احتمال:', pdf)

plt.plot(x, pdf)
plt.xlabel('x')
plt.ylabel('تابع چگالی احتمال')
plt.title('توزیع نرمال')
plt.show()

3- Pandas

Pandas یک کتابخانه برای کار با داده‌ها در پایتون است که ساختارهای داده‌ای مانند DataFrame و Series را فراهم می‌کند که برای کار با داده‌های ساخت‌یافته ضروری هستند. Pandas به راحتی داده‌ها را وارد، تمیز و تبدیل می‌کند و آمار توصیفی و تصویرسازی‌های اولیه را انجام می‌دهد.

import pandas as pd

# ساخت DataFrame با داده‌های تصادفی
data = pd.DataFrame({'متغیر۱': np.random.normal(loc=0, scale=1, size=100),
                     'متغیر۲': np.random.uniform(low=0, high=1, size=100)})

print('DataFrame:', data.head())
print('میانگین متغیر۱:', data['متغیر۱'].mean())
print('کمترین مقدار متغیر۲:', data['متغیر۲'].min())

4- Matplotlib

Matplotlib یک کتابخانه Python پرکاربرد برای ایجاد نمودارهای ثابت، متحرک و تعاملی است و توابع ترسیم مختلفی را برای ایجاد هیستوگرام، نمودار جعبه‌ای و سایر نمودارها برای کشف توزیع های احتمال فراهم می‌کند.

import matplotlib.pyplot as plt

# داده‌های تصادفی با توزیع نرمال
data = np.random.normal(loc=0, scale=1, size=1000)

# رسم histogram با استفاده از Matplotlib
plt.hist(data, bins=30)
plt.xlabel('مقادیر')
plt.ylabel('تعداد')
plt.title('Histogram')
plt.show()

عنوان تبلیغ: آموزش تصویرسازی داده‌ها با Matplotlib

5- Seaborn

Seaborn یک کتابخانه تصویرسازی داده‌های آماری مبتنی بر matplotlib است که فرآیند ایجاد نمودارهای آموزنده و جذاب را ساده می‌کند. Seaborn توابع داخلی را برای ایجاد نمودارهای چگالی هسته‌ای، نمودارهای ویولن و سایر نمودارها و توابع توزیع برای کاوش روابط بین متغیرها ارائه می‌کند.

import seaborn as sns

# داده‌های iris dataset
iris = sns.load_dataset('iris')

# رسم نمودار Pairplot با استفاده از Seaborn
sns.pairplot(iris, hue='species')
plt.show()

عنوان تبلیغ: آموزش تصویرسازی داده‌ها با Seaborn

با آشنایی با این ابزارها و کتابخانه‌ها، می‌توانید به طور کارآمدتر با توزیع های احتمال کار کنید، تجزیه و تحلیل‌های آماری انجام دهید و نمودارهای آموزنده‌ای را ایجاد کنید تا داده‌های خود را بهتر درک کنید و نتیجه‌گیری معنی‌داری بگیرید.