ابزارهای نرمافزاری و کتابخانههای مختلف برای کار با توزیع های احتمال، انجام تحلیلهای آماری و ایجاد تصویرسازیها در دسترس هستند. در این مقاله، کتابخانههای محبوب پایتون که معمولاً برای کار با توزیع داده استفاده میشوند، معرفی میشوند.
1- NumPy
NumPy یک کتابخانه اساسی برای محاسبات عددی در پایتون است. این کتابخانه از آرایهها، ماتریسها و توابع ریاضی برای انجام محاسبات آماری مانند میانگین، میانه، واریانس و انحراف معیار پشتیبانی میکند.
import numpy as np
# تولید نمونههای تصادفی با توزیع نرمال
samples = np.random.normal(loc=0, scale=1, size=100)
print('نمونهها:', samples)
print('میانگین نمونهها:', np.mean(samples))
print('انحراف معیار نمونهها:', np.std(samples))
عنوان تبلیغ: آموزش محاسبات عددی با NumPy
2- SciPy
SciPy کتابخانهای است که بر اساس NumPy ساخته شده است که عملکردهای اضافی را برای محاسبات علمی از جمله بهینهسازی، جبر خطی و توابع آماری ارائه میدهد. SciPy شامل توزیعهای احتمالی مختلف و آزمونهای آماری است که آن را به ابزاری قدرتمند برای کار با توزیعهای احتمال تبدیل کرده است.
from scipy.stats import norm
# محاسبه توزیع نرمال
x = np.linspace(-5, 5, 100)
pdf = norm.pdf(x, loc=0, scale=1) # تابع چگالی احتمال
print('تابع چگالی احتمال:', pdf)
plt.plot(x, pdf)
plt.xlabel('x')
plt.ylabel('تابع چگالی احتمال')
plt.title('توزیع نرمال')
plt.show()
3- Pandas
Pandas یک کتابخانه برای کار با دادهها در پایتون است که ساختارهای دادهای مانند DataFrame و Series را فراهم میکند که برای کار با دادههای ساختیافته ضروری هستند. Pandas به راحتی دادهها را وارد، تمیز و تبدیل میکند و آمار توصیفی و تصویرسازیهای اولیه را انجام میدهد.
import pandas as pd
# ساخت DataFrame با دادههای تصادفی
data = pd.DataFrame({'متغیر۱': np.random.normal(loc=0, scale=1, size=100),
'متغیر۲': np.random.uniform(low=0, high=1, size=100)})
print('DataFrame:', data.head())
print('میانگین متغیر۱:', data['متغیر۱'].mean())
print('کمترین مقدار متغیر۲:', data['متغیر۲'].min())
4- Matplotlib
Matplotlib یک کتابخانه Python پرکاربرد برای ایجاد نمودارهای ثابت، متحرک و تعاملی است و توابع ترسیم مختلفی را برای ایجاد هیستوگرام، نمودار جعبهای و سایر نمودارها برای کشف توزیع های احتمال فراهم میکند.
import matplotlib.pyplot as plt
# دادههای تصادفی با توزیع نرمال
data = np.random.normal(loc=0, scale=1, size=1000)
# رسم histogram با استفاده از Matplotlib
plt.hist(data, bins=30)
plt.xlabel('مقادیر')
plt.ylabel('تعداد')
plt.title('Histogram')
plt.show()
عنوان تبلیغ: آموزش تصویرسازی دادهها با Matplotlib
5- Seaborn
Seaborn یک کتابخانه تصویرسازی دادههای آماری مبتنی بر matplotlib است که فرآیند ایجاد نمودارهای آموزنده و جذاب را ساده میکند. Seaborn توابع داخلی را برای ایجاد نمودارهای چگالی هستهای، نمودارهای ویولن و سایر نمودارها و توابع توزیع برای کاوش روابط بین متغیرها ارائه میکند.
import seaborn as sns
# دادههای iris dataset
iris = sns.load_dataset('iris')
# رسم نمودار Pairplot با استفاده از Seaborn
sns.pairplot(iris, hue='species')
plt.show()
عنوان تبلیغ: آموزش تصویرسازی دادهها با Seaborn
با آشنایی با این ابزارها و کتابخانهها، میتوانید به طور کارآمدتر با توزیع های احتمال کار کنید، تجزیه و تحلیلهای آماری انجام دهید و نمودارهای آموزندهای را ایجاد کنید تا دادههای خود را بهتر درک کنید و نتیجهگیری معنیداری بگیرید.