UCI ML Repo: ریپازیتوری عظیمی برای آنالیز الگوریتم‌های یادگیری ماشینی

UCI ML Repo: ریپازیتوری عظیمی برای آنالیز الگوریتم‌های یادگیری ماشینی

UCI Machine Learning Repository مجموعه‌ای است از دیتابیس‌ها، دیتاست‌های به اصطلاح Domain Theory و همچنین یکسری Data Generator که توسط کامیونیتی دولوپرهای فعال در حوزۀ ML (یادگیری ماشینی) به منظور آنالیز الگوریتم‌های آن مورد استفاده قرار می‌گیرد (Data Generator دیتاست‌هایی هستند که به صورت اتوماتیک یکسری دیتا را به منظور استفاده در بخشی از سیستم، تولید می‌کنند.)

این آرشیو در سال 1987 به عنوان یک آرشیو مبتنی بر FTP (مخفف File Transfer Protocol به معنای پروتکل انتقال فایل) توسط David Aha به همراه چند نفر از دانشجویان فارغ‌التحصیل دانشگاه UC Irvine ایجاد شد. از آن زمان تاکنون دانشجویان، مدرسان و محققان سراسر جهان از این ریپازیتوری به عنوان یکی از منابع اصلی دیتاست‌های مورد نیاز الگوریتم‌های #یادگیری ماشینی خود استفاده می‌کنند.

برای پی بردن به اهمیت این آرشیو، بایستی بگوییم که نام این ریپازیتوری بیش از 1000 بار توسط سایر دولوپرها در مقالات دیگر ذکر شده که همین مسئله موجب شده است تا UCI Machine Learning Repository به عنوان 100 مقالۀ برتر در زمینۀ علوم کامپیوتر شناخته شود.

همچنین لازم به ذکر است که در موفقیت این ریپازیتوری عوامل بسیاری نقش داشته‌اند که از آن جمله می‌توان کاربران، دولوپرها و افرادی را نام برد که یکسری دیتابیس و دیتاست را به این ریپازیتوری اهدا کرده و برخی نیز در فرآیند جمع‌آوری اطلاعات به منظور ساخت دیتابیس‌ها و دیتاست‌های نوع Data Generator مشارکت داشته‌اند.