چرا سکان آکادمی؟
بررسی چند راهکار مهم در text analysis (قسمت دوم)

بررسی چند راهکار مهم در text analysis (قسمت دوم)

در ادامه‌ی بررسی ترفند‌های کاربردی در تجزیه‌ متن، در این قسمت آموزشی نحوه‌ی کار با توکن فیلتر‌ها جهت تجزیه‌ی term ها به جزییات بیشتر را خواهیم آموخت. این ترفند می‌تواند انعطاف‌پذیری تطبیق موارد جستجو‌شده در ایندکس را افزایش دهد.

توجه کنید هریک از روش‌هایی که باعث شوند تا تعداد term بیشتری در inverted index ذخیره شود (فیلترهای ngram یا Edge-ngram، تکنیک multi_field و ...)، باعث مصرف بیشتر فضای حافظه نیز خواهند شد! بنابراین استفاده از روش‌های فوق برای فیلد‌های متنی با متن‌های خیلی طولانی ممکن است مقرون به صرفه نباشد.

برخی از قابلیت‌های ایجاد انعطاف بیشتر برای موتور جستجو، در تنظیمات کوئری‌های جستجو قابل پیاده‌سازی است که در فصل آینده با آن‌ها آشنا خواهید شد.

دوره در حال تکمیل است ... rocket