فرض کنید شما می خواهید یک شبکه ی اجتماعی را تجزیه و تحلیل کنید یا معاملات بانکی متقلبانه را کشف کنید یا توصیه هایی برای یک محصول ارائه دهید. کشف جواب هر یک از این سوالات می تواند پیچیده و وقت گیر باشد.اما با پایگاه داده های گرافی، می توانید داده را به روش جدیدی مشاهده و بینش بهتری نسبت به آن ایجاد کنید و مشکلات پیچیده را حل کنید. در واقع درهای جدیدی برای حل مسائل به روی شما باز می شود.
در مقاله ی قبلی درباره ی مقدمات گراف و تحلیل آن گفتیم در این مقاله و مقاله های بعدی به کاربردهای گراف و استفاده هایی که این تکنولوژی و تحلیل آن برای ما دارد، در دسته بندی های زیر می پردازیم:
- خدمات مالی
- تولید
- دولت و حکومت
- تنظیم داده ها و حریم خصوصی
- بازاریابی
- هوش مصنوعی و یادگیری ماشین
خدمات مالی
مجرمان مالی برای اینکه به اهدافشان برسند به ناچار با سایر مجرمان یا مکان ها یا حساب های بانکی در ارتباط هستند و این ارتباط نقطه ی کلیدی برای حل و کشف مشکل است و فناوری گراف برای این کشف استفاده ی های زیادی دارد.
1-1- پولشویی
مشکل :
از نظر مفهومی، پولشویی مخلوط کردن پول های کثیف با پول های مشروع و انتقال آن از مسیر های قانونی است.
به طور دقیق تر، پولشویی یک انتقال پول دایره ای شکل است که در آن مجرم مقدار زیادی پول به دست آمده را با تقلب به حساب خود می فرستد - اما آن را از طریق یک سری انتقال پیچیده و طولانی بین حساب های "عادی" پنهان می کند. این حساب های "عادی" در واقع حساب هایی هستند که با هویت ترکیبی ایجاد شده اند. آن ها معمولا ً اطلاعات مشابه خاصی را به اشتراک می گذارند زیرا از هویت های به سرقت رفته ( مثل آدرس های ایمیل، آدرس ها و غیره) تولید می شوند و همین اطلاعات مربوط به آن هاست که تجزیه و تحلیل از طریق گراف را مناسب می کند تا باعث شود ریشه های جعلی خود را نشان دهند.
راه حل گراف :
برای ساده تر کردن کشف تقلب، می توان از معاملات و تراکنش ها بین اشخاص و همچنین موجودیت هایی که اطلاعات مشترکی دارند، گراف ایجادکرد و پس از ایجاد گراف، با اجرای یک پرس و جوی ساده، تمام مشتریانی که دارای حساب مشابه هستند، پیدا می شوند و نشان می دهد کدام حساب ها به یکدیگر پول می فرستند.
1-2- کشف قاطر پول !
مشکل :
قاطر پول کسی است که پول به دست آمده ی غیرقانونی را از طرف شخص دیگری انتقال یا جا به جا می کند. مجرمان برای کمک به پولشویی حاصل از کلاهبرداری و کلاهبرداری آنلاین یا جرایمی مانند قاچاق انسان و قاچاق مواد مخدر، قاطر پول می گیرند.
تا الان به صورت بوده است که قوانینی تعریف می شده و بر اساس آن این موارد را کشف می کردند که اصولا این حساب های مشکوک توسط انسان پرچم گذاری می شده و هشدار ایجاد می کرده است. همچنین یادگیری ماشین تا الان توانسته با پیش بینی تصمیمات جلوی بعضی از این جرایم را بگیرد.
با این حال، بهبود این مدل ها دشوار است زیرا حساب ها به طور معمول اطلاعات محدودی دارند.
راه حل گراف :
این همان جایی است که گراف ها وارد می شوند. با استفاده از فناوری گراف، کاربران می توانند اطلاعات تراکنش را به عنوان یال در نظر بگیرند و براساس روابط و معاملات پیرامونی، ویژگی های بیشتری از حساب ها تولید کنند. به عنوان مثال، با استفاده از تحلیل مرکزیت مبتنی بر گراف، کاربران می توانند میزان دسترسی حساب های خاص به حساب های قاطری که قبلا شناخته شده را مشخص کنند.
همچنین، این حساب های دروغین در بیشتر مواقع اطلاعات مشابهی (مانند آدرس یا شماره تلفن) را به اشتراک می گذارند زیرا این اطلاعات برای ثبت حساب ها ضروری است و مجرمان فقط تعداد محدودی هویت دارند. با استفاده از پرس و جوهای مبتنی بر گراف، کاربران گراف می توانند به سرعت حساب های دارای روابط مشابه یا حساب های مربوط به الگوهای تحلیلی مانند گردش در گراف (circulation) را کشف کرده و آن ها را برای بررسی بیشتر پرچم گذاری کنند.
از طریق این روش، فناوری گراف می تواند مدل های یادگیری ماشین آموزش دیده برای کشف قاطر پول و کلاهبرداری قاطر را تقویت کند.
1-3- تشخیص تقلب به صورت بلادرنگ (Realtime)
مشکل :
در دنیای امروز، مصرف کنندگان خواستار دسترسی فوری به خدمات و انتقال پول هستند که این فرصت را برای مجرمان فراهم می کند. به عنوان مثال، برنامه های خدمات پرداخت سعی می کنند در اسرع وقت پول را به کاربران تحویل دهند و در عین حال اطمینان حاصل کنند که پول برای اهداف غیرقانونی ارسال نمی شود. این امر مستلزم کشف تقلب بلادرنگ است.
راه حل گراف :
از آنجا که گراف ها پاسخ سریع به درخواستها را امکان پذیر می کنند و از آنجا که دسترسی به داده ها را گسترش می دهند، به یک فناوری محبوب در حوزه کشف تقلب بلادرنگ تبدیل شده اند. هنگام بررسی معاملات با فناوری گراف، فقط معاملات نیستند که می توانند در گرافها مدل شوند. گرافها بسیار انعطاف پذیر هستند، به این معنی که اطلاعات ناهمگن اطراف نیز می توانند مدل شوند. به عنوان مثال، آدرس های IP مشتری، موقعیت جغرافیایی خودپرداز، شماره کارت و شناسه حساب همه می توانند به گره ها تبدیل شوند و هر نوع ارتباطی به عنوان یال باشد.
گراف مالکیت اغلب برای کشف تقلب بخصوص در بانکداری آنلاین و آنالیز مکان خودپردازها مورد استفاده قرار می گیرد زیرا کاربران می توانند قوانینی را برای تشخیص کلاهبرداری براساس مجموعه داده ها طراحی کنند. به عنوان مثال، قوانین کشف را می توان برای موارد زیر ایجاد کرد:
- IP هایی که با چند کارت ثبت شده در مکان های مختلف وارد سیستم می شوند.
- کارت هایی که در مکان های مختلف با فاصله بسیار دور استفاده می شوند.
- حساب هایی که به یک باره از حساب های دیگر که در مکان های مختلف هستند تراکنش دریافت می کنند.
- ساخت
- مدیریت قطعات در صنعت
فرآیند های ساخت و تولید بسیار مربوط به روابط و وابستگی هاست و این باعث می شود فناوری های گراف مناسب برای کشف سریع اطلاعات بیشتر در یک صنعت باشد.
مشکل :
یک اتومبیل 30000 قطعه دارد. بنابراین تغییر یک قطعه چه تاثیری بر روی قطعات وابسته ی آن دارد؟ اگر چند قطعه را به یک باره تغییر دهیم، چگونه می توان تاثیرهایی که بر روی هم می گذارند را فهمید؟ این نوع تجزیه و تحلیل می تواند برای اتومبیل بسیار پیچیده باشد و این سوالات و کشف جواب های آن از طریق بررسی جدول های این ارتباط، بسیار زمان بر و پیچیده است.
شکل 1 ارتباط قطعات یک اتومبیل
راه حل گراف :
با استفاده از پرس و جو های گراف می توان زمان پاسخ را به ثانیه یا حتی سریع تر کاهش داد. گراف ها روابطی را که همه قسمت ها با یکدیگر دارند را نشان می دهد و آن ها را شفاف می کند به طوری که هرگونه نقص یا وابستگی منفی نیز مشخص می شود.
همچنین می توانید اطلاعات بیشتری در مورد محصول مانند فروشندگان، مهندسان، تأمین کنندگان، مواد، طول عمر مواد و غیره اضافه کنید تا مدل های متنوعی ایجاد شود.
قابلیت ردیابی
مشکل :
ردیابی در مسئله ی تولید از اهمیت بالایی برخوردار است. فرض کنید یک شرکت اتومبیل سازی مجبور به فراخواندن یک مدل خاص خودرو است زیرا این مدل خاص دارای مولفه ای است که در یک بازه زمانی محدود در کارخانه تولید شده است. این شرکت باید بتواند این مولفه را ردیابی کند و سپس اتومبیل هایی را که از این کارخانه در بازار هستند یا در جاده هستند، پیدا کند. این کار می تواند بسیار دشوار باشد.
اکثر شرکت ها یک پایگاه داده برای تولیدی های خود دارند که اطلاعات زیادی را در مورد محصول، مدیریت
می کند. آن ها همچنین یک پایگاه داده جداگانه خرده فروشی، و یک پایگاه داده فروش جداگانه، و یک پایگاه داده حمل و نقل جداگانه دارند. کشف همه ی این اطلاعات از بین پایگاه داده های مختلف برای یافتن اتومبیل های دارای مشکل و این که از کجا حمل شده و به چه افرادی فروخته شده، پیچیده می شود.
راه حل گراف :
بدون فناوری های گراف، تحلیلگران باید همه ی این پایگاه های داده را با هم ترکیب کنند و با یک مدل سازی پیچیده از یک پرس و جو بین پایگاه داده ای برای پیمایش استفاده کنند. مگر این که این شرکت تولیدی دارای یک پایگاه داده گرافی برای اتصال همه روابط و الگوریتم های گراف برای مشخص کردن ارتباطات و اطلاعات مربوط به آن باشد.
در این قسمت با دو نوع از کاربردهای تحلیل گراف آشنا شدید در مقاله های بعدی درباره ی کاربردهایی که در حوزه های دیگر دارد نیز صحبت می کنیم .