ارائه مدل شناسایی متقلبین در سیستم¬های بانکداری آنلاین بر مبنای تراکنش¬های کارت¬های اعتباری با استفاده از جنگل تصادفی وزندار چندگانه و مدل کوادراتیک
محورهای موضوعی :فرزانه رحمانی 1 , چنگیز والمحمدی 2 , کیامرث فتحی هفشجانی 3
1 - گروه مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی، واحد تهران جنوب، تهران، ایران
2 - گروه مدیریت صنعتی، دانشکده مدیریت، دانشگاه آزاد اسلامی، واحد تهران جنوب، تهران، ایران
3 - دانشگاه آزاد اسلامی واحد تهران جنوب
کلید واژه: شناسایی متقلبین, بانکداری آنلاین, تراکنش¬های کارت¬های اعتباری, ماتریس مجاورت, الگوریتم تجمیعی, جنگل تصادفی وزن¬دار چندگانه, مدل کوادراتیک,
چکیده مقاله :
با رشد روزافزون بانکداری برخط بانک¬ها و مؤسسات مالی روزبهروز بیشتر به سمت استفاده از این فناوری و خدمات آن سوق پیدا می¬کنند. باتوجهبه حجم بالای تراکنش¬ها امکان مدیریت آن¬ها توسط نیروی انسانی عملاً غیرممکن است. به همین منظور امروزه رویکردهای مبتنی بر دادهکاوی به کمک بانکداری برخط آمده است. در این مقاله یک مدل کارآمد برای شناسایی متقلبین در تراکنش¬های کارت¬های بانکی ارائه می-گردد. روش پیشنهادی از ماتریس مجاورت، جایگذاری ویژگی¬های بدون مقدار با استفاده از وزن¬دهی و الگوریتم تجمیعی جنگل تصادفی استفاده می¬کند که در هر انشعاب آن با محاسبه وزن هر انشعاب، بهترین انشعاب تصمیم¬گیرنده با استفاده از محاسبه هزینه مدل انتخاب می¬شود. همچنین با استفاده از مدل کوادراتیک چندگانه بهترین جنگل را برای تصمیم¬گیری انتخاب می¬نماید. بدین ترتیب این روش را بر روی دو مجموعهداده که اولی 14 ویژگی و دومی 20 ویژگی داشته است تست کردهایم و مشاهده شده است که مدل این تحقیق در مقایسه با درخت تصمیم و ماشین بردار پشتیبان و شبکه عصبی و جنگل تصادفی معمولی که در حال حاضر بالاترین نتایج را نسبت به هر روشی از خود نشان دادهاند نیز بهبودهایی داشته است. همچنین آزمایشات نشان می¬دهد که هیچ یک از روش¬های مذکور قادر به پیش¬بینی خطای OOB نبوده و جنگل تصادفی معمولی که قادر به پیش¬بینی این خطا می¬باشد بسیار ضعیف¬تر از مدل پیشنهادی عمل نموده است. فقط روش پیشنهادی است که می¬تواند این مقدار را محاسبه نماید و مقدار مناسبی برای آن پیش¬بینی نماید. همچنین در آزمایش روی مجموعهدادهی دوم نیز در همین حدود بهبودهایی داشته ایم که به تفضیل در مقاله ذکر شده است.
With the increasing growth of online banking, banks and financial institutions are more and more inclined to use this technology and its services. Due to the high volume of transactions, it is practically impossible to manage them by human resources. For this purpose, today, approaches based on data mining have come online with the help of banking. In this article, an efficient model for identifying fraudsters in bank card transactions is presented. The proposed method uses the adjacency matrix, placement of non-valued features using weighting, and random forest aggregation algorithm, in each branch of which, by calculating the weight of each branch, the best branch of the decision maker is selected by calculating the cost of the selection model. It can be It also selects the best forest for decision-making using the multiple quadratic model. Thus, we have tested this method on two data sets, the first one had 14 features and the second one had 20 features, and it has been observed that the model of this research compared to the decision tree, support vector machine, neural network, and normal random forest, which is currently the highest The results have shown improvements over any method. Also, the tests show that none of the mentioned methods were able to predict the OOB error and the normal random forest which is able to predict this error performed much weaker than the proposed model..