Publication: Feature generation for SME behavioral credit scoring model using graph embeddings
dc.contributor.advisor | Gönen, Mehmet | |
dc.contributor.department | Graduate School of Sciences and Engineering | |
dc.contributor.kuauthor | Kaşıkçı, Kerem | |
dc.contributor.program | Computer Sciences and Engineering | |
dc.contributor.referee | Akgün, Barış||Güler, Mehmet Güray | |
dc.contributor.schoolcollegeinstitute | GRADUATE SCHOOL OF SCIENCES AND ENGINEERING | |
dc.coverage.spatial | İstanbul | |
dc.date.accessioned | 2025-06-30T04:36:11Z | |
dc.date.available | 2025-03-25 | |
dc.date.issued | 2024 | |
dc.description.abstract | Banks lend credit regarding customers' credit scores from in-house credit risk models. Corporate customers hold greater risk and are evaluated with already high-performing models. In this thesis, corporate customers' financial interactions (money transfers) with each other are used to develop an additional feature set to improve the behavioral credit risk scoring model of small and medium-sized enterprises. Graph representation learning does a good job in terms of extracting the essence of such relationships and projecting them into a multidimensional space. For this purpose, a graph of enterprises is constructed where they are nodes and their sum of money transfer amount over time are edges. An inductive graph representation learning algorithm, GraphSAGE, is employed. Therefore, the graph is created with directed and weighted edges and reduced to a strongly connected graph. Then, the algorithm is run in various settings to achieve the best performance. A credit scoring pipeline using different machine learning algorithms is added to improve the current model with these new embedding features. QNB Finansbank's real banking data for 2022 is used to perform this study. After looking at the results of the computational experiments, the most important contribution came from the concatenation of multiple embeddings generated with different aggregator functions. Starting from here, a potential economic savings is calculated. Additionally, it is seen that the new architecture improves the credit scoring of nodes with either low transfer amount or number of edges the most. | |
dc.description.abstract | Bankalar, müşterilerinin şirket içi kredi riski modellerinden gelen kredi puanlarına göre kredi verirler. Tüzel müşteriler daha fazla risk taşır ve zaten yüksek performans gösteren modellerle değerlendirilirler. Bu tezde, tüzel müşterilerin birbirleriyle olan finansal etkileşimleri (para transferleri), küçük ve orta ölçekli işletmelerin davranışsal kredi riski puanı modelini iyileştirmek için ek bir öznitelik seti geliştirmek için kullanılmıştır. Çizge temsili öğrenimi, bu tür ilişkilerin özünü çıkarma ve bunları çok boyutlu bir uzaya yansıtma açısından iyi bir iş çıkarır. Bu amaçla, düğümleri işletmeler ve zaman içindeki para transfer tutarlarının toplamı kenarları olan bir çizge oluşturulmuştur. Tümevarımsal bir çizge temsili öğrenme algoritması olan GraphSAGE kullanılmıştır. Bu nedenle, çizge yönlü ve ağırlıklı kenarlarla oluşturulur ve güçlü bir şekilde bağlı bir çizgeye indirgenmiştir. Daha sonra, algoritma en iyi performansı elde etmek için çeşitli ayarlarda çalıştırılmıştır. Mevcut modeli bu yeni gösterim öznitelikleriye iyileştirmek için farklı yapay öğrenme algoritmaları kullanan bir kredi puanlama akışı eklenmiştir. Bu çalışmayı gerçekleştirmek için QNB Finansbank'ın 2022'ye ait gerçek bankacılık verileri kullanılmıştır. Hesaplamalı deneylerin sonuçlarına bakıldığında, en fazla katkı, farklı toplayıcı işlevleriyle üretilen birden fazla gösterimin birleştirilmesinden gelmiştir. Buradan hareketle bir potansiyel ekonomik tasarruf hesaplanmıştır. Ayrıca yeni mimarinin, düşük transfer miktarına veya kenar sayısına sahip düğümlerin kredi puanlamasını en çok iyileştirdiği görülmektedir. | |
dc.description.fulltext | Yes | |
dc.format.extent | xv, 75 leaves : graphics ; 30 cm. | |
dc.identifier.embargo | No | |
dc.identifier.endpage | 90 | |
dc.identifier.filenameinventoryno | T_2024_139_GSSE | |
dc.identifier.uri | https://hdl.handle.net/20.500.14288/29803 | |
dc.identifier.yoktezid | 905006 | |
dc.identifier.yoktezlink | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=LY6e5xGA7WWUpEdrBmEPLtAZEHFAeV9ZkerlnGDnRWPeXlsjEsubO04K64IYbU5U | |
dc.language.iso | eng | |
dc.publisher | Koç University | |
dc.relation.collection | KU Theses and Dissertations | |
dc.rights | restrictedAccess | |
dc.rights.copyrightsnote | © All Rights Reserved. Accessible to Koç University Affiliated Users Only! | |
dc.subject | Small business | |
dc.subject | Data protection | |
dc.subject | Deep learning (Machine learning) | |
dc.subject | Big data | |
dc.subject | Machine learning | |
dc.subject | Internet of things | |
dc.subject | Customer relations, Data processing | |
dc.subject | Artificial intelligence, Data processing | |
dc.subject | Machine learning | |
dc.subject | Data mining | |
dc.title | Feature generation for SME behavioral credit scoring model using graph embeddings | |
dc.title.alternative | Çizge gösterimlerini kullanarak KOBİ müşterilerin kredi modelleri için öznitelik yaratımı | |
dc.type | Thesis | |
dspace.entity.type | Publication | |
local.contributor.kuauthor | Kaşıkçı, Kerem | |
relation.isAdvisorOfThesis | 848e4b5d-1fb0-4ada-a25a-fabec5de3b81 | |
relation.isAdvisorOfThesis.latestForDiscovery | 848e4b5d-1fb0-4ada-a25a-fabec5de3b81 | |
relation.isOrgUnitOfPublication | 3fc31c89-e803-4eb1-af6b-6258bc42c3d8 | |
relation.isOrgUnitOfPublication.latestForDiscovery | 3fc31c89-e803-4eb1-af6b-6258bc42c3d8 | |
relation.isParentOrgUnitOfPublication | 434c9663-2b11-4e66-9399-c863e2ebae43 | |
relation.isParentOrgUnitOfPublication.latestForDiscovery | 434c9663-2b11-4e66-9399-c863e2ebae43 |
Files
Original bundle
1 - 1 of 1