Publication:
Feature generation for SME behavioral credit scoring model using graph embeddings

dc.contributor.advisorGönen, Mehmet
dc.contributor.departmentGraduate School of Sciences and Engineering
dc.contributor.kuauthorKaşıkçı, Kerem
dc.contributor.programComputer Sciences and Engineering
dc.contributor.refereeAkgün, Barış||Güler, Mehmet Güray
dc.contributor.schoolcollegeinstituteGRADUATE SCHOOL OF SCIENCES AND ENGINEERING
dc.coverage.spatialİstanbul
dc.date.accessioned2025-06-30T04:36:11Z
dc.date.available2025-03-25
dc.date.issued2024
dc.description.abstractBanks lend credit regarding customers' credit scores from in-house credit risk models. Corporate customers hold greater risk and are evaluated with already high-performing models. In this thesis, corporate customers' financial interactions (money transfers) with each other are used to develop an additional feature set to improve the behavioral credit risk scoring model of small and medium-sized enterprises. Graph representation learning does a good job in terms of extracting the essence of such relationships and projecting them into a multidimensional space. For this purpose, a graph of enterprises is constructed where they are nodes and their sum of money transfer amount over time are edges. An inductive graph representation learning algorithm, GraphSAGE, is employed. Therefore, the graph is created with directed and weighted edges and reduced to a strongly connected graph. Then, the algorithm is run in various settings to achieve the best performance. A credit scoring pipeline using different machine learning algorithms is added to improve the current model with these new embedding features. QNB Finansbank's real banking data for 2022 is used to perform this study. After looking at the results of the computational experiments, the most important contribution came from the concatenation of multiple embeddings generated with different aggregator functions. Starting from here, a potential economic savings is calculated. Additionally, it is seen that the new architecture improves the credit scoring of nodes with either low transfer amount or number of edges the most.
dc.description.abstractBankalar, müşterilerinin şirket içi kredi riski modellerinden gelen kredi puanlarına göre kredi verirler. Tüzel müşteriler daha fazla risk taşır ve zaten yüksek performans gösteren modellerle değerlendirilirler. Bu tezde, tüzel müşterilerin birbirleriyle olan finansal etkileşimleri (para transferleri), küçük ve orta ölçekli işletmelerin davranışsal kredi riski puanı modelini iyileştirmek için ek bir öznitelik seti geliştirmek için kullanılmıştır. Çizge temsili öğrenimi, bu tür ilişkilerin özünü çıkarma ve bunları çok boyutlu bir uzaya yansıtma açısından iyi bir iş çıkarır. Bu amaçla, düğümleri işletmeler ve zaman içindeki para transfer tutarlarının toplamı kenarları olan bir çizge oluşturulmuştur. Tümevarımsal bir çizge temsili öğrenme algoritması olan GraphSAGE kullanılmıştır. Bu nedenle, çizge yönlü ve ağırlıklı kenarlarla oluşturulur ve güçlü bir şekilde bağlı bir çizgeye indirgenmiştir. Daha sonra, algoritma en iyi performansı elde etmek için çeşitli ayarlarda çalıştırılmıştır. Mevcut modeli bu yeni gösterim öznitelikleriye iyileştirmek için farklı yapay öğrenme algoritmaları kullanan bir kredi puanlama akışı eklenmiştir. Bu çalışmayı gerçekleştirmek için QNB Finansbank'ın 2022'ye ait gerçek bankacılık verileri kullanılmıştır. Hesaplamalı deneylerin sonuçlarına bakıldığında, en fazla katkı, farklı toplayıcı işlevleriyle üretilen birden fazla gösterimin birleştirilmesinden gelmiştir. Buradan hareketle bir potansiyel ekonomik tasarruf hesaplanmıştır. Ayrıca yeni mimarinin, düşük transfer miktarına veya kenar sayısına sahip düğümlerin kredi puanlamasını en çok iyileştirdiği görülmektedir.
dc.description.fulltextYes
dc.format.extentxv, 75 leaves : graphics ; 30 cm.
dc.identifier.embargoNo
dc.identifier.endpage90
dc.identifier.filenameinventorynoT_2024_139_GSSE
dc.identifier.urihttps://hdl.handle.net/20.500.14288/29803
dc.identifier.yoktezid905006
dc.identifier.yoktezlinkhttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=LY6e5xGA7WWUpEdrBmEPLtAZEHFAeV9ZkerlnGDnRWPeXlsjEsubO04K64IYbU5U
dc.language.isoeng
dc.publisherKoç University
dc.relation.collectionKU Theses and Dissertations
dc.rightsrestrictedAccess
dc.rights.copyrightsnote© All Rights Reserved. Accessible to Koç University Affiliated Users Only!
dc.subjectSmall business
dc.subjectData protection
dc.subjectDeep learning (Machine learning)
dc.subjectBig data
dc.subjectMachine learning
dc.subjectInternet of things
dc.subjectCustomer relations, Data processing
dc.subjectArtificial intelligence, Data processing
dc.subjectMachine learning
dc.subjectData mining
dc.titleFeature generation for SME behavioral credit scoring model using graph embeddings
dc.title.alternativeÇizge gösterimlerini kullanarak KOBİ müşterilerin kredi modelleri için öznitelik yaratımı
dc.typeThesis
dspace.entity.typePublication
local.contributor.kuauthorKaşıkçı, Kerem
relation.isAdvisorOfThesis848e4b5d-1fb0-4ada-a25a-fabec5de3b81
relation.isAdvisorOfThesis.latestForDiscovery848e4b5d-1fb0-4ada-a25a-fabec5de3b81
relation.isOrgUnitOfPublication3fc31c89-e803-4eb1-af6b-6258bc42c3d8
relation.isOrgUnitOfPublication.latestForDiscovery3fc31c89-e803-4eb1-af6b-6258bc42c3d8
relation.isParentOrgUnitOfPublication434c9663-2b11-4e66-9399-c863e2ebae43
relation.isParentOrgUnitOfPublication.latestForDiscovery434c9663-2b11-4e66-9399-c863e2ebae43

Files

Original bundle

Now showing 1 - 1 of 1
Placeholder
Name:
T_2024_139_GSSE.pdf
Size:
3.48 MB
Format:
Adobe Portable Document Format