Prediksjon av mislighold på folkefinansierte lån med maskinlæring
Description
Full text not available
Abstract
I denne oppgaven har vi brukt data fra person til person låneplattformen Bondora og deretterlagd maskinlæringsmodeller med den hensikt å predikere mislighold og finne viktigevariabler for prediksjon av mislighold. Vi har brukt logistisk regresjon som en benchmark ogsammenlignet med modeller laget med Random Forest, Extreme Gradient Boosting, SupportVector Machines og nevrale nettverk. Vi evaluerer modellene med forskjellige «performancemeasures» og sammenligner med tidligere forsking. Vår beste modell blir Extreme GradientBoosting som får en nøyaktighet på 70,1% og modellen vektlegger Bondora sin egenlånerating som den viktigste variabelen. In this thesis we have used data from peer-to-peer loan platform Bondora and then createdmachine learning models with the intention of predicting default and finding importantvariables for predicting default. We have used logistic regression as a benchmark andcompared with models made with Random Forest, Extreme Gradient Boosting, SupportVector Machines and neural networks. We evaluate the models with different performancemeasurements and compare with previous research. Our best model is Extreme GradientBoosting which gets an accuracy of 70% and emphasis Bondora's own borrower rating as themost important variable.