Título
Loan review mechanism of online credit loan products: The case of "Tax E Financing" of Jiangsu Bank
Autor
Yue Zhenhua
Resumo
pt
Esta tese tem como objeto de análise o produto “Tax E Financing” do Jiangsu Bank, tentando melhorar o seu mecanismo de revisão de empréstimos. Através de uma análise estatística e algoritmos de aprendizado de máquina, é construído um sistema de índice de avaliação de risco de crédito e escolhido o melhor método de avaliação de risco de crédito. As principais conclusões são as seguintes.
Em primeiro lugar, esta tese constata que existem diferenças óbvias nas características entre as empresas inadimplentes e as empresas não inadimplentes, e algumas das características das empresas inadimplentes são melhores do que as das empresas não inadimplentes, indicando que elas têm uma alta probabilidade de serem rejeitadas por engano.
Em segundo lugar, verifica-se que “características fiscais” e “características básicas + características fiscais” têm o melhor desempenho de classificação; “características financeiras” têm o pior desempenho de classificação. O algoritmo de floresta aleatória é usado para otimizar os conjuntos de recursos de “características básicas” e “recursos básicos + recursos de tributação”, e verifica-se que após eliminar os recursos sem importância, a capacidade de classificação do conjunto de recursos pode ser efetivamente melhorada.
Terceiro, com base no “recurso fiscal” e no “recurso básico + recurso fiscal” otimizados, este trabalho utiliza vários algoritmos de aprendizado supervisionado e aprendizado semi- supervisionado para treinar e testar o classificador. O estudo constatou que o classificador treinado pela floresta aleatória apresenta o melhor desempenho, com índice de acerto de 98,89%, com a premissa de não julgar nenhuma empresa inadimplente, consegue identificar 89,47% das empresas inadimplentes.
en
This thesis takes Jiangsu Bank’s “Tax E Financing” product as the analysis object, trying to improve its loan review mechanism. The basic features, financial features and tax features of defaulting enterprises, non-defaulting enterprises and non-passing enterprises are collected and calculated. Through statistical analysis and machine learning algorithms, a credit risk evaluation index system is constructed and the best credit risk assessment method is chosen. The main conclusions are as follows.
First, this thesis finds that there are obvious differences in characteristics between defaulting enterprises and non-defaulting enterprises, and some of the characteristics of non-passing enterprises are better than those of non-defaulting enterprises, indicating that they have a high probability of being rejected by mistake.
Second, it is found that “tax features” and “basic features + tax features” have the best classification performance; “financial features” have the worst classification performance. random forest algorithm is used to optimize the feature sets of “basic features” and “basic features + taxation features”, and it is found that after eliminating the unimportant features, the classification ability of feature set can be effectively improved.
Third, based on the optimized “tax feature” and “basic feature + tax feature”, this thesis uses various algorithms of supervised learning and semi-supervised learning to train and test the classifier. The study found that the classifier trained by the random forest algorithm has the best performance, with an accuracy rate of 98.89%. On the premise of not judging any non-defaulting company, it can identify 89.47% of the defaulting companies.