关键词:
信用风险
中小企业
机器学习
摘要:
中小企业作为我国国民经济发展的重要力量,不仅缓解了城镇就业压力、拉动了周边经济增长,同时也是科技创新的主力军。然而中小企业因自身规模小、融资渠道单一、变现能力弱等原因,即使受到多条政策的扶持,依然面临较大的融资缺口。融资难问题出现的主要原因是由于信息不对称导致难以准确评估信用风险的大小,又加之传统信用风险度量方法的效率低成本高、受评估人员专业水平影响大,为尽量减少可能发生的损失,金融机构在向中小企业发放信贷时愈发谨慎,致使中小企业发展受限。因此,为有效缓解中小企业的融资问题,本文针对中小企业特点构建基于机器学习的信用风险模型,实现对信用风险更高效可靠的自动化评估。本文从研究背景与意义出发,对现有的文献进行梳理后,首先对中小企业和信用风险做出了概念上的界定,接着进一步分析了中小企业信用风险的现状、成因及特征,并同大型企业的信用风险情况进行比较。其次,在介绍并对比了传统与现代信用风险度量方法的优劣势后,引入了灵活性更强、自动化程度更高的机器学习算法,作为本文信用风险模型构建的理论基础。最终选择了逻辑回归、决策树两种单一学习器算法和XGBoost、随机森林两种集成学习算法来拟合本文的模型;基于以往的研究结论和常用做法,选取了2010年至2020年中小企业板上市公司的100条ST或*ST数据作为高信用风险组样本,同时在平衡了年份、所处行业和总资产规模后按1:1的比例选取了100条非ST数据作为低信用风险组样本,并在训练时按照1:3的比例随机对总样本进行训练组和测试组的划分;依据AIC最小原则从46个公司财务指标中选取13个作为基础模型训练阶段的特征向量,在此基础上增加5个非财务指标作为综合模型训练阶段的特征向量,并将AUC值和AP值作为评估指标,进行模型性能的横向和纵向对比。再有,将智博传媒公司作为案例,以其近三年的真实经营数据应用到本文的信用风险模型当中,同时按照传统专家制度法对其进行信用风险分析,对比两者在结论上的一致性和方法上的优劣性。最后,本文根据研究结果就信用风险的度量和控制问题,分别向中小企业和金融机构提出建议。经过本文研究发现,集成学习器比单一学习器在AUC值和AP值上分别最高提升了14.90%和10.90%,说明了集成多个单一学习器进行评估的效果更佳;综合阶段的模型比基础阶段模型在AUC值和AP值上分别最高提升了6.90%和8.10%,结果表明在模型中引入非财务数据可以有效提升其性能。最终,四种算法在测试集上都有较好的评估效果,其中综合阶段的集成学习模型性能更强,XGBoost模型的AUC值和AP值分别可以达到0.925和0.796,随机森林模型的AUC值和AP值分别可以达到0.928和0.814。此外,为验证本文模型对非上市企业的适用性,将其应用在了智博传媒公司的具体案例中,综合模型结果得出了其近三年低信用风险的结论,这与传统信用风险方法分析的结果一致,进一步证明了本文所构建的中小企业信用风险模型是切实可行的,且具有现实使用意义。同时,基于机器学习的信用风险模型法比传统风险度量法在使用时,具有效率更高、自动化程度更高的特点,通过与企业内部系统对接等方式,可以通过内部数据快速掌握企业的信用风险,但当情况较为复杂模型法难以给出确切的结论时,辅以传统风险度量法加以分析,将会使得评估结果更加真实可靠,也可实现两种方法的优势互补。