自学习算法在信贷违约率预测中的应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:LXX_ACCP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信贷业务是金融机构中的一种简单而普及的业务,随着互联网金融的快速发展,如何评估从而有效地降低这类风险变得越来越重要。在实际业务场景中,有些信贷预测问题存在的有标签数据较少,直接进行监督学习的预测效果较差。本文将自学习算法应用在该问题中,尝试借助大量无标签数据的信息来提高在少量有标签数据上的预测效果。自学习算法不要求有标签数据和无标签数据服从相同的分布,本文分别尝试了同分布和不同分布的情形。本文以两组数据为例进行实验,数据均来自于DC竞赛。一组是某银行机构提供的信贷违约数据,有标签数据和无标签数据服从同分布,另一组是厦门国际银行提供的实际业务场景中的信贷数据,有标签数据和无标签数据服从不同分布。本文使用的是自学习算法,将自学习算法直接应用到信贷结构化数据中,模型的预测效果不如基模型(监督学习)的预测效果好。为了提高模型的预测性能,尝试对自学习算法进行改进,初次改进后的模型分别基于有标签数据稀疏自编码、有标签数据和无标签数据一起稀疏自编码。固定无标签数据量时,不断调整有标签数据量,初次改进后模型的预测效果随着有标签数据量的变化而变化,且预测效果不太理想。之后,对模型进一步改进,将有标签数据编码得到的数据作为衍生数据,将衍生数据和原数据放在一起进行建模。在有标签数据量较少时,进一步改进后模型的预测性能要优于基模型的预测性能。
其他文献
随着我国经济的飞速发展,股票市场渐渐发展壮大起来,各项相关法律制度的颁布,使得股票市场不断完善、强大并走向国际化,经济发展的状态预示着我国股票市场未来发展具有无穷的潜力。越来越多的居民个人开始投身股市之中,想要冒更大的风险,取得较高的收益。随着投资者素质的提升也使得投资者对股票的投资价值分析愈加重视,投资者不再像之前一样,喜欢盲目跟风,轻易做出投资决定,而是要全面了解公司并做出价值判断之后再做出投
每一家上市公司的日常经营活动中都会财务风险,但如果忽视财务风险任其发展,最后很有可能导致企业出现财务危机。企业一旦遭遇财务危机,就会影响企业的正常运作,严重者甚至沦落到破产清算的境地。财务风险是每家上市企业都无法避免的,但是财务危机却是可以防范的。企业不仅要学会赚钱,还要学会管钱。善于理财的上市公司之路才会走得更加平稳,更加长远,防范财务危机是财务管理的重要课题之一。本篇文章选取重庆力帆集团为案例
制造业在我国实体经济的发展中有着不可或缺且至关重要的作用,而制造企业的科技创新则关系到制造业发展的速度和质量。近几年来,为了支持制造企业的科研活动,我国政府出台了一系列的税收激励政策,这在一定程度上提高了制造企业科技创新的积极性,使得我国的科研总量已经跻身世界第二。虽然如此,但我们也应知道我国拥有自主研发能力和掌握核心技术的制造企业仍然较少。本文对我国现行的税收激励政策进行了梳理,发现我国现有的促
本报告基于美国能源部扶持编写的一份科研综述的英译汉翻译实践报告完成,该综述虽然发表于2013年,但在中国氢能源开发领域仍然是超前的科技文献。受北京中电丰业技术开发有限公司委托,作者得此机会对该文本进行英译汉翻译。根据科技文本严谨客观正式的文体特点以及翻译目的,本报告以目的论三原则为指导理论对译文进行详细分析。本实践报告共分为五个部分,第一部分为任务概述,主要介绍翻译任务的背景信息、原文本的风格特点
近几年,国内债券市场迅猛发展,规模近百万亿,已然成为全球第二大债券市场,市场地位日渐提高。然而伴随着债市繁荣,债市信用风险却逐渐同步显露。2018年-2019年,超过300只债券发生实质性违约。然而,与在信用债信用风险逐步暴露形成鲜明对比的是信用债主体信用评级依旧居高不下。近三年内,超过90%的违约债券均为“AA”级以上的高评级债券,评级通胀情况严重。信用评级失真不仅会误导债券投资者的投资行为,还
近年来,随着供给侧改革的深入推进,中国经济社会的发展目标已由追求高速增长转变为追求高质量发展,由此引发科研创新的战略地位显著提升。科研创新是第一生产力,更是建设现代化经济体系的战略支撑。科技金融的发展对于企业科研创新能力的提升至关重要。然而,科技金融是一个复杂的创新体系,相关投入与产出之间的转化效率又受诸多因素的影响;随着有关科技金融研究的日益深入,如何提升科技金融效率,提高投入向科技产出的转化率
投资者情绪是指投资者对未来市场心理预期存在的系统性偏差,容易引发非理性投资行为。若投资者不良情绪在群体中蔓延,会对市场造成严重影响。准确测度投资者情绪并研究其影响机理,对规范引导股市发展有着重要现实意义,得到学界业界的关注和研究,但诸如问卷调查法等传统测度方法费时费力且误差较大。随着社交网络的发展,个体投资者习惯在网络上查看并交流股市信息,使得网络成为投资者情绪的资源库。因此,本文利用网络文本数据
推进县域义务教育学校教师流动,是实现县域义务教育均衡发展的关键工作。论文在文献综述的基础上,进行了县域义务教育学校教师流动现状调研,并从环境、学校、教师三个方面,对县域义务教育学校教师流动问题综合因素分析,探索县域义务教育学校教师流动问题的形成根源,在深入分析县域义务教育学校教师流动因素构成特点的基础上,探索建立调控县域义务教育学校教师流动策略,并在D县Z镇进行教师流动政策实践,在实践中检验和完善
绘本作为一种主要面向学龄前儿童的重要阅读文本,已渐渐成为促进小学低年级课内外相结合的阅读资源。绘本阅读不仅能促进语文阅读教学目标的达成,还能促进学生多元智能的培养,提高学生的语文核心素养。本论文紧紧围绕绘本亲子阅读对小学低年级语文核心素养的培养的影响这一核心问题展开,以长沙市的5所小学的低年级小学生家庭、教师以及笔者自家的绘本亲子阅读情况为研究对象,通过对小学低年级学生、家长、教师三方展开问卷调查
由于社交网站的迅速发展,空间自回归(SAR)模型在社交网络研究中发挥了重要作用,但是空间自回归模型的底层结构隐性地假设了网络中所有节点(组织或用户)都具有相同的影响力,且是以共同的自相关系数来衡量的,所以传统的空间自回归模型不能辨别出影响力大的节点。本文选取2018年下半年积极管理的开放式共同基金的季度数据作为实证样本,以空间自回归模型为基础,引入网络影响力指数,构建了网络影响模型,使用该模型,利