面向P2P网络借贷机构欺诈风险的机器学习可解释性研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融领域P2P借贷的迅速发展,大量借贷公司的非结构化数据不断涌现出来,随之曝光的还有跑路、停业等风险,亟需利用可解释的人工智能技术对借贷风险进行有效的评估。本文通过机器学习方法对P2P网络借贷机构中的非结构化自然语言文本信息进行建模和分析,从机器学习可解释性的角度对P2P公司的欺诈风险进行评估,从而增强AI模型的可信程度。本文首先设计实现了一种基于数据驱动的P2P公司欺诈风险评估方法。其中使用了多种自然语言处理、机器学习、深度学习等主流的算法模型,并且使用元学习级联归纳的方法将前面的各种最佳模型融合起来,进一步提升了 P2P公司风险评估的准确率。然后,针对词性分布等看得见的细节性显式特征,本文提出基于社会科学领域中心理学人际诈骗理论来解释模型行为,同时使用自然科学领域中的计算语言学技术和影响函数验证了机器学习模型确实学习到了诈骗理论中的词性细节信息,由此为P2P欺诈风险的机器学习模型提供了心理学的可解释性的支持。最后,针对段向量等看不见的隐式特征,本文提出了从文本风格的角度来描述P2P公司文本的整体差异并理解模型行为,实验表明使用影响函数和风格向量来描述文本风格差异与人类的直观感受是相同的。由此证明了机器学习模型确实学习到了文本风格差异并将其用于风险判断,进一步体现了该模型具备一定的机器学习可解释性。
其他文献
教育是个体人力资本积累的源泉,具有较强的促进代际流动的功能;相对于教育,医疗卫生与个体健康联系紧密,健康对农村减贫、调节收入差距的效果尤为突出,如中国的新医改使得最穷收入组成为最主要的受益者;社会保障对于调节收入分配差距的作用效果明显,政府通过社会保障体系将社会保障资金提供给低收入人群,可以弥补初次收入分配不公,实现对城乡收入差距的调节。理论上,财政支出尤其是用于民生领域的财政支出具有较强的收入分
当前企业并购的规模与数量成倍数增长,但并购成功的比例并不高,并购失败的案例比比皆是。究其原因,主要是并购后整合未达预期,虽然并购整合涉及到企业各要素的整合,但企业并购后整合关键环节是财务整合,财务整合贯穿整个并购实施项目的始终,并购后财务整合的成败影响着并购目标的实现。本文主旨是以CY公司为并购案例研究并购后财务整合,研究并购后财务整合的流程与程序,找出并购后财务整合中的制约因素,提出并购后财务整
翻译目的论诞生于20世纪70年代,是德国功能主义翻译学派的核心理论,其核心概念是:翻译过程的最主要因素是整体翻译行为的目的。目的论强调应该把“目的”这一概念纳入翻译活动实践中,凡行动皆有目的,而翻译恰好是一种跨文化的交际活动,这就需要译者在翻译时根据翻译的目的来选择适当的翻译方法。这一理论的提出,打破了传统翻译理论中“等值”“对等”的概念,将译者从原文的束缚中解放出来,开拓了新的翻译视角。本篇翻译
在翻译硕士研究生期间,本人翻译了日本成蹊大学教授西兼志的著作《偶像/媒体论讲义》,本实践报告主要基于此翻译实践的第五章、第七章,旨在总结本人的翻译实践心得。《偶像/媒体论讲义》从媒体论的观点出发,分析了已经成为一种文化现象的“偶像”文化。在数十年的发展过程中,偶像有一个贯穿始终的特征,那就是用积极的、面向未来的姿态面对新的环境。该著作运用讲义的形式,包含丰富的日本文化及时代元素,在体现文化艺术性、
随着可移动化电源的研究发展,微型直接甲醇燃料电池(Micro Direct Methanol Fuel Cell,μDMFC)因其能量密度高、工作温度低、燃料来源广泛、清洁环保和适合移动应用等优点逐渐被人们关注。然而目前μDMFC的性能较低,且催化剂成本高。研究发现,不同的催化剂制备方法、不同的催化剂载体以及电极中催化剂和扩散层不同的成分组成都会对电极性能产生很大的性影响。石墨烯是近年来发现的新型
中国是世界上最大的煤炭生产国,煤炭是我国能源消耗的主体,但煤矿安全事故严重制约了煤炭工业安全可持续发展。在煤矿较大以上事故中,煤与瓦斯突出事故占比最大,伤亡人数也最多。防治煤与瓦斯突出事故及其灾害扩大,对煤矿安全生产有重要意义。发生煤与瓦斯突出时,短时间内会释放出巨大能量,大量煤与瓦斯从煤体喷出,沿巷道运动并沿途冲击防突风门等设施。防突风门在冲击载荷的作用下发生弹塑性变形,而调节风窗、风筒等是防突
肯定性行动是指自美国20世纪60年代起为弥补与纠正法律歧视后果而对特定族群进行优待的一系列措施,该类措施与美国宪法第14修正案的平等保护原则之间存在冲突,法院在审查过程
有毒重气泄漏事故危害严重,容易导致大范围内的中毒伤亡及环境污染,具有强烈的破坏性和潜在的风险,然而现阶段对有毒重气泄漏事故应急救援资源的调度研究都无法满足应急救援管理的需要。因此,本文对有毒重气泄漏事故的应急救援资源动态调度问题进行研究。本文首先对有毒重气泄漏事故应急救援路径选择问题进行研究,构建最优路径选择模型,并利用改进的Dijkstra算法求解最佳路径及其通行时间;然后以平原、郊区(非城市)
近年来,随着航运市场的竞争愈演愈烈,集装箱船船体主尺度增大是一种主流趋势,同时也带来很多问题。伴随船体固有频率降低和船体外飘等结构特点,弹振和颤振发生的更为频繁,弹振与颤振响应对船体结构疲劳损伤的贡献度较大。本文通过数值计算的方法对一艘20000-TEU集装箱船的载荷响应进行分析,得到弹振和颤振发生时的载荷响应特性。根据载荷响应与应力响应的线性关系,对目标船采用不同方法进行疲劳强度计算并对比分析,
酶联免疫吸附测定法(enzyme-linked immunosorbent assay,ELISA)是利用抗原抗体特异性结合,并采用特殊的标记物对目标蛋白质分子等进行定性或定量分析的最常用方法之一。该方法往往需要抗原或抗体与某种天然酶(例如,辣根过氧化物酶,HRP)连接作为报告基团进行信号放大。然而,天然酶的使用往往存在成本高、制备存储困难、以及易受外界环境变性等不足。无机纳米酶作为一类具有催化功