论文部分内容阅读
随着跨境金融和互联网金融的普及和发展,洗钱手段更加复杂,技术上更加先进。目前,越来越多的洗钱犯罪分子将目光从传统的金融场景转向比特币,因为其具有非主权性、去中介化、匿名性和便捷性等便于洗钱的特点。由于比特币的整个交易网络数据是公开的,这不同于传统金融场景数据的保密性,更需要探索一系列大数据反洗钱方案。本文基于Elliptic公司公开的比特币交易数据集,探究反洗钱监测模型。基于交易实体的多维特征,交易实体间的交易流,以及部分交易实体被标记为合法或非法的数据构建分类模型,对于未标记交易实体进行分类。仅基于交易实体的多维特征数据构建有监督的分类模型,包括逻辑回归模型,随机森林模型和多层感知机模型。基于交易实体的多维特征和交易实体间的交易流数据,构建半监督分类模型——图卷积神经网络。选择谱图卷积的一阶近似作为图卷积层结构,构建两层图卷积神经网络模型。在已有的图卷积神经网络的输出层嵌入交易实体特征矩阵,得到改进模型。本文将每种方法训练所得模型应用于测试集数据,利用非法类的F1分数(分类精确率和召回率的调和平均数)评估模型效果。结果显示随机森林模型效果最好,甚至优于基于网络结构数据建模的图卷积神经网络模型,体现了树集成模型在本文数据集中应用的优越性。图卷积神经网络模型优于多层感知机模型和逻辑回归模型,体现了将交易实体间的交易流数据纳入建模对于分类效果的改善。本文为反洗钱监测提供了一个利用交易实体网络结构数据,构建图卷积神经网络的建模思路。