论文部分内容阅读
数据库中知识发现(Knowledge Discovery in Databases,简称KDD)是近年来人工智能、数据库应用等领域的研究热点。目前,KDD的研究涵盖了多个领域的多种知识发现方法,已经能够发现时间序列规则、关联规则、分类规则、聚类规则等多种知识类型。此外,联机分析处理(On-Line Analytical Processing,简称OLAP)和数据仓库(Data Warehouse,简称DW)研究技术的发展使得DW与KDD的结合也成为一个新的研究方向。随着互联网技术的成熟和迅猛发展,基于WEB的KDD也是最新的热门研究领域。 本文的研究内容着重于KDD在金融反洗钱中的应用这一课题。 目前银行已积累了大量的客户交易数据,但对于数据的使用主要仍是结构化查询和统计。对于KDD在金融中的应用,也只针对客户关系管理、分析和预测金融市场等有限的几个范围。而另一方面,洗钱活动日益猖獗,严重威胁全球经济发展和国家安全,这一问题已经愈发显得突出和急需解决,但反洗钱技术手段仍显落后,对金融犯罪的打击还处于人为干预阶段,仍未见有成熟的KDD技术应用于其中。 本文目的是研究KDD在反洗钱领域中的应用,探索一个适用于反洗钱的数学模型,设计能够发现具有洗钱可疑性的账户属性和交易模式的KDD方法,促进反洗钱自动化的研究与发展。 本文对于KDD应用于金融反洗钱做出了一些研究成果,其新见解和创新性具体有以下几点。 首先,提出一个应用系统框架,在结构上,它能够完成KDD的一般任务,在内容上,能够综合金融领域知识,有监督地发掘洗钱活动的各种模式,找出洗钱活动的规律和特点,得出相关知识,帮助人们自动识别出手段不同的洗钱行为。 其次,针对金融领域中挖掘洗钱模式的特殊性,论述了如何将金融领域知识应用于数据预处理中以提高数据挖掘的效率和准确性,并结合统计学理论提出了一套针对金融领域中反洗钱的数据预处理方法。 再次,提出了一种改进的基于网格和密度的蚁群算法,该算法能够把大多数符合正常交易特点的账户聚集到若干个聚类中心,而远离这些聚类中心的账户则是交易特征显然不符合常规模式的账户,这正是我们真正关心、值得做进一步确认分析的数据。