论文部分内容阅读
随着互联网的高速发展,电子商务成为一种很重要的商务模式。然而,在它给企业带来重大商机的同时也带来了更大的风险与损失。由于网络的虚拟性、隐蔽性等特点,电子商务中欺诈交易行为日益泛滥,严重制约了电子商务的发展。因此,为使电子商务能健康发展,有效地识别网络欺诈就显得尤为重要。本文针对电子商务中普遍存在的欺诈的问题进行研究,提出依据数据挖掘的技术,构建电子商务中欺诈识别模型。本文首先简单介绍了电子商务中的欺诈现象,并结合欺诈识别技术的研究成果,提出运用数据挖掘中的分类算法解决电子商务中的欺诈识别问题。其次,对数据挖掘中的分类问题进行了重点研究,着重介绍了支持向量机和决策树算法。然后,针对样本分布非均衡的问题,单一分类器效能低下的问题,以及错误分类的代价问题,我们提出采用k-means聚类算法解决样本分布非均衡问题;再分别选择支持向量机和决策树作为基分类器,结合Adacost算法对训练子集构建分类器;最后使用投票法组合多个分类结果得到组合分类器,并采用覆盖率、准确率和F-度量这些指标对模型进行评价。本文使用某电子商务企业的历史交易数据为样本资料,并在Weka平台对模型进行具体的实证研究。实验过程中依次构建样本未分割的单分类器、样本分割后的单分类器以及样本分割后的组合分类器,分析各个模型的分类结果,来验证采用k-means聚类技术处理样本分布非均衡问题以及采用Adacost算法和组合分类器提升分类结果的正确策略,从而验证研究模型的有效性。