电子商务中数据挖掘技术的研究与应用

被引量 : 0次 | 上传用户:youngw258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络、通信和信息技术的突破性进展,电子商务作为一种新颖的商务模式受到人们广泛关注。电子商务给人们带来了价廉物美的商品和快速便捷的网上交易,同时,由于电子商务本身存在着安全问题以及移动网络环境的开放性给电子商务活动带来的潜在安全问题,也给人们带来了隐私可能被泄露的问题。很多大型电子商务网站为了系统的安全和稳定,一些大型的数据库以分布式形式存放在不同的站点上,这在一定程度也增加了隐私保护的难度。分布式环境中基于隐私保护的数据挖掘技术是近年来数据挖掘领域中的研究热点之一,如何在保证高质量数据挖掘结果的同时达到隐私保护的目的是本文所要研究的重点。基于以上问题,在前人研究的基础上,本文首先分析了电子商务快速发展的形势下分布式数据挖掘引发的隐私问题,如何在不泄露个人隐私的前提下建立一个较为精确地模型来完成数据挖掘的任务,是数据挖掘隐私保护算法主要讨论的问题。本文分析了前人提出的一些经典关联规则算法,比如被修改用于实现数据挖掘中的隐私保护的Apriori算法、MWFI算法等,和一些广泛用于挖掘前的原始数据变换的重构原始数据分布和离散化属性数据的方法。另外本文也分析了安全多方计算理论在隐私保护数据挖掘中的应用。在对已有研究成果分析的基础上,本文研究了用户访问Web网站可能带来Web日志泄露个人隐私的问题,用户访问电子商务网站的Web页面,所访问网站的Web服务器日志自动记录了用户的访问足迹,访问足迹成为泄露隐私的重要途径。针对这类问题,本文首先研究了将电子商务网站Web服务器记录的日志信息转换成二维表,采用随机化回答方式生成干扰数据,然后提供给数据使用者进行频繁项集以及强关联规则的挖掘算法,从而得到实现隐私保护的网上购物篮商品间的关联规则。针对Web日志中包含的隐私信息,本文研究了采用填充信息对原始数据进行干扰的方法,结合列置换的伪随机化回答方式先对原始日志信息进行变换,在此基础上研究了基于位运算的频繁项集生成算法,实现对原始数据及挖掘结果均进行隐私保护的关联规则挖掘。最后,本文分析和评价了已做的研究工作,并提出了日后改进的方向。
其他文献
法国原有的科技体制与中国的比较接近,研究法国的科技体制改革和发展,对于改革和完善我国的科技体制具有重要的参考价值和借鉴意义。本文从科技管理体系、科研体系、技术转移
与传统大学生学习研究大多采取实体性思维方式不同,布迪厄的社会实践理论为我们提供了一个独特的基于关系性思维方式的观察视角。运用“场域”、“资本”、“惯习”和“策略
目的探讨妊娠肝内胆汁淤积症孕妇血清总胆汁酸浓度与胎儿窘迫的关系。方法选择2013年6月~2014年6月在我院分娩的妊娠期内胆汁淤积症孕妇84例作为研究组,再选择同期分娩的正常
预算管理作为一种企业经营管理手段,对企业的发展壮大起到了重要的作用,企业要充分做好企业财务经济预算工作,这也直接影响企业整体经济运行工作,制定正确的企业战略目标,从
创新是我国现阶段发展战略的核心,也是区域寻求发展的第一要务。通过选取有效专利存量、专利存活率、有效发明专利比例、企业有效发明专利比例和职务有效发明比例5个有效专利
目的探究急性阑尾炎患者应采用的护理措施和效果。方法选取2013年3月~2014年8月收治的33例急性阑尾炎患者进行护理,随机分组,对照组12例患者采用常规护理,实验组21例患者采取
采用水热合成方法制备出不同粒径大小的巯基乙胺(CA)修饰的CdTe(CA-CdTe)量子点,并研究CA-CdTe量子点对Co2+的荧光响应情况。研究表明Co2+对CA-CdTe量子点的荧光具有猝灭作用,并
天然产物的抑菌作用是天然产物研究中的热点方向。本文选取中国种植较多的艾叶和紫苏,提取主要抑菌成分,经分析鉴定主要是黄酮类物质,通过最低抑(杀)菌浓度,抑菌圈和生长曲线
近些年第三方的电子商务平台在中国市场蓬勃发展,在短短十几年间,快速发展壮大,深刻影响到消费者的日常生活,成为消费者不可或缺的生活方式之一,第三方电子商务平台蓬勃发展
创意产业作为中国社会从劳动密集型社会向知识密集型社会转化过程中的新生事物正活跃在上海、深圳等中国最先进、最发达的大城市的经济体系中,成为其多元的城市产业结构不可