电子商务中交易数据库的二次聚类算法

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:luoch668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务运行过程中,每天的业务都会产生大量数据,这些信息被Web服务器自动收集并经过处理转换为交易数据库,从交易数据库中可以通过不同的数据挖掘方法发现知识,聚类分析就是其中之一.现有的聚类算法大多用于数值型数据,很少涉及交易数据的聚类.由于交易数据库通常包含数百甚至数千的数据项,将交易数据库转换为高维数据库,会导致问题,使得大多数聚类算法不能适用. 本文研究大规模交易数据库中的聚类问题,提出了一种二次聚类算法一CATD,对交易进行聚类,从中发现相似的购买模式。本文第2节详细地描述了二次聚类算法CATD的过程,然后给出了算法的复杂性分析,最后总结全文。
其他文献
本文将一种基于DCT的图像水印方案经过一些改进应用于MPEG视频中的某些帧,从而实现了一种MPEG数字水印系统。实验结果表明嵌入的数字水印能够被检测出来,而且能抗噪声的攻击,显示了水印具有较好的各棒性。
本文首先介绍了一种机群下的并行排序算法,并对该算法的复杂性进行了分析,然后叙述了如何使用COIRBA技术来实现该算法,最后通过实验数据说明了算法的优越性.
本文在介绍两种传统的保持全局可申行化化算法即事务站点图TSG(Transaction-Site Graph)和逻辑时标Ticket算法的基础上,提出了一种基于TSG的多时标并发控制策略,该策略克服了上述两种传统方法的一些缺点,在保证全局可申行化的条件下,改善了全局事务和局部事务的并发程度。
数据挖掘技术是从大量的数据集中提取隐含的、未知的又具有潜在应用价值的信息或模式,可用于对Web内容、结构和用户浏览模式进行挖掘.通过对用户浏览模式的挖掘,可以针对不同用户的爱好和习惯动态产生不同的个性化网页,在高度相关的网页之间建立高效链接,将重要的信息放置于频繁访问的网页上,为改进网站信息分布和网络流量提供策略,并有效预防网络黑客和诈骗活动.本文对此进行详细介绍。
多维数据集的可视化的主要困难是难以用传统的图形方法表达多维空间。本文从人工神经网络的自组织映射算法出发,介绍了基于SOM的可视化及聚簇方法,并得到以下结论:(1) SOM作为一种矢量量化方法,用它可把原始采样值量化为SOM原型矢量集,从而可有效地压缩数据。(2) SOM实际上是原始采样值的一个拓扑相似映射,它为原始数据集的可视化提供了新的思路和算法.(3)SOM矢量网格图形在实现可视化的同时,也同
许多XML查询语言,如Xquery、Xpath、Quilt、XML-QL、XML-GL等都使用了路径表达式来表示查询要求,对数据库中的数值和文档的结构进行查询.针对路径表达式查询的特点,本文设计了实例树和路径模式树两种数据结构,直接利用路径表达式转化成的自动机作为查询引擎,用自动机的状态匹配模式树的结点,根据自动机的终止状态对应的模式树结点得到查询结果,并设计了谓词的处理方法。
Peer-to-Peer(P2P)技术也被称为Peer计算,是当前最有潜力的网络技术之一.这种技术去除了集中式服务器,使节点之间可以直接交换资源和服务.同时,任何一个节点可以自由地加入和离开P2P系统.这种设计的分布式特性为正在发展的一些重要应用提供了更好的环境.然而,大多数P2P系统都存在如下几方面局限性:第一,它们缺少对基于不同内容粒度查询的支持;第二,它们缺少可扩充性和灵活性;第三,Peer
因特网及其应用技术的迅猛发展,产生了海量的Web信息.人们普遍感到虽然可以得到海量的数据,但是却很难得到有用的信息和知识.网页自动分类是一种行之有效的解决方法,如果能够将网页分类,然后按内容进行提取、封装,然后人们在自己喜欢的类别中寻找信息,这样就可以大大节约查找的时间.COMMIX(Web环境下的信息集成、分析处理和服务系统)是“面向内容的海量信息集成、分析处理与服务”课题的原型系统。在COMM
随着万维网的日益普及与强大,在网络上搜寻所需的信息变得越来越重要了.诸如AltaVista,Hotbot之类的搜索引擎应运而生.典型的搜索引擎是基于文本匹配的,针对用户的查询会返回多个结果,但要从这许多结果中提取出高质量的页面,还需大量的工作.这种发现高质量页面的过程称为主题提取(topicdistillation).本文中借助基于相似度的模型,我们对ITED系统的特征进行了措述:它完全凭借对链接
,有关视频内容方面的研究已逐渐成为了数据库研究领域的一个热点,这些研究主要是指基于内容的信息检索.随着视频数据量的不断增加,未来的数字图书馆,视频电播和远程教育等系统中将存在越来越多的视频数据.本文旨在探索一种基于运动轨迹的视频检索新方法.