基于PageRank和HITS结合的社区发现页面排序研究

来源 :第21届全国计算机新科技与计算机教育学术大会 | 被引量 : 0次 | 上传用户:wht000a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文参考了相关的文献,设计了一个Web社区发现的程序,该程序利用Google引擎提供的接口从Web上获取数据,并且利用这些数据做了大量的实验。通过对于传统的最大流算法和本文提出的最大流算法的实验结果的比较,证明了本文提出的边容量分配方法的有效性。
其他文献
本文针对大企业数据仓库产品价格昂贵,使客户使用成本过高,而且其源码封闭不利于客户根据自身需求进行二次开发,同时在没有多维数据集构建源码的情况下,当数据仓库系统崩溃时不便于重建等问题,研究了开源的OLAP引擎Mondrian,介绍了Mondrian的系统层次结构和多维数据集定义模型及在处理超大规模数据集时提高性能的聚合策略,并最终建立了一个基于Mondrian的多维数据集。该产品正实际运用于我们的课
持续审计是信息时代审计发展的必然趋势。同时,数据处理是持续审计的关键步骤。本文针对持续审计中的数据处理中遇到的一些问题,分析了业务规则的相关理论及其在数据处理中的重要作用,提出了一种基于业务规则的数据处理方法,并研究了如何采用业务规则来处理数据。最后,以一个实例介绍了该方法的应用。
数据库管理系统的三级模式结构是数据库课程教学的重点和难点之一。本文从数据库系统独立性、关系数据库的结构化查询语言、数据库设计和数据库安全等多个角度剖析三级模式结构,以弥补大多教材难以对该部分内容进行系统化教学的缺陷,帮助学生真正理解三级模式结构并进一步运用于数据库设计,教学效果良好。
在传统T树索引算法的基础上,结合B-树非叶子节点作多路分支目录的思想,提出了用于嵌入式内存数据库的高效的索引算法(PMCT-tree).PMCT-tree比典型的T树增加了一种多路分支目录(PMC),它主要是由T树节点中抽取出的部分边缘阈值构成的.测试结果表明,PMCT-tree算法与传统T树算法相比在有效性和查询响应时间上具有更好地性能.
本文对Java的内存泄漏问题产生的原因及现象加以阐述和说明,然后详细讨论了Java中管理内存的关键技术和相关标准,以及最后在此基础上对调试一个大型软件系统内存泄漏问题的过程作了具体的分析。
随着领域知识的增加,知识库的海量存储引发了一个严峻的问题:给定一个庞大的多领域知识库,如何有效地保证知识服务的提供。本文研究了基于多Agent环境下的知识服务机制,提出了层次结构的多Agent架构,定义了一种Agent描述语言,并考虑了Agent通信及负载平衡问题。
电子公文在不同机构和部门间流转时,会遇到异构系统的问题,一般使用基于Web服务的SOA方案来解决。传统的SOA方案一般建立在基于XML的Web服务基础上,但是XML并不适合于传送二进制的电子公文文档。本文将二进制Hessian协议与其他传统的Web服务方案进行了比较,前者具有易学易用,文件数据传递效率高,防火墙能力强等优点,具有较为实用的工程应用价值。最后提出使用Hessian协议构建异构系统的电
本文在分析了传统遗传算法的缺陷机理和扬弃了已有免疫理论的基础上,通过对生物体实际免疫行为的模拟,使设计的优化算法能够有效解决保持全局收敛性的同时,加快局部收敛性能。并在此基础上提出了一种新的优化算法——基于并行的分区域人工免疫优化算法。该算法的基本思想是对于一个庞大复杂问题把它分解成多个简单或分多个部分区域的小问题。对多个部分问题采用并行分布“免疫”计算,把计算结果作为“抗体”算子注入全局免疫算法
越来越多的消费者认可并接受网上支付,影响消费者网上支付的因素也非常多。本文在对相关文献进行回顾的基础上,结合中国电子商务市场的实际情况,提出了确定影响消费者网上支付采用的七个因素:安全性、便捷性、支付平台声誉、政府政策、节约程度、消费者网上支付认知程度、消费者风险偏好。并基于信度分析、效度分析及回归分析和对消费者使用网上支付平台的影响因素进行了实证研究。研究结果表明:安全性、支付平台声誉、政府作用
基于ANSYS对复杂闸首CAD模型网格划分的困难,经过实践摸索提出了适合复杂模型网格划分的基本方法和模型切分技巧,结合ANSYS二次开发语言APDL,实现了闸首CAD三维模型的快速网格划分,得到了质量满意的有限元模型。