论文部分内容阅读
网络链接特征分析一直是网络服务应用的关键理论和技术问题。目前,Web超链接特征分析已经得到深入的研究,如PageRank、HITS等经典的算法及应用。随着网络信息海量的增长,语义网络正在成为网络信息处理的研究热点,语义网络的链接特征有待人们深入地研究,以期能为人们提供更好的网络知识服务。本文综合运用链接分析、图论、统计学等相关理论和方法,对关联语义链接网络的Web资源层关联语义链接特征和关键词层关联语义链接特征进行深入分析;建立从关键词层关联语义链接特征到Web资源层关联语义链接特征的桥梁,以期为领域Web资源的智能浏览和领域知识的关联学习与推荐等提供理论支持和实践参考。具体研究内容如下:1.针对关联语义链接网络资源之间链接的复杂性,进行Web资源层关联语义链接统计特征分析,即统计特征分析。根据链接权重的大小对关联语义链接进行筛选,发现统计特征变化规律。具体包括:1)通过路径特征(平均路径)分析,发现关联语义链接网络平均路径变化规律;2)通过关联语义链接的聚集特征分析,发现关联语义链接网络语义聚集特征的变化规律;3)通过关联语义链接的度分布特征分析,发现关联语义链接网络的度分布规律。2.针对关键词层稀疏关联语义链接容易丢失的问题,提出稀疏关键语义链接快速挖掘模型,有效促进领域Web资源的关联语义完整性,为语义特征分析建立良好的基础。1)从关键词层关联语义链接时间有效性出发,分析关键词层稀疏关联语义链接易丢失的原因;2)基于稀疏关联语义链接丢失原因分析,给出稀疏关联语义链接区间存在性理论,进而提出关键词层稀疏关联语义链接快速挖掘模型,并对模型的正确性进行评价。3.面向领域Web资源中关注的核心话题发现问题,进行关键词层关联语义链接特征分析,即语义特征分析,提出基于语义同心度的关联语义链接分层模型。具体包括:1)基于关键词的主动牵引性和被动牵引性,讨论四种模式关键词及关联语义链接的分布;2)基于关联语义链接的分布规律,提出基于语义同心度的关联语义分层模型,并给出评价方法。3)研究基于关联语义分层模型的领域当前核心话题和长期关注话题的发现。4.基于以上资源层和关键词层关联语义链接分析的结果,进行关联语义链接网络拓扑结构形成机理的研究,建立从关键词层语义特征到资源层统计特征的通路。1)提出基于关键词主动牵引性的Web资源链接出度计算模型,建立Web资源内容与出度的对应关系;2)提出基于关键词的被动牵引性的Web资源链接入度计算模型,建立Web资源的内容与入度的对应关系。从而可借助于网络平均度的桥梁作用,建立起关键词层语义链接的语义特征到资源层链接统计特征的通路。5.基于关联语义链接特征分析给出两个具体应用研究。1)根据“追根朔源”思想,提出基于关联知识流的Web资源智能浏览模型,为用户提供相关联的Web资源的浏览路径,形成一种具有知识增值的知识链条;2)基于“从Web资源中学习”的思想,提出面向Web资源的领域知识关联学习模型,借助于关联语义链接分层模型进行多个关联问题的发现,以期为学习者提供给定话题的更“新鲜”、“丰富”的知识。本文的研究可以为领域Web资源的智能浏览、基于Web资源领域知识的关联学习与推荐等提供一种基于关联语义的解决方案和研究思路。同时,本文的研究能够为领域Web资源的推荐、文本语义搜索、e-Learning等应用提供基于关联语义的理论基础,一定程度上减轻用户获取网络知识的认知负担。