论文部分内容阅读
在分析已有关联规则挖掘算法的基础上,提出了应用于Web 文本集的特征关联规则挖掘框架,详细地论述了该框架所涉及的主要技术和实现过程中涉及的诸多问题,据此给出了该框架主要模块的实现算法.在该框架中,Web 文本集的特征关联规则挖掘以Web 文本的结构化处理和特征化处理为前提,核心的挖掘模块由频集发现算法P&FP 和关联规则生成算法GenNoRedundantRule 构成,算法P&FP 结合了Partition 算法的数据分片思想和FP-生成树算法的高效性,算法GenNoRedundantR