规则的信息量及其在数据挖掘中的应用

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:iswhat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文全面地讨论了清晰规则,模糊事件,模糊规则的信息量,并将这些新的度量公式成功地应用于数据挖掘。   本文详细讨论了清晰规则信息量的度量,讨论了n元关系的信息熵及其相关性质,利用关系的信息熵给出了一个新的决策树学习算法。,回顾了与规则相关的诸多度量,我们发现,所有这些度量均孤立地讨论规则的前件与后件间的因果关系,忽略了规则本身存在于知识系统中,要全面度量规则的信息,便需将规则放回到知识系统中这一道理,提出了规则的条件信息量,规则的独立性,规则库的信息量,规则的泛化度等全新的概念,并分别给出了度量公式。这些概念都将在后面的章节中得到应用。   本文给出了一系列关于最大泛化规则生成的算法,提出了两种新的规则提取算法,给出了一系列量度,以决定离散化过程中属性的顺序和节点的选择,并在此基础上给出了两种离散化算法,讨论了约简的信息内涵。   本文集中讨论了模糊事件的信息量及模糊规则的信息量,给出了一种连续论域下比较模糊事件信息量的办法,讨论了规则的关联信息量,对可能性规则作出了新的定义,认为只有信息量为正的规则是可能性规则,而信息量为负的规则即使条件概率大于零也是不合理规则。基于信息的观点,我们对规则的置信度、规则中属性的可约性做出了新的定义,并进一步提出了新的规则提取算法LEI和规则约简算法LRR.   
其他文献
  本文是在Cogburn建立的随机环境中Markov链的数学模型的基础上,主要研究随机环境中可数Markov链的位势的几个相关问题。  首先,本文讨论了随机环境中离散Markov链的禁忌
中国经济网2016-05-23报道:厦门海沧检验检疫局消息,2015年1月至2016年3月,海沧口岸进口废纸批次连续15个月同比增长。据资料显示,2015年1月至2016年2月,14个月份进口废纸的
在求解非线性单调变分不等式问题的每一步迭代中,临近点算法(Proximal Point Algorithm)是求解一个子变分不等式问题,而LQP(Logarithmic-quadratic proximal)方法是求解一个非线性
  20年来,并行编译技术的发展说明高性能并行编译系统与高性能体系结构和操作系统等一样,成了高性能计算机系统中不可或缺的一部分。而网络性能的迅速发展,给并行处理技术带来
本文主要研究了两个模型.首先研究了一个白噪声干扰下具有饱和增长率以及两种传染病交叉传染的随机传染病动力学模型.运用自治微分系统的相关理论、定性分析的方法,对具有饱
“Fluid models”是研究排队网络平衡稳定性的重要工具,它在分析何时这样的网络是运行稳定的以及在可能稳定的情形下如何判定其稳定性,定义一个一般性的原则中起着重要的作用。
党的十六届三中全会是我们党在新世纪新阶段召开的一次十分重要的会议。认真学习贯彻全会精神,大力推进改革,努力加快发展,是摆在我们面前的一项重大任务。地方人大及其常委
本文简述了最优恢复问题的相关概念(参看文献【2】或【4】)。设C是线性空间X的子集,I是C到另一线性空间Y的映射,它可以是多值映射。 本文在最后一部分我们研究了另一个最优
  本文系统地考虑和研究了有限区间上重排不变函数空间框架下的鞅不等式和鞅空间。包括重排不变鞅空间及其中的Doob极大不等式,Burkholder-Gundy-Davis不等式,上、下不等式,Ro
一直以来,音乐课容易乱,也常常乱,“乱”通常是指学生在音乐活动中做了与活动无关的事情,或者学生完全忘记了自我,不听从教师的活动安排,从而导致课堂陷入混乱,也影响了音乐