专家证据文档识别无向图模型

来源 :软件学报 | 被引量 : 0次 | 上传用户:tinggu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专家证据文档识别是专家检索的关键步骤.融合专家候选文档独立页面特征以及页面之间的关联关系,提出了一个专家证据文档识别无向图模型.该方法首先分析各类专家证据文档中的词、URL链接、专家元数据等独立页面特征以及候选专家证据文档间的链接和内容等关联关系:然后将独立页面特征以及页面之间的关联关系融入到无向图中构建专家证据文档识别无向图模型;最后利用梯度下降方法学习模型中特征的权重,并利用吉布斯采样方法进行专家证据文档识别.通过对比实验验证了该方法的有效性.实验结果表明,该方法有较好的效果.
其他文献
为满足用户希望通过搜索引擎查询综合联系信息的需求,设计了基于中文网页中的综合联系信息提取系统。研究与阐述了在搜索引擎返回结果的基础上提取有关联系方面的综合信息(例如
蚂蚁是一种属于节肢动物门膜翅目蚁科的社团性昆虫,它们的祖先距今约2亿年。随着环境的变迁,和它们同时代生存的恐龙早已灭绝了,而身躯细小的蚂蚁依靠集体的力量生存、繁衍至今,成为一个鼎盛的蚂蚁王国。可以说,地球上凡是有土壤的地方就有蚂蚁的足迹。蚂蚁有260属、1.6万余种,其总重量远远超过人类。蚂蚁是母系社会,它们绝大多数是雌性,蚁后是当之无愧的首领,还有工蚁、兵蚁,它们也是雌蚁。只有蚁王是雄性,它们惟
电动汽车蓄电池组由多个蓄电池串联组成,电压的测量有一定困难.本文设计了一种电池管理硬件系统,并介绍几种基于隔离光耦的电压测量电路,设计出一种实用的测量电路.
分析了正多面体结构的特点,通过研究正多面体外接球与特征基本体--棱锥的参数关系,应用特征复制原理,介绍了在Solidworks环境下进行正多面体三维建模的方法.
容错调度是调度问题中一个重要的研究内容,是提高系统可靠性的有效手段.目前已有很多集群系统中实时任务的容错调度算法,但是这些算法都没有考虑到任务的QoS需求问题.提出了一种
铸造防核盾牌的人──记全国政协委员、防原医学专家程天民教授本刊记者赵书友记者每每采访全军卫生工作会义,总会遇见和蔼可亲的程大民教授。因为他是第三军医大学预防医学系
在句法分析中,已有研究工作表明,词汇依存信息对短语结构句法分析是有帮助的,但是已有的研究工作都仅局限于使用一阶的词汇依存信息.提出了一种使用高阶词汇依存信息对短语结