基于部件的文本相似度计算

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:liqwart2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,以汉字数学表达式理论为基础,提出了一种新的文本部件粒度表示方法,根据部件频次建立文本特征向量空间模型,并在此模型基础上给出了相应的文本相似度计算公式及算法,用于计算两文本之间的相似度.实验结果表明,该算法与现有典型的相似度计算方法相比,具有实现精度高、计算简便等优点.
其他文献
本文介绍了LDO圆片级测试与修正的原理和基本方法,以LT1117为例指出了圆片测试的特殊性和需要注意的问题。
一种嵌入式计算机系统,硬件以386EX CPU为核心,支持实时纠错编码和标准的军用总线接口MIL-STD-1553B,软件基于VxWorks实时多任务操作系统,支持基于FLASH的文件系统.对该计算
本文讨论了IC进入深亚微米(DSM)阶段后,数字IC端口的设计所面对的困难。主要介绍了ESD保护、驱动电路设计以及端口设计的SPICE模型仿真验证。
目的对比分析维吾尔族与汉族食管裂孔疝患者腹腔镜食管裂孔疝修补术中丙泊酚的用量。方法选取2017年1月至2017年12月我院收治食管裂孔疝患者43例作为研究对象,以民族特征分为维吾尔族组(n=22)与汉族组(n=21)。两组诱导和术中维持均采用丙泊酚血浆靶控给药,术中通过调节丙泊酚血浆靶控浓度,维持脑电双频指数(BIS)在45.00±5.00,平均动脉压(MAP)、心率(HR)在基础值±20%的范围
本文介绍了应用CADENCE硬件仿真器Palladium快速灵活验证Ethernet交换芯片的实例.
等值线图在气象,地质测绘领域有着广泛的应用。目前,人们对于等值线的研究都集中在等值线的生成和填充上,而忽视了等值线的标注。而一个完整的等值线分析系统应该包括等值线的生成,填充,和标注。提出了一种等值线标注的算法,通过先找出等值线的近似多边形,然后根据系统要求在等值线上或近似多边形上输出标注。给等值线上添加标注,给标选择合适的位置,方向和疏密程度,将会使等值线图看起来更加直观、形象,使人们从图中就可
有效、公正、公平的考试是现代电子考试系统所必不可少的.运用项目反应理论的参数模型,建立了一种动态抽题算法,并在此基础上设计了一种基于动态抽题算法的考试系统.该系统能
我的好朋友,她是谁呢?你一定以为她是我的同学吧!不,她是书,是爸爸和我一起读的《论语》。为什么《论语》成了我的好朋友呢?你一定感到很奇怪吧!说起来很有意思的!
利用模糊综合评价法评估医院物流部门绩效。首先对某医院物流部门绩效考核中财物维度、顾客维度、内部流程维度、学习与成长维度4个方面的内容进行讨论分析,结合平衡计分卡原