基于词频的机械匹配文本分类改进算法

来源 :长春工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:ybchen123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于词频的机械匹配自动分词算法,以长度为首优先,结合词频进行分词,未匹配字串进一步应用改进的正向和逆向的最大匹配法,结合熵率分词分别标注所有可能为词的元素。在匹配时完全忽略了5个字以上的词语,解决了随长度增大复杂度呈指数增长这一难题。实验表明,该方法改善了分词正确率,提高了切分效率。
其他文献
基于Sobel边缘检测算法处理图像,得到边缘图像以及灰度共生矩阵。将该矩阵的多个统计量记为描述图像的特征向量,并对图像进行检索。实验结果表明,该算法能够大幅缩减检索时间,并且对于纹理较为丰富的图像具有较好的检索效果。
网络侵权的管辖权的提出是新科技发展的产物.传统的理论在面对这个问题时出现了困难.本文介绍了当前的相关理论,并对侵权行为地进行了理论上的分析,认为网络侵权案件的管辖权
手术室是一家医院最重要的科室之一,是医院急救抢救病人的重地。手术室安全管理的好坏对患者的治疗起着重要的影响。轻者影响患者即使接受治疗,延误手术最佳治疗时期;重者可
近年来,随着财政、税务等部门及金融、石化等关系国计民生的行业信息化程度不断提高,国家审计获取被审计单位数据并开展审计的深度、广度以及频率都大幅提升,审计数据呈现数