基于Web文本挖掘中的一种中文分词算法研究

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:LIUANQING5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Web文本挖掘问题,提出了一种改进的索引结构的词库组织体系及基于该词典结构的中文分词算法。同时,加强消除歧义方面的处理,分词精度有所提高。试验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。
其他文献
从班级的一般含义和班级建设的实质入手,分析了高职班级的特征,并对比班级建设的一般内涵,概括了高职院校班级建设的六个方面的特殊内涵,结合班级建设的教师团队形成,提出了"
研究了课堂教学质量的综合评价问题,基于不确定理论提出了不确定综合评价方法。在这个方法中,将每个评委对每项评价指标的评价当作不确定变量,提出了基于期望值的不确定综合评价
为提高西方经济学的教学质量,教学者应认真编写选用教材,教师发挥出积极引导作用,增强学生的主体学习性,最终实现教学改革的意义。
阐述了在利用Visual FoxPro开发通用试题库管理系统时,确保系统具有通用性和对试题管理与维护的开放性是极为重要的。结合笔者在系统开发中的实践经验,提出了利用Rich Textbox