基于朴素贝叶斯算法的水产类专利文本分类

来源 :渔业信息与战略 | 被引量 : 0次 | 上传用户:k3392301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文选取公开日从1992年1月1日到2011年12月31日的水产类的9 894条失效专利作为数据挖掘的文本。从中选出56条专利,利用分词器对其摘要进行分词,并通过卡方检验的方法过滤掉与分类相关度比较小的词,形成词组矩阵。然后采用朴素贝叶斯的方法对这些矩阵进行训练并设计程序。使用训练过后的程序对失效专利进行分类测试,合格后再对所有的专利的摘要文本进行分类,并对分类结果进行了分析和验证。验证的结果表明该程序对文本进行分类的准确率达到了85%,达到了比较好的可信度,可以用它对文本分类。如此我们就可以把失效的水产类专利文本按照设定的类别进行归类,了解一个时间段它们的分布情况,为以后做决策提供参考。
其他文献
随着我国房地产行业的不断发展,越来越多投资者将资金转移到房地产开发事业之中,以求得更高的利润空间。随着房屋建设工程规模的逐步扩大,工程涉及到的资金及建设项目逐渐增
本文收集了近几年的相关数据,建立出我国不同行业年均工资水平评价指标体系,采用聚类分析的方法,对我国19个不同类别行业年均工资水平进行聚类评价。通过对聚类结果的分析,进
目的 研究氢氧化钙与樟脑酚治疗慢性牙髓炎的临床效果。方法 选取我院2015年9月至2016年9月收治的90例慢性牙髓炎患者为研究对象,以随机数表法分为观察组与对照组,各45例。观
<正>一、引言北京观赏鱼产业历史悠久,文化底蕴深厚。自古以来,上至达官贵人,下到平民百姓,都有品玩和养殖金鱼的传统。尤其是近几年,市民越来越重视生活品质的提高,物质文化
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
歌唱艺术通常是借助声音与乐曲来表达情感,从而与听众产生心灵上的共鸣。声乐训练是歌唱艺术的基础,具有针对性的声乐训练不仅能够巩固合唱队员的基本演唱技能,还能够借助纠
大气中人为来源的CO2持续增加,使针对碳捕集和储存的研究势在必行。目前的CCS技术被认为是可持续的碳减排途径。而常用的液胺吸收技术存在副产物危险性大、再生能耗高等缺点
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的了解北京市15岁及以上成人吸烟及戒烟情况,为北京市控烟政策的出台提供基线数据。方法于2014年7-8月,采用多阶段抽样的方法,首先采用按容量比例(PPS)抽样法从全市抽取街
[目的]通过对不同系号元宝枫叶片形态特点和叶片中6种药用成分含量的分析,为黄酮类、酚类化合物的定性定量检测、元宝枫叶茶的开发利用及优良无性系的筛选提供参考。[方法]采