基于词向量空间模型的中文文本分类方法

来源 :合肥工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:rockykimi81
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。
其他文献
随着全球化时代的到来,多元文化音乐教育的理念已成为人们关注的焦点。在历届世界音乐教育大会中,世界音乐文化的千姿百态,充分体现了多元音乐文化的“和而不同”。本文立足“世
有效的课堂对话不仅能使课堂教学顺利进行,而且能提高课堂教学质量,全面促进学生素质的发展。攀枝花是在新中国成立后建立的一个移民城市,在这里,多元文化并存,民族学校是多
1 闽北乌龙茶概况武夷岩茶在明末就很兴盛,清初衰弱一段时间之后,又重新兴盛起来.康熙十九年(1680年)瓯人以茶为日常饮料,且以武夷茶为华茶之总称,此为武夷茶之新世纪.是时商
本文通过三维扫描仪对着装人体进行扫描以得到服装的三维几何模型,该模型精确地反映了真实服装的三维数据,是最接近真实服装形态的模型。但此时所获得的几何模型不能随着人体
选择2008年3月至2010年5月在北京军区总医院京西医院因牙周病引起牙齿松动固定67例,266颗牙。其中男性52例,女性15例;年龄26-67岁,平均年龄49岁。磨牙22例,前牙45例。患者身
乳磨牙牙体缺损,是儿童口腔的一种常见病。由于缺损程度不同,使咀嚼功能及颌骨、咬合关系的发育均受到不同程度的影响。常规的治疗方法是使用充填法,作者从2002年开始,在经过治疗
该文采用酸度为0.10mol/L的硫酸作为介质,磷(Ⅴ)与钼酸铵发生显色反应生成淡黄色络合物,在抗坏血酸和酒石酸锑钾的还原下变成蓝色络合物.在磷锑钼蓝分光光度法的基础上,研究加
自媒体是新媒体时代的特征之一,自媒体时代的到来改变了以往“点对面”的传播方式,逐步实现了“面对面”的传播方式。在自媒体时代,普通公民具备了“人人皆记者”的技术条件,借助
实现农业的现代化,活跃农村经济,应当实现农地金融化。并且,农村土地承包经营权的金融化也有法理基础作为支撑。一方面,在我国,农村土地承包经营权在法律上被定义为用益物权,
德国在历史上经历过两次大的统一,第一次是在1871年,由“铁血宰相”奥托·冯·俾斯麦完成统一,并建立德意志帝国;第二次是在1990年,原德意志民主共和国并入德意志联邦共和国,完成统