文本分类器相关论文
针对互联网突发事件监测快速响应场景下文本信息非结构化的特点,选择互联网众源突发事件文本数据,分析在突发事件监测信息分类中的朴......
针对当前需要对海量的文本数据进行分类和用于训练的带标记的文本数据非常匮乏这两个问题,结合半监督的朴素贝叶斯分类算法和Map-R......
人工智能技术近年来迅猛发展,可以轻松提取出自然数据中的特征和内在联系,非常擅长拟合高度非线性关系。因此,人工智能技术被广泛地应......
为更好地实现现有工作流系统在业务处理过程中对知识的利用和管理,本文将知识管理的知识获取、知识共享、知识学习、知识应用以及......
近年来,微博己逐渐成为社交网络的核心。其从传统的社交网络中脱颖而出,在拥有了独立的服务平台后逐渐演化为一种新的信息发布形式......
随着互联网技术的迅速发展,人们从Web上可以获得的信息资源越来越多,涉及到社会生活的各个方面,这也导致了网络信息过载(Information ......
本文以电子政务应用为背景,研究了基于XML的异构数据交换技术和文本自动分类技术。重点研究了关系数据库模式到XML模式的映射以及XM......
文本分类作为文本挖掘领域中一个非常重要的研究方向,对文本数据的组织、管理和处理具有重要意义,在信息检索、数字图书馆、搜索引擎......
Web页面由于其在表达信息的丰富性方面远胜于纯文本文件,因此Web页面分类与纯文本分类不同。针对网上中文新闻页面特点,我们提出了......
本文介绍了一种基于信息熵的文本特征加权算法—TF/IDF (MaxEnt)算法,用以提高文本分类器的分类性能.该算法将信息熵的概念引入到......
文本分类技术是近年来自然语言处理研究领域的一个热点,向量空间模型(VSM)是文本分类的经典模型,该模型在应用时假设词与词之间是相......
本文中,我们用CO特征定义来表述单词间的相互依存关系,并给出了基于 CO特征定义的文档表示法,特征筛选算法和朴素贝叶斯文本分类算法......
k-NN,即k最近邻居法,是一个被广泛使用的学习算法,也是最基本的基于事例的学习方法。该文针对超文本结构中的结构特征,提出了用k-NN方......
VC维理论和结构风险最小化准则是统计学习理论中的重要内容 ,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视 ,并被研......
作者对如何采用智能化技术实现英特网上电工文献搜索的自动化,以及提高其准确性和高效性进行了研究,设计并实现了一个电工文献智能......
本文在介绍隐性语义索引和支持向量机原理的基础上,提出了一种基于隐性语义索引的支持向量机自动文本分类模型,实验表明,该方法可......
在本文中,以美国四大州为例,分别进行数据分析和建模以描述其总清洁能源状况,并对上述四州的发展进行预测和安排.首先进行四个州的......
本文提出基于GEP的文本分类器、复合判别模式的定义;给出基于GEP的文本分类算法,并进行了试验验证。在给定试验数据集上的试验结果......
文本自动分类是目前最常用的文本信息自动处理技术,也是人工智能、自然语言处理和信息检索领域的研究热点。对文本自动分类所涉及......
本文提出了一种提高中文文本分类器推广性能的方法。一般而言,采用机器学习的方法对文本集合进行训练,可以获得文本分类器。本文引入......
文本自动分类系统是信息处理的重要研究方向,在文献检索、信息过滤和文本管理等领域中有着广泛的应用.介绍了一种基于模糊模式识别......
文本自动分类系统是信息处理的重要研究方向.针对文本分错类和相似度低找不到合适类别等两种错误,提出一种迭代的学习算法,它利用......
由于网页信息具有异构和动态的特点,致使现有的大多数网页信息抽取方法都存在适用性差的问题。为此,将传统的文本分类器和隐式马尔......
通过阐述朴素贝叶斯文本分类器的算法原理及其用于建立渔业文本分类器的优点,给出了基于朴素贝叶斯的渔业文本分类器的基本结构,并用......
信息安全是人们关注的焦点,从传统的基于行为的安全向基于内容本身的安全不断发展,信息安全的外延在不断扩大。Internet提供的海量、......
In text classification, labeling documents is a tedious and costly task, as it would consume a lot of expert time. On th......
近些年,基于神经网络的文本分类器和词嵌入在自然语言处理中被广泛应用。然而,传统的简历解析器采用基于关键字的模糊匹配或正则表......
SE4SEE是一种提供个性化用户需求、针对特定国家、基于分类、面向社会文化的网络搜索引擎。其组成部件包括网络入口、网络爬虫、文......
随着计算机网络与信息技术的飞速发展,信息极大丰富而知识相对匮乏的状况在加剧.文本挖掘正成为目前研究者关注的焦点.文本分类是......
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档......
基于概念类别属性,在Protege平台下构建了茶领域本体,并实现基于茶领域本体的DocOnto文本分类器。在该分类器上对茶文档、酒文档和......
由于现实生活中大多数信息被存储为文本,因此文本挖掘具有在商业上的高潜在价值。实际应用中可以从许多信息来源中挖掘知识,然而,......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
利用正样例集合和未标识样例集合获取初始的最强反例集合是使用两步框架方法构造一个面向PU问题文本分类器的基础。该文指出了使用......
文本数据具有规模大、特征维数高等特点,当前文本分类方法无法刻画文本变化特点,使得文本分类正确率低、误差大、分类时间长,为了......
随着Internet使用的日益普遍,网络给人们带来了无比丰富的信息,但是,Internet也充斥着各种色情、反动或者是暴力的信息和各种互联......
KNN(k最近邻算法)是文本挖掘领域最成熟最简单的分类方法之一。该方法对文本分类中的距离参数的选取敏感,错误的选择将导致分类精度......
从统计学视角审视网络舆论倾向性的监测问题,提出了以粗糙分类器为基础建立舆论倾向性分类模型,将复杂的预警指标体系简化为单一直......