基于文本内容的自动分类系统的研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:xiazaisun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网络信息不断膨胀,为了提供高效、准确的信息服务,我们需要对网络中纷繁复杂的信息进行合理的组织与分类.目前,搜索引擎对于在Internet网上查找信息是非常有用的.但是,这个自动的信息检索工具的能力是有限的,搜索引擎的用户界面表达也是有限的.真正的搜索引擎不但能够找到信息,而且能够提供尽可能少的内容.该论文以文本信息处理为背景,从理论和应用的角度对文本信息的分类、聚类方法进行了较为深入的研究.主要内容包括文本信息的描述、特征提取和文本的分类.在论文中,我们提出了一个基于自动化的信息分类.对于信息的分类不是按照严格的规则,而是按照先前的样本进行分类.论文分为两个部分:第一个部分,我们提出了文本分类文法,以及这些文本分类方法是如何对文本进行分类,并给出了相应的算法;在第二部分,我们给出文本分类的类定义,开发出了基于朴素贝叶斯分类文法的分类器.它能够在不同的环境中使用,可以作为大型系统的嵌入部分或者作为一个独立文本分类系统.
其他文献
在人类历史还没有出现新的交流媒体以前,语言交流成为了主要的人类社会信息交换的工具.自从出现了电话、电影、收音机、电视和互联网以后,语音的概念被延伸了.语音识别和语音
随着基于网络的计算机技术的发展以及计算机在社会各个领域的应用,计算机网络作业管理系统的研究和开发得到了长足的发展.网络作业管理系统是建立在基本操作系统之上的中间件
该文给出基于路由协议ospf的互操作测试整个过程的说明.首先定义了互操作、互操作测试、互操作关系的基本概念.然后依据实现间交互的程度和测试器观察交互的程度我们提出了不
通过分析研究现有视频标准的技术特点及其编码处理流程,提出了一种新型的基于DWT的低比特率视频编码框架.新型视频编码器一方面采用DWT来取代DCT进行整幅图像编码,另一方面采
本课题为日本欧姆龙软件股份有限公司发掘可用于图像方向分类的图像特征量并实现一个判别图像方向(正立方向和两种非正立方向)的分类系统。课题的研究关注基于内容图像检索分类
随着计算机技术的发展,计算机辅助教学系统越来越受到人们的重视,特别是随着多媒体技术和网络技术的出现,计算机辅助教学系统得到了空前的发展,教学的形式、方法及内容等都发生了
SQL是针对结构化数据提出的,其能力不足以表达多数据库中将要集成的半结构和无结构的文件数据.在分析和比较了传统数据库的SQL、XML查询语言和面向对象查询语言的基础上,结合
现在,企业的很多应用系统都是独立的,既没有统一的客户视图,又实现不了业务流程的配置和管理.在这种背景下,BPMS(Business Process Management System)作为一种新型的应用系
基于实例推理的电子工艺设计系统是武汉邮电科学院委托我们开发的"CIMS三期工程"项目的一部分.传统的PCB (Printed Circuit Board,印刷电路板)装配往往需要过多地依赖工艺员
数字减影血管造影技术(DSA)是应用在诊断血管疾病中的一种新的X光线照相技术.可以使用它来获得分布在身体内各部位中的动脉的图像,从而高效地进行动脉结构与其周围的骨骼、软