人工鱼群-BP神经网络算法在文本分类中的应用研究

来源 :河南工业大学 | 被引量 : 0次 | 上传用户:wujun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海量信息以及新信息量的爆炸式增长,使得用户难以在海量的信息中获取自己所需要的信息;文本分类在较大程度上解决信息杂乱无章的问题,对文本进行分门别类,可以使用户快速有效的获取到自己所需要的信息。文本分类技术是数据挖掘的一个主要分支,是基于自然语言处理技术和机器学习算法的一个典型的具体应用,研究各种高效的分类算法在文本分类中的应用是目前的重要研究课题之一,也是现实中亟待解决问题。本文首先阐述了文本分类的研究状况以及目前存在的问题,介绍了文本分类的一般处理过程,探讨了文本分类的相关技术,重点分析和研究了文本预处理、本表示、特征选择等重要步骤以及常用的文本分类算法。本文较为系统的阐述了人工鱼群算法、BP神经网络的基本原理,并分别就人工鱼群算法、BP神经网络在文本分类中的问题加以探讨,并指出传统BP神经网络文本分类器的缺陷与不足。BP神经网络相对于其它算法有更强的稳定性和抗干扰性,在文本分类中效果很好,但是仍有学习效率低,收敛速度不够快,容易陷入局部极值等缺点,人工鱼群算法具有很好的克服局部极值,获得全局极值的寻优能力,对初值和参数要求不高,对启发式函数的要求并不敏感,在解决较为复杂的组合优化问题中表现出良好的性能。所以我们结合了人工鱼群算法和BP神经网络的各自优点,用工鱼群算法来优化BP神经网络文本分类器,构建出人工鱼群-BP神经网络分类器。在此基础上我们设计和实现了一个基于人工鱼群-BP神经网络算法的文本分类系统,并对实验结果进行对比分析,验证本文算法在文本分类中有较好的分类效果。
其他文献
目的研究和探讨基于职业病危害作业分级的建设项目职业病危害评价量化分类方法,建立一种职业病危害评价量化分类数学模型,并将该量化分类模型应用于不同行业不同类型的建设项目
当今社会充斥着各种各样的风险.人们一方面呼吁需要零风险社会,另一方面人类活动却增加各种各样的风险.政府部门和私人企业如工业公司,保险公司和银行都必须考虑如何应对这些
随着城镇化进程加快,建筑物高度不断增大,建筑物密度不断增强,对室外风环境的影响也更加明显。小区建筑室外风环境是小区环境的重要因素之一,小区建筑风环境直接影响到小区行人风
展示设计是通过设计语言,将空间与平面巧妙结合,使其产生宣传主题的空间效果。同时一个成功的展示空间设计,将人作为整个设计围绕的核心,并且可以与人达到完美沟通,只有这样才能称
一、研究背景与研究目的乳腺癌是发生于乳腺小叶或导管上皮的恶性肿瘤,是女性常见的恶性肿瘤之一,发病率占各种恶性肿瘤的710%。因此,世界众多学者对乳腺癌发生、发展以及治疗和
现代女子足球运动逐渐呈现男性化发展趋势,比赛节奏越来越快、身体对抗更加激烈、跑动距离越来越长、短距离冲刺跑和快速跑动的频次越来越多。如果没有良好的身体素质作保障,
目的:探讨高血压患者中医体质类型分布及类型间血细胞、血脂生化及性别、年龄、生活习惯的差异。探讨单纯原发性高血压、高血压合并出血性中风及缺血性中风患者中医体质类型分
生殖健康不仅是一个备受关注的议题,也是一个突出的社会问题,是妇女社会工作的重要领域。农村妇女占我国女性人口的大多数,作为一个弱势群体,她们的生殖健康问题尤为突出,迫
随着工业化、城市化的不断推进,中国农村发生了天翻地覆的变化,产业结构的调整使得越来越多的年轻人到城市工作生活,农村剩余劳动力的转移以及计划生育政策的实施直接影响了
随着经济的不断发展,金融做为现代经济的核心作用越来越明显。商业银行在金融体系当中居于主导地位,是国家经济状况的晴雨表。商业银行风险管理水平的高低直接影响经济的稳定。