【摘 要】
:
随着互联网的快速发展和广泛应用,人们已经逐步从信息匮乏的时代步入信息超载的时代。面对如此爆炸的信息时,通常无法快速地定位到有价值的内容。文本分类作为自然语言处理方向的基础研究,有着非常深刻的研究意义及广泛的应用前景。在近几年,深度学习逐步取代传统的机器学习方法,已渐渐成为文本分类领域的主要研究方向。深度学习,将特征提取和分类的过程融为一体,取代了传统的文本分类方法,可自动获取数据的特征信息。深度学
论文部分内容阅读
随着互联网的快速发展和广泛应用,人们已经逐步从信息匮乏的时代步入信息超载的时代。面对如此爆炸的信息时,通常无法快速地定位到有价值的内容。文本分类作为自然语言处理方向的基础研究,有着非常深刻的研究意义及广泛的应用前景。在近几年,深度学习逐步取代传统的机器学习方法,已渐渐成为文本分类领域的主要研究方向。深度学习,将特征提取和分类的过程融为一体,取代了传统的文本分类方法,可自动获取数据的特征信息。深度学习特别是在数据挖掘、计算机视觉、自然语言处理等领域有较为突出的表现。本文主要以A公司客诉问题分析平台系统为研究对象,客诉问题分析平台是一个服务于集中管理和处理客诉问题的平台,主要为公司内各种产品、平台、组件提供服务,为测试人员提供问题单进行改进服务。其中问题单分为两种不同的类别:可处理的问题单和无法处理的问题单。我们针对问题单文本自动化分类问题使用深度学习中的卷积神经网络算法进行研究。首先,由于问题单文本是中文文本的特殊性,我们在数据的预处理的分词部分使用目前比较主流的基于Python编程语言的Jieba分词工具,并针对研究对象领域的特殊性,在停用词表中重新加入、整理了一系列词语,为问题单文本分类任务的后续工作奠定了良好的基础。其次,对分词后的文本使用Word2Vec技术将其转为词向量的表示形式,再以二维矩阵的形式传入卷积神经网络模型中。最后,为了证明卷积神经网络模型对问题单文本分类的有效性,本文引入传统机器学习中在文本分类领域表现较好的朴素贝叶斯算法作为对比,实验结果表明了卷积神经网络模型分类器表现较好,克服了浅层机器学习在文本分类上的一些缺陷,提高了问题单文本分类的性能。并根据客诉平台数据量的不断增加,基于深度学习的卷积神经网络模型分类器的效果将不断上升,投入A公司使用后可减少一定的人力投入,具有较为重要的现实价值意义。
其他文献
全球价值链的兴起,改变了国际分工和贸易格局,将更多的国家纳入到全球化生产体系中。制造业是实体经济的主体,也是全球价值链分工最为广泛和深入的主要行业。我国自改革开放以来,尤其是加入世界贸易组织之后,积极融入全球价值链分工体系,已成为世界上最大的制造业大国,但我国制造业大而不强,在制造业全球价值链分工中处于下游地位,面临着“低端锁定”的困境。同时,根据国家统计局发布的新中国成立70周年经济社会发展成就
当前全球企业之间合作与竞争在不断加剧,企业面临的风险挑战不断增加,很多企业都经历过同行之间的竞争、行业外部竞争者的竞争以及产品替代的竞争,越来越多的企业认识到要发
采购活动是保证企业生产经营活动正常开展的一项关键环节,采购的最终完成结果与企业利益息息相关。然而,采购过程不可避免的存在着一定的风险,一旦出现风险却未能得到有效控
白光LED具有低能耗、长寿命、发光效率高、无污染等优点,使之成为第四代光源。硅酸盐类荧光粉不仅性质稳定来源广泛,而且由于其具有LED的蓝光发射和紫外发射相匹配的激发光谱
大豆寡糖是以大豆及其加工副产品等为原料生产的低聚糖,主要成分为水苏糖、棉子糖和蔗糖等。本试验旨在研究日粮添加大豆寡糖、水苏糖和棉子糖对肉仔鸡生产性能、养分表观代谢率、非特异性免疫功能、盲肠主要臭气化合物浓度和菌群结构的影响,探索大豆寡糖及其功能组分对肉仔鸡臭气化合物产生的作用效果及微生物学机制。试验采用单因素随机化试验设计,选取300只1日龄AA+肉仔鸡,随机分为5组,每组6个重复,每个重复10只
随着互联网技术的快速发展,基于传统搜索引擎技术的信息获取方式已很难满足人们对于知识获取的需求,使用者仍然需要抽出额外的时间对搜索到的网页链接进行筛选,以确保得到最满意的信息。因此,能够快速精准地获取到有用的信息一直是人们愿望。智能问答系统的出现弥补了这一缺点,它可以通过用户的自然语言问题理解并分析出用户的意图,进而给出最直接的答案。另一方面,知识图谱的相关技术问题又是人工智能方向的不可缺少的一部分
随着互联网技术的不断发展,人们获取知识的途径以及种类越来越多。通过本体可以描述某个特定领域内的知识,并将该领域内的知识对象组织起来以帮助相关人员更加清晰、准确的了解相关元素和关系,从而为知识的进一步加工处理提供基础。由于本体构建者的信息源是分布自治的,他们往往采用不同的建模方式或本体描述语言,但这些本体所描述的内容在语义上有时会有有重叠或者关联,这就造成了本体的异构。本体的异构性导致分布式本体之间
水苏糖属于α–低聚半乳糖,是四碳糖,也是大豆寡糖的主要功能性组分。试验旨在研究日粮添加不同水平的水苏糖对肉仔鸡生产性能、养分代谢率、非特异性免疫功能、盲肠内容物粪臭素浓度、肝脏细胞色素P450(CYP450,CYP)基因表达和酶活性的影响,探索水苏糖对肉仔鸡粪臭素产生的作用效果、作用机制及适宜添加量。试验采用单因素随机化试验设计,选取360只1日龄爱拔益加(AA+)肉仔鸡,随机分为6组,每组6个重
近年来,随着城市化、工业化的快速发展,环境污染,尤其是水污染问题,日益严峻,水污染防治刻不容缓。吸附法是一种有效、高性价比的污水净化方法,吸附剂是吸附法的关键。常见的吸附剂有活性炭和聚合物等,活性炭吸附剂制备过程中能耗高,且易产生温室气体;聚合物基吸附剂生产工艺较复杂,且使用过程中易造成二次污染。制备生态高效、价廉量丰的吸附剂是吸附法污水防治的关键核心。黏土储量丰富,具有独特的层状结构和离子交换能
柔性制造系统工作时,多个工序使用同一种资源。一旦资源分配不当,就会发生死锁。死锁会导致系统无法正常运行,解决制造系统的死锁问题有重大工程意义。Petri网是一种有效的建模工具,基于Petri网理论,发展了很多死锁预防策略。现有基于区域理论的死锁预防策略,一般通过禁止首遇坏标识为系统设计最大许可活性控制器。若设计控制器时只考虑首遇坏标识,则合法标识可能被控制器禁止。因此为首遇坏标识设计控制器时,还需