【摘 要】
:
近年来,万物互联,网络发展迅速,无纸化的不断普及,促使了大众交流方式的改变,不再只是面对面一种方式,人们越来越热衷于通过发表评论来表达自己的观点和看法,数据量日益递增。同时海量的数据也导致了无效信息的不断积累,有效信息难以直观体现的问题,对这些海量评论中蕴含的主观有效信息进行深入的挖掘,抽取其中有价值的信息,能够帮助各行各业把握舆论态势,引导商品未来发展走向,也能够为用户本身提供所需关键信息,做出
论文部分内容阅读
近年来,万物互联,网络发展迅速,无纸化的不断普及,促使了大众交流方式的改变,不再只是面对面一种方式,人们越来越热衷于通过发表评论来表达自己的观点和看法,数据量日益递增。同时海量的数据也导致了无效信息的不断积累,有效信息难以直观体现的问题,对这些海量评论中蕴含的主观有效信息进行深入的挖掘,抽取其中有价值的信息,能够帮助各行各业把握舆论态势,引导商品未来发展走向,也能够为用户本身提供所需关键信息,做出相应决策。于是,为解决该类问题,口碑监测类的相关系统应运而生,细粒度意见挖掘作为这类系统中的重要一环,在有效信息抽取的准确度方面起着非常重要的作用。本文针对细粒度意见挖掘部分进行了研究和试验,针对传统模型忽略主观文本抽取的重要性,在对评价要素抽取时,没有过多考虑句中词语之间的关联关系,并且忽视了隐式评价对象对意见挖掘结果的影响,做出相应改进。借助护肤品领域的产品评论文本,构建了新的主观文本抽取词典,并结合机器学习方法构建模型进行文本分类,提出了三层评价要素组合抽取模型,并将主客观分类和评价要素抽取的成果应用到情感极性分析的实现中,完成了产品评论文本的情感分类,对比了不同模型的分类效果,提升了口碑检测系统中意见挖掘模型的性能。本文基于意见挖掘模型的研究成果,将其应用于口碑监测系统中,系统基于Python语言,采用Flask框架进行搭建,借助Scrapy框架和MongoDB实现数据的采集和存储。系统用户可通过自定义上传已有的商品评论文本完成采集数据的添加,或者通过网站链接配置采集任务,完成网络数据的采集,然后通过意见挖掘模型,包括对采集数据进行文本预处理、主观文本抽取、评价要素组合抽取以及情感极性分析,并将意见挖掘的结果进行展示。
其他文献
随着互联网技术的快速发展,在线社交逐渐成为了一种人们的日常生活方式。但是,随着社交数据积累速度的加快,人们很难在海量的数据背景下快速的找到想要的数据资源并应对相关情报,因此,设计并实现一个用于发现社交网络中有影响力用户的系统具有很大的应用价值。本文在网络表示算法的结果上划分网络社区,并在子网中进行网络影响力最大化的研究,本文主要工作内容如下:在网络表示方面,针对整张网络数据量大,数据分布不均匀的情
随着我国改革开放政策的不断推进,国民经济获得前所未有的发展,在这其中地方企业国资的贡献度及重要性不可忽视,因此,完善国资监管体系、加强地方国资监管力度、落地国资监管措施在发展壮大国有经济的进程中尤为重要。国有资产同时具备不可分割的政治属性与经济属性,也存在分级监管的现状,加强完善监管机制、分级落实监管工作,既能激发各级国有经济活力,又能为地方国企实现健康发展提供有力支持,实现国有资产的保值增值。在
随着计算机技术的快速发展,人们对计算机系统与应用程序的安全性和可靠性的需求日益增加,而日志记录了系统与应用软件的特定事件的活动信息,是反映系统运行状态与性能的重要参考内容,因此如何快速准确的查找出日志数据中的异常部分,是维护系统与软件安全稳定的首要任务。对于日志异常检测,主要面临以下几个方面的难题:不同系统与软件的日志结构不一样,日志异常检测需要有很高的实时性,普通日志异常检测方法对日志内容的利用
电解水可将电能转化为清洁的氢能,具有无污染、可持续等特点,是一种高效的清洁能源存储技术。与电化学析氢(HER)相比,析氧(OER)反应过程复杂、动力学缓慢,是制约电解水的主要因素。电催化剂可有效降低OER的过电位,促进动力学反应速率,是推动电解水技术不断发展的关键。电催化材料的性能与其表面活性位点数量、本征催化活性及导电性能密切相关。本论文中设计合成了一系列高比表面积、高活性位点与不同化学组成的空
随着移动边缘计算(Mobile Edge Computing,MEC)的快速发展,MEC环境下的任务调度问题引起了人们的普遍关注。然而任务调度算法在移动边缘计算领域中的研究仍然不够成熟:一方面,不合理的任务卸载会产生大量时间和能源的浪费,而现有的调度算法并未考虑因用户移动而导致的网络变化对任务卸载的影响;另一方面,用户不仅要求最小化任务延迟和移动设备(Mobile Device,MD)能耗,还对任
国有林场是保障国家生态安全,提供生态公共产品的主要力量。但长期以来,“事业单位、企业化管理、自收自支”的体制使国有林场不得不把主要精力放在解决民生问题上,忽略了生态保护和生态建设的责任。受制于特殊的行政体制,国有林场在市场竞争中,缺乏企业发展活力。在森林资源禁伐和限伐的新背景下,国有林场的生产经营范围受限,众多林场陷入了资源枯竭、生存窘迫的困境。2015年中共中央、国务院发布的《国有林场改革方案》
随着多智能体控制技术在军事、工业和农业等领域中的广泛应用,人们对多智能体的研究也逐渐深入。由于科学技术的发展和人类各方面需求的不断提高,人们对设备运行的效率和精度要求也越来越高。像本文研究的多智能体系统这样复杂的系统,其结构也变得越来越庞大、复杂,所涉及的执行器、传感器及系统部件也越来越多、分布空间越来越广。由于系统长时间运行和外界环境干扰等因素,这些部件在运行过程中难免会发生故障。万一发生故障,
浮雕作为一种广为流传的雕塑艺术表现形式,多个世纪以来广泛应用在钱币、建筑和工艺品等多个领域。传统浮雕种类繁多,根据雕刻内容的不同,常见的浮雕包括人物、花纹、动植物等等,按照压缩程度的不同,主要分为高浮雕和浅浮雕。本文主要研究人脸肖像浅浮雕,传统的肖像浮雕建模很大程度依赖于手工艺人的经验并且非常耗时。随着计算机科学的发展,在浮雕建模领域各种各样的自动生成浮雕的方法不断涌现,但目前大部分浮雕建模主要围
纵观世界城市交通轨道发展,我们发现越是城市经济发展水平较高的国家,其城市轨道交通网络越为完善,政府也更是鼓励社会资本的积极投入其中。本文站在社会资本角度,通过全面风险管理对T城市轨道交通PPP项目投融资风险管理进行研究,有利于提升城市轨道交通项目的运营效率,激活社会资金的融资机制,从根本上规避轨道建设中存在的风险,具有较好的指导意义。本论文以T城市轨道交通PPP项目投融资风险管理为研究方向,基于相
电力系统逐步发展稳定,智能电网日渐完善,用户用电信息采集系统广泛应用。而随着用户用电信息采集系统的应用积累了大量的用户历史用电数据。这些数据为为电力部门电网规划、