基于CRFs的中文产品评论评价关联对识别研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:fanybul8899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,Inernet为人们带来丰富的信息资源的同时,在很大程度上也改变了信息的发布及获取方式。网络产品评论对企业和消费者都将具有十分重要的意义。它不仅可以使企业能够了解客户对企业及产品的情感倾向分布,为企业提供重要的商务决策信息;而且对消费者的购买决策也具有重要影响。然而,由于产品评论数量急剧增加,并且具有非结构化特征,通过人工的方式难以准确挖掘产品评论信息。如何采用自动分析方法充分挖掘网络评论中的客户情感信息,已成为网络信息管理领域的研究热点。   本文借助自然语言处理技术、数据挖掘、机器学习、信息检索等领域的理论与方法,针对传统的评价关联对识别方法中存在覆盖率低、句子结构简单以及无法解决指代消解等问题,围绕产品评论情感倾向性分析中的评价关联对识别问题展开了研究,提出了基于条件随机场的产品评论评价关联对的自动识别方法。首先,建立了产品评论评价关联对识别的条件随机场模型,将评价关联对的识别问题转化为条件随机场模型的序列标注问题,并且提出了评价关联对识别的条件随机场模型标注方法。其次,本文提出了基于词信息、词性信息、位置信息、语义信息、短语结构信息、句法依存关系信息的评价关联对识别的条件随机场模型的特征构造方法,并构造基于上述六类信息的评价关联对识别条件随机场模型的特征模板。然后,对基于条件随机场的评价关联对识别系统进行了设计,构建了评价关联对识别系统结构,并结合系统的各个处理模块详细地设计了使用本文提出的方法进行评价关联对识别的全过程,包括识别过程中具体的处理方法。最后,本文基于不同复合特征模板的关联对识别方法进行了对比实验。实验结果表明,本文所提出的评价关联对识别方法有效地选取了影响评价关联对识别的六类信息,与前人所提出的方法相比,可以获得更好的评价关联对识别效果,提高关联对识别的准确率。
其他文献
好的新闻标题应该言简意赅、鲜明显豁,切忌含混不清、语义两歧和题不对文。《北京晚报》1982年2月14日第四版有一个标题是“故善战人之势”,这就叫人有点莫明其用意。看过全
供应商的选择问题是供应链管理的一项重要研究内容,需要考虑多方面的因素,因此很难建立一个普遍适用的供应商选择的指标体系。论文从供应链和供应链管理入手,首先分析了供应商选择中存在的问题,提出科学评价选择供应商的必要性。接下来论文比较分析了传统采购环境下与供应链管理环境下供应商选择的特点,综合考虑各项因素在供应链管理中的作用,指出传统供应商选择中单纯由主观判断确定指标权重方法的不足,最终确定采用主观判断
随着经济全球化程度的不断加深,技术变化速度日益加快,市场竞争日趋激烈。面对环境的急剧变化,作为重要的经济组织,产业集群必须加快知识更新速度,推动持续的创新,以在新的竞争环境
通过精密自动绝热热量计测定了2-碘-3-硝基甲苯(C_7H_6INO_2)在79~373K温区的摩尔热容.实验结果表明,这个化合物在331~340K温度区间有一个固-液熔化相变,其熔化温度、摩尔熔化
在毛主席革命路线的指引下,郊区广大干部、群众,坚持以党的基本路线为纲,学理论、促大干,实行科学种麦,产量不断提高,1974年全市平均亩产430斤,比历史上最高的1971年增长一
快速消费品由于单品价值低,利润空间小,使得企业利润对物流成本非常敏感。随着企业生产地的不断增加,客户需求地的分布广泛且散乱,产品品项也呈多样化发展,这些使得企业生产
无线射频识别技术(RFID)是众多自动识别技术中的一种,在物流与供应链领域有着巨大的应用潜力。本文旨在研究影响中国物流业采纳无线射频识别技术(RFID)的关键因素,并期望研究结
学位
省蚕茶所茶树研究室于1979年试种几种规格的密植茶园,今年已是第四年,到7月31日止,春夏茶合计:多条密植(每亩6万株)0.226亩,每亩收获干茶576.2斤;四条密植(每亩2.5万株左右)
1955年3月,我从新华总社调到俄文友好报工作。当时友好报正在筹备创刊,我们聘请的苏联专家奥柯洛柯夫等已经到达编辑部。我能够一开始就和苏联同志一起工作,直接向他们学习
目前我国产业集群发展仍处于初期发展阶段,特别是小产业集群核心竞争力并没有形成,产业集群主要依赖廉价的劳动力成本取得竞争优势。在产业集群的中小型规模的物流企业多数仅