基于喜好与情感倾向的微博信息推荐研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:xieyuanming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着中国互联网行业的迅速腾飞,微博等众多自媒体迅速发展,但同时也造成了信息过载等问题,导致用户难以获取所需信息,因此信息推荐技术孕育而生。虽然个性化信息推荐领域是当前研究的热点,但在现阶段还存在以下不足:要么信息推荐只考虑了用户的情感倾向;要么其只考虑了用户的兴趣;要么其考虑了其他因素而没有同时考虑喜好和情感倾向这两个主要因素。因此,为了探究喜好和情感倾向两种因素对个性化信息推荐带来的优势,本文提出了基于喜好和情感倾向的个性化微博信息推荐框架并基于此开发了一款微博个性化信息推荐系统。主要工作如下:(1)本文在FP-Growth算法基础上提出融合喜好度和时效性的微博分析方法。通过将喜好度和时效性转换成特征权值的方式融合到FP-Growth算法中挖掘出博文中用户所感兴趣的喜好分词。(2)本文采用基于词性注意力机制的神经网络模型(PAT-LSTM)对用户的情感倾向进行分类,主要包括积极和消极两大类。通过该模型主要筛选出含有消极情感倾向的人群,进而对这些人群进行个性化信息推荐。(3)将融合了喜好度与时效性的FP-Growth微博喜好分析方法和基于词性注意力机制的神经网络模型(PAT-LSTM)的用户情感倾向分析方法相结合,在基于Spring Boot框架基础上开发了一款基于喜好与情感倾向的微博信息推荐系统。该系统可以在分析出微博用户发表了含有消极情感倾向的博文之后,通过分析其相关博文信息,挖掘出用户的喜好,并根据喜好关键词进行相关文本爬取,根据系统最终给出的TOP-N微博文本推荐序列链接给用户推荐其所感兴趣的博文。本文通过Scrapy框架对实验数据进行爬取,总共获取到355189条微博文本数据,并对数据进行预处理后剩余29366条微博数据。经过PAT-LSTM模型分类后的准确率分别都达到了0.823和0.811,相比传统LSTM模型高了16.3%和9.1%。融合了喜好度和时效性的FP-Growth算法平均准确率也上升了1.89%。通过实验验证,得出的实验结果符合预期值。
其他文献
木材是一种可再生、天然环保,却易被木腐菌腐朽的建筑材料。木材经防腐剂处理后,通常对环境会有一定影响。而近年来,人们的环保意识逐渐增强,许多对环境有影响的木材防腐剂已被一些国家禁用或限用。水杨酸、槲皮素等有机物抑菌性能好,但是难以与木材形成有效的结合,抗流失性差。本研究旨在通过微囊化和化学接枝改性两种方法,用有机酸和黄酮类化合物修饰木材细胞壁,从而使其固定在木材中,提高植物源有机防腐剂的抗流失性。通
淀粉类食物是我国居民日常生活的主食,其消化速率决定餐后血糖水平高低,对维持人体糖代谢吸收很重要。α-淀粉酶和α-葡萄糖苷酶是淀粉消化过程中的关键酶,催化淀粉水解生成葡萄糖,抑制消化酶的活性是调控血糖的重要方法之一。植物中的多酚物质来源广泛,结构种类多,已被证明通过非共价作用抑制酶活性,降低底物消化率,其结构中的功能基团决定了对酶的抑制效果。没食子酸酯基(Galloyl moiety,GM)是多酚的
楸树(Catalpa bungei)是紫葳科梓树属植物,适应性强、分布范围广,是中国重要的乡土树种。楸树具有树形通直圆满、木材细密优良的优点,是我国北方重要的珍贵用材树种。由于全球气候变化的原因,干旱发生频率和强度有增加的趋势。由于楸树主要分布于我国半干旱半湿润地区,而且楸树生长速度较快、需氮量较大,因此干旱缺水和氮营养匮乏是制约楸树人工林生产力的两个重要因素。开展楸树水分利用效率、氮素利用效率的
1963年,混沌之父、美国科学院院士Lorenz在研究大气湍流现象时发现了混沌现象,进一步验证了19世纪法国科学家庞加莱最初对于三体运动中混沌的猜想。混沌现象随处可见,它几乎渗透到了社会中的每一个角落。在非线性科学中,混沌理论无疑是其关键分支,对该系统的研究主要涉及到应用和理论层面。近年来,数字信息开始借助于网络展开共享。图像以其直观性、生动性、交互性等优点成为一种重要的信息载体。由于网络的开放性
细菌素是由细菌核糖体合成的一类具有抗菌活性的多肽或蛋白质,其主要对同源或近缘的微生物具有抑制作用。近年来细菌素因其抑菌性、安全和不易产生耐药性等特点被广泛研究,以求日后其能成为天然的食品防腐剂及抗生素的替代物。而细菌素BM1157作为课题组在面包乳杆菌MN047中发现的新型细菌素,在先前的研究中已经发现其具有广谱抗菌活性。在本研究中,在大肠杆菌中对BM1157进行了异源表达,并对其进行了纯化鉴定、
随着社会经济的快速发展和国人饮食西方化的盛行,许多炎症相关疾病的发病率呈现出逐年增加的趋势。其中,溃疡性结肠炎(Ulcerative Colitis,UC)是炎症性肠病的一种,其发病机制目前尚不明确。目前UC被广泛接受的潜在发病因素主要涉及遗传、环境、肠道菌群紊乱和免疫反应等。此外,临床上许多UC患者还伴随着焦虑抑郁样行为,这些情绪障碍已经日益被认为是UC的重要共病。基于目前UC难治愈、易复发的特
呋喃唑酮(furazolidone,FZD),是一种硝基呋喃类广谱抗生素,被广泛用作饲料添加剂,用以预防和治疗大肠杆菌和沙门氏菌引起的胃肠道感染。虽然呋喃唑酮在动物体内的半衰期极短,但呋喃唑酮代谢物3-氨基-2-唑烷基酮(AOZ)能够与体内的蛋白质结合,并以结合物的形式长期存在机体内,对动物机体造成致癌、致畸、致突变等毒害作用。因此,对于食品中呋喃唑酮的即时检测是十分重要的。免疫层析试纸条因具有操
随着互联网应用的发展和普及,人们更倾向于在线上社区、博客、微博等网络平台上发表自己的看法、态度或心情,由此产生大量的评论文本数据,使得情感分析在处理文本数据方面成为一个研究热点。这些评论文本数据资源,同时也是服务平台或产品汲取意见的依据。本文针对评论文本进行细粒度情感分析技术研究,构建了基于深度多任务网络的方面级情感分析模型,用于联合学习评论实体方面项提取及情感分类任务,并在三种数据集上实验验证模
为实现第六代通信网络所追求的全球无缝覆盖和万物智联的终极目标,以无人机(Unmanned Aerial Vehicle,UAV)为核心元素的低空通信的研究迫在眉睫。同时,在现代移动通信过程中,无线信号的广播特性导致其容易被窃听者捕获并解码,故通信安全问题也亟需解决。因此,为了突破第五代通信网络中服务质量和网络容量的桎梏,完善UAV网络的窃听防御机制,本文在毫米波频段上,开展了UAV协助的多层异构蜂
干旱是全球环境治理中高度重视的议题之一,我国干旱半干旱地区面积广范围大,三北防护林工程在此初见成效,但仍需更进一步加强建设,在规划建设期内打造出完整稳固的西北生态屏障。杨树作为速生丰产用材林的主要树种之一,能无性繁殖保证了其优良性状不会变异,显著的三大效益保证了其林木栽培中的生产地位。引进和选育抗旱性较强的优良无性系,再通过区域栽培试验,筛选出适应西北地区环境且抗逆性良好的无性系加以推广,既可进一