【摘 要】
:
互联网和信息技术的发展带来了数据量呈几何级数的爆炸式增长,人们在网络上进行事件评论、购物等活动会产生的大量数据,这些数据中包含对用户有用的信息和无效的信息。为了能够快速发现用户行为规律,更好地将未知的新项目和社会事件推荐给用户,同时解决信息过载问题,推荐系统发挥了越来越重要的作用。由于深度神经网络(Deep Neural Network,DNN)的广泛应用,丰富的文本上下文信息特征被识别并存储下来
论文部分内容阅读
互联网和信息技术的发展带来了数据量呈几何级数的爆炸式增长,人们在网络上进行事件评论、购物等活动会产生的大量数据,这些数据中包含对用户有用的信息和无效的信息。为了能够快速发现用户行为规律,更好地将未知的新项目和社会事件推荐给用户,同时解决信息过载问题,推荐系统发挥了越来越重要的作用。由于深度神经网络(Deep Neural Network,DNN)的广泛应用,丰富的文本上下文信息特征被识别并存储下来,使得卷积神经网络(Convolutional Neural Networks,CNN)成为当前推荐系统的研究热点。然而,现今的超大规模数据量和评级数据的极度稀疏性使得基于传统CNN推荐方法难以取得理想的推荐性能。本文主要研究基于对传统CNN推荐方法的改进,以解决由于评级数据稀疏性导致推荐质量和推荐精度严重恶化的问题。本文工作主要包括以下三个部分:1.针对传统卷积神经网络的固有结构属性限制的问题,本文提出一种基于可变形卷积网络矩阵分解(Deformable Convolutional Network Matrix Factorization,DCNMF)的新文档信息推荐模型。具体来说,首先使用预先训练的词嵌入模型将项目文档转换为密集的数字矩阵,以便于网络处理。然后将DCN与词嵌入相结合,以更好地理解项目描述文档。由于推荐是回归任务,所以将DCN集成到概率矩阵分解模型(Probabilistic Matrix Factorization,PMF)中,以准确地近似用户对具有极稀疏数据的项目评级。通过在三个不同的真实数据集中进行实验仿真,并与其他先进推荐算法进行比较,仿真实验结果表明所提模型取得了不错的结果。2.针对传统词嵌入的文本表示方法只考虑文本本身的语义信息,并没有考虑词语的情感极性信息的缺陷,本文提出一种基于情感权重的深度卷积神经网络(Deep Convolutional Neural Network Recommendation Model Based On Emotional Weight,Deep Conv EW)的推荐模型。该模型主要是由两个并行的卷积神经网络组成,其中一个网络偏重于利用用户文本来学习用户的行为,另一个网络偏重于利用项目文本来学习项目属性,在网络的底部利用基于TF-IDF的词嵌入文本表示方法将用户/项目文本表示为密集的具有情感权重的数字矩阵,在网络的顶层引入共享层将两个网络连接在一起,共享层主要使用分解机(Factorization Machine,FM)将用户和项目进行交互,以达到预测的目的。通过在Amazon和Yelp公开数据集上进行仿真实验,结果表明所提模型的性能明显优于现有的基线推荐模型。3.针对评论文本信息对推荐质量有效性的问题以及注意力机制的应用,本文利用基于注意力机制来对评论文本信息的有用特征和无用特征进行重新权重分配,并提出了基于加倍注意力机制的深度卷积神经网络(Deep Convolutional Neural Network Based On Double Attention,Deep Conv DA)的推荐模型。该模型首先在词嵌入层引入注意矩阵对文本权重进行初步分配,然后在网络的池化层再次引入注意矩阵对文本特征进行分配,这样可以更深入的了解文档,特别是对于极度稀疏的评级数据,使其发挥出更大的功能,提高推荐系统的质量与准确度。通过在Amazon和Yelp公开数据集上进行仿真实验,并与其他推荐算法进行比较,仿真实验结果表明所提模型取得了不错的结果。
其他文献
在当今时代,分布式计算机控制技术的进步极大地推动了工业过程生产规模的扩大。对于复杂庞大的工业生产过程而言,高效的故障诊断技术对于保证设备的安全运行具有重要的意义,故障分类作为故障诊断技术一门重要分支,可以有效地识别发生的具体故障类型。堆栈极限学习机(Stacked Extreme Learning Machine,SELM)是一种基于深度学习思想提出的分类算法,可以有效地解决工业过程中故障分类问题
本文针对油田现场分散不易管理、井下潜油电泵运行环境复杂、工况诊断仪成本高、电流卡片法判断不全面的特点,结合新型研制的管式油井流量计实时计量气液产量和油压的特点,提出了基于井口电参数与生产参数的潜油电泵实时工况诊断方法,从井上参数反映井下的生产状态、设备故障、油藏情况。论文的主要工作和研究成果如下:综合区块多井的井口电参数与生产参数的历史数据以及油井的其它额定工艺参数,分析潜油电泵各工况的不同特征,
本论文以加氢尾油富芳烃组分为原料,分别采用低压-常压法、低压-氮气吹扫法以及低压-抽真空法制备中间相沥青。控制反应压力不超过4MPa在反应中后期通过常压、氮气吹扫以及抽真空三种手段,逐步增加轻组分在反应体系中的移除程度,优化中间相沥青的生产工艺条件,着重研究在低压下反应体系中轻组分的移除程度对生成中间相沥青的影响,结合反应前中后期轻组分含量的变化初步探索中间相沥青的形成机制。通过低压-常压法,控制
当今世界面临着水资源短缺和能源危机,膜分离技术的推广应用为缓解水资源问题做出了巨大的贡献,但与此同时,进行膜分离的同时也会伴随着能源的消耗,寻求一种高效低能耗的膜法水处理技术对科技和环境保护均具有重要意义。本文提出的一种反渗透和压力延迟渗透耦合应用的脱盐工艺,在传统反渗透技术的基础上,将反渗透副产物浓盐水的盐度化学势能进行回收利用,能量回收利用的同时也将排放的浓盐水进行了稀释,实现经济性和环保性并
"修辞明道"是韩愈研究中的一个重要论题,但论者多未重视韩愈古文"修辞明道"的具体路径,"修辞明道"事实上变成了孤立的"明道论"或"修辞论"。对韩愈古文文本细读的基础上结合相关理论具体分析韩愈文章"修辞明道"的路径生成,即韩愈如何提出"辞事相称,善并美具"的文道统一标准,"约略六经之旨而成文"的宗经而造经之追求,批判继承和超越八代以来的骈文和"时文",醇而后肆终至大成。这既扭转了六朝文章的创作方向和
目前,人类社会面临严重的化石能源危机和环境污染问题,这些问题已经极大地威胁人类社会的可持续发展。而减少化石燃料使用依赖于电催化能源转换和电化学储存设备的大规模应用。目前,限制这些设备性能的重要反应之一是氧还原反应,而氧还原反应的动力学十分缓慢,为了加速氧还原反应化学反应动力学,一些贵金属催化剂如Pt,Pd等被开发出来,实现高效率电化学反应。但是它们的稀缺性和高昂的价格仍然阻碍了其规模化应用。因此,
含油废水特别是石油工业废水的来源广泛、产生量大且成分复杂难以处理。目前,处理含油废水常用处理方法如重力法、絮凝法、生物法等无法高效且无二次污染的去除油田含油废水中的污染物,导致处理成本提高;因此,对高效低成本的含油废水处置技术的研究越来越受到重视。自行研制出一套旋流微气泡气浮装置,并对影响去除效果的因素进行现场试验及数值模拟。在对计算流体力学模型的理论研究的基础上,采用Euler-Euler方法描
叶绿素是自然界存在的天然光催化剂,当其与生物环境分离时,在光照射下容易光降解,导致它在光照相关领域中的应用受限。光稳定性的提高是构建人工光催化剂需要解决的关键问题。从仿生催化的角度考虑,将叶绿素引入与天然结构类似的水溶性蛋白中,利用其精致的结构和特殊的微环境可能会更好地调控叶绿素的光催化性能。本论文选用由两个环背对背构成的纳米桶状GroEL及其突变体单环SR1为目标蛋白,选取叶绿素a及其衍生物作为
图像分割,是指根据图像的特征,将图像分为目标和背景两大类或将感兴趣的目标提取出来的过程或技术。图像分割是图像处理的必要步骤,是进行图像分析的重要前提。偏微分方程方法的应用是图像分割领域的一个重大的研究进展,这一突破使图像分割技术有了完备的数学理论基础,并且演化曲线的运动也更加灵活。基于偏微分方程的活动轮廓模型一般是通过最小化封闭曲线的能量泛函来寻找目标轮廓边界,并用变分水平集的方法解决这一最小化问
循环流化床反应器凭借其处理量大、操作方便、可连续生产等优势在石油化工、环境保护、生物质加工等领域具有广泛的应用。提升管反应器作为催化裂化的核心装置,其内部气固流态化特性对目的产物的分布及收率具有重要的影响。为了研究循环流化床气固流动规律,本课题首先根据实验及教学需求,在特种实验楼搭建了一套大型的多功能循环流化床冷模实验平台。主要通过气量核算、压力平衡计算等对装置主要部分的结构尺寸进行设计,然后根据