基于深度神经网络的搜索引擎点击模型构建

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yusheng05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着富媒体展现形式被越来越多地引入搜索交互界面,搜索引擎的结果页面呈异质化和二维模块展现形式,这对传统的点击预测模型提出了巨大的挑战。针对这一情况,我们对实际搜索引擎结果页面的多模态结果进行了分析,构建了一个结合深度神经网络和点击模型的框架,该框架既包含了神经网络的特性,又利用了点击模型的预测能力。我们希望利用这个框架挖掘出多模态信息与文本信息之间的相关性,使之具有描述异质化结果和二维模块展示形式的能力。实验表明,我们的框架相较于传统的点击模型在点击预测性能上有显著提升,但由于搜索引擎的多模态结果内容复杂
其他文献
从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种.作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结
根据颗粒体病毒颗粒体蛋白(Granulin)基因在其起始密码子上游的12个碱基高度保守序列(TATAAGGAATTT)以及大菜粉蝶颗粒体病毒(PbGV)的颗粒体蛋白基因的序列[1]设计引物,PCR扩
停用词的处理是文本挖掘中一个关键的预处理步骤。该文结合现有停用词的处理技术,研究了基于统计的藏文停用词选取方法,通过实验分析了词项频率、文档频率、熵等方法的藏文停用
社会进步是供给能力增长的过程,供给与需求实现均衡发展是这一过程可持续的前提。中国古代长期执行了一套限制需求的经济和文化政策,虽然稳定了小农经济,却严重制约了商品经
杆状病毒是一类感染节肢动物的病原微生物,其基因组为双链环状DNA,大小为80~180kb.
以玉米蚜杨凌生物型为材料,设计特异性引物采用PCR的方法在国内首先克隆了一种玉米蚜体内参与传毒的共生菌groEL基因,序列测定结果表明:玉米蚜杨凌生物型共生菌groEL墓因全长
本文利用PCR技术扩增得到香蕉束顶病毒(BBTV)NS株DNA组分5的全基因,该基因全长为1014nt,具有一个开放阅读框,编码146个氨基酸,蛋白质二级结构包括6个α-螺旋,7个β-折叠.NS株