【摘 要】
:
互联网技术的飞速发展给人们的日常生活带来了极大的便利,与此同时巨大的信息量使人们迷失在信息的海洋中,造成人们需要浪费较多的时间找到自己需要的信息。随着Web2.0的迅速
论文部分内容阅读
互联网技术的飞速发展给人们的日常生活带来了极大的便利,与此同时巨大的信息量使人们迷失在信息的海洋中,造成人们需要浪费较多的时间找到自己需要的信息。随着Web2.0的迅速发展,搜索引擎已经不能很好地解决用户提出的专业问题,并且用户不能得到比较好的交互式体验;近些年大批社区问答(CQA)系统应运而生,在某种程度上补充了搜索引擎的不足,满足不同领域的人们的需求。在社区问答系统中,人们提交自己的问题,等待其他人回答给予答案,可能需要花费若干天的时间,并且结果可能是不正确的、垃圾的或者带有攻击性的答案;或者在系统中检索与自己提出的问题比较相关的其他问题,从而得到相关的答案,但是社区问答网站中的历史问答库包含了有限的答案集合,用户需要变化问题表述来查找相近的问题,结果可能是大部分问题相关但都不是用户满意的答案。因此,一种能把问题推送给专家的研究是有必要的。首先,一些问题路由方法使用经典的信息检索方法,这些方法对含有大量的重叠词时有比较好的效果,但是大部分新问题和用户档案有较少的重叠词,因此无法得到令人满意的结果。本文提出了一种基于词向量的问题路由方法,根据问题的标签词能比较好的代表用户的主题这一特点,根据标签词从用户档案中抽取主题词,并使用神经网络模型训练大量数据得到词向量,使用主题词向量表示文档向量,计算用户档案和新问题之间的相似度,从而对新问题推荐相应的专家。并和多种方法进行比较,实验结果有所提升。其次,有监督的卷积神经网络模型,在句子分类中有较好的效果,利用此特点对用户提出的问题进行分类,预测问题的最佳回答者,为每个问题的候选回答者构建档案,档案是该用户历史给予最佳答案所对应的问题,其中分类模型中类别分别与候选回答者相对应,针对新问题预测每个用户是该问题最佳回答者的概率,根据概率大小排序,将问题推送给应的专家。实验结果表明,我们的方法比其他方法有明显提升。
其他文献
基于机器学习的信息抽取方法性能依赖训练语料的质量和数量。然而标注数据在不同语言分布不均衡,阻碍了中文的信息抽取研究。针对这一问题,研究人员提出跨语言信息抽取方法,
网络与数字技术的发展在促进社会发展的同时也带来了许多负面影响,数字产品的版权保护已经成为了一个需要迫切解决的问题。叛逆者追踪的研究成果对在广播加密领域(如付费电视
移动自组织网络(Mobile Ad-Hoc Network,简称MANET)是一种移动通信和计算机网络相结合的网络,是移动计算机网络的一种。它因为组网灵活、不需要地面设施、无严格的中心节点、
无线Mesh网络是一种新型的无线网络,它是由无线链路、路由器和终端设备组成。它有着多跳、自组织、自愈、高容量、高速率特点,具有很好的应用前景。路由协议研究是目前无线Me
近年来,数据呈爆炸式增长,数据中心已经成为处理大数据的核心基础设施。为了能够快速有效地分析和提取数据中有价值的信息,研究人员提出了分布式计算框架,如Hadoop、Dryad等
随着软件工程技术的不断发展,软件开发的中心任务由过去的代码实现为主变为现在以需求分析为主,软件需求的获取与建模成为软件工程中的研究重点。然而在需求分析的过程中存在着
随着信息技术多年的快速发展,我国已建成比较完善的国家级、省级和地方综合公安信息系统。公安应急指挥体系由传统的层级结构,逐步过渡到以各级公安指挥中心为核心的协同式系
无线传感器网络是将大量传感器节点部署在无人看管的区域,实现数据的采集和传输。目前,传感器网络在军事、工业、医疗、家居等方面都有着极其广泛的应用,是当前研究和应用的
无线传感器网络(Wireless Sensor Network)是一种自组织网络系统,在军事、医疗和公共安全等重要领域已被公认为具有广阔的应用前景。传感器节点被部署在战场等监测区域,实时
随着企业信息化进程的加快,企业的业务流程变得更加复杂化,现有的工作流管理系统技术在实际应用中存在着柔性不足、集成能力有限、互操作性不高等缺点,不能满足现代企业分布式复杂应用的需求。因此,研究分布式工作流管理系统技术对企业信息化具有重要意义。事件驱动的分布式工作流管理系统是指在分布式的、异构的、动态环境中,引入主动数据库中的ECA(Event-Condition-Action)规则来描述工作流中的任