基于MapReduce的多文档自动文摘的设计与实现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:laowang2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术,它可以从全局的角度对网络信息进行挖掘。在面对飞速增长的网络资源时,如何准确、高效地从海量数据源内进行自动文摘处理,是多文档自动文摘面临的主要难题之一。MapReduce是Google提出的一种分布式并行计算方法,它可以部署在任意一个普通商用计算机组成的集群上,能够有效地协调集群内各计算机的计算任务,充分利用计算机集群的处理能力,能够对海量数据进行有效的分析处理。提出了一个有效的实验模型,将MapReduce分布式并
其他文献
针对高校图书馆勤工助学传统管理模式死板低效的现状,提出将勤工助学学生自主管理模式作为解决方案。自主管理模式以专项负责教师和学生总负责人为主构成组织架构,以建立并不
基于可信性理论和两阶段模糊优化方法,提出一类新的带有最小风险准则的两阶段模糊运输模型。由于提出的模糊运输问题包含带有无限支撑的模糊变量参数,因此它是一个无限维的优化
针对无线传感器网络节点计算和存储能力有限,能量受限等特点,提出了一种新的分簇传感器网络密钥预分配管理方案KDNKPD。该方案借助于Blundo二元多项式函数和密钥分发节点建立节
为满足全球卫星导航系统(GNSS)接收机中高精度跟踪环路对捕获模块伪码相位搜索精度的需求,提出一种基于数据折叠的正交快速捕获算法.该算法对接收机输入离散采样信号进行压缩处
影响电力短期负荷预测精度的因素众多,为了找到负荷值与各种外在因素之间的关系,提出了一种基于粗糙集理论的混合属性约简算法,并对与预测日相似性数据进行快速约简,讨论了基
随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高