MapReduce相关论文
【目的】从海洋平台数据中过滤出用户需要的信息,并及时准确地推荐给用户。【方法】通过基于内容的推荐算法和基于物品的协同过滤......
本文针对如何快速进行处理HBase表中数据的问题,提出了使用MapReduce并行处理HBase表中数据的关键技术,可利用集群资源,达到快速批......
随着信息时代的到来和计算机技术的发展,各行各业的数据呈指数型增长。同时,大数据的快速发展在无时无刻影响着人们的生活。而对大数......
为了提升信息加密密钥敏感性以及加密加速比,提出基于大数据技术的智慧后勤信息动态加密方法.基于分层规划理念构建智慧后勤信息化......
面对传统医疗健康管理系统在存储和管理海量数据方面表现欠佳的问题,提出基于Hadoop对医疗健康数据进行高效管理和快速处理的方法。......
为了有效提高非结构化数据处理的效率,本研究围绕MapReduce框架、Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)、Hado......
为了提高用户获取图书的效率、优化阅读体验,文中对基于用户行为与内容的相关推荐算法进行了研究,引入Hadoop大数据处理框架,设计并实......
21世纪信息化大数据时代的到来,数据已经成为了每个行业和领域不可缺少的组成部分,尤其是文本类型的数据。各个行业每天都在产生与......
大数据、云计算技术的迅猛发展为挖掘气象数据丰富的科研和经济价值提供了技术支撑,促进了Hadoop及其包含的文件存储系统(HDFS,hadoo......
随着太空领域研究和大数据技术的发展,空间环境数据持续大规模增长。如何利用、分析及整合这些数据成为当前太空战场环境分析技术......
For the efficiency of image processing in traditional single-machine environment is low, and the image processing used H......
随着信息技术的快速迭代与发展,各行各业产生了规模庞大、结构复杂、种类繁多的数据。从未知的数据中获取有实际应用价值的信息,是......
大数据、云计算技术的迅猛发展为挖掘气象数据丰富的科研和经济价值提供了技术支撑,促进了Hadoop及其包含的文件存储系统(HDFS,Hadoop......
研究了HBase存储机制,针对现有存储查询方法效率低等缺陷,设计了HBase矢量空间数据存储表模式,如行键、过滤列族、几何列族及非几何列......
伴随着信息技术以及各种互联网企业的迅猛发展,面对爆炸的数据以及种类繁多的新业务,传统老旧的运维方式已经不能满足一个大型企业......
数据安全性、隐私性、信任度等广泛存在于生物工程、智能制造、现代农业、智慧医疗和公共安全等诸多领域,面向飞速增长的大数据,如......
随着网络技术的快速发展,每时每刻都有大规模的数据产生,Hadoop平台的主要部分之一—MapReduce对于处理这些数据具有重要作用。在M......
国家素质教育的口号提出已久,各行业对人才的需求也不仅仅停留在学术的层面,良好的价值观,基本的做人素养以及体质健康状况等都作......
MapReduce是一种常用的大规模分布式计算范型。在其Shuffle阶段时,计算节点间需要相互交换大量中间结果,从而导致高额通信负载,且......
数据挖掘是通过机器学习、模式识别和数理统计等方法获取有用信息的一种重要技术手段,可以广泛应用于社交网络、医疗和市场分析等......
随着信息技术的飞速发展与互联网的普及,网络用户更加热衷于在互联网上发表自己的观点、态度,各类网络平台上积蓄着用户大量的评论......
BP神经网络(BPNN)被广泛称为现阶段最受欢迎的神经网络之一,它是一种监督式学习的网络[1]。BPNN通过学习训练样本输入和输出的关系进......
Hive是一种建立在Hadoop上的数据仓库基础构架.Hive系统结构中的解析器,可以将用户编写的HiveQL语句进行解析,解析出相应的MapRedu......
数据迁移是指将数据从一个存储系统传输到另一个存储系统的过程,包括对数据的选择、提取、转换等。现有的数据迁移技术大多针对某......
网络中大部分数据以文本形式存在,亟须在MapReduce环境下布局一种分布式云计算数据挖掘方法,解决大规模文本的分类挖掘问题.此次研......
为了提高对智能电网大数据的挖掘效率,提出了基于PCA-MP-BP的智能电网数据融合方法.首先对智能电网大数据技术和智能电网大数据融......
为了提高Hive的查询性能,对HDFS数据块放置策略进行了优化,提出了一种基于相关关系分析的数据块放置策略,通过构建并发关系矩阵和......
随着信息技术的快速发展,大数据正以成倍的形势增长。数据也越来越呈现出数量巨大、结构复杂、类型众多、富有价值等特点。然而挖......
随着我国经济的发展,物流服务交易量也越来越大。当前,物流交易存在的问题主要有:信任缺失、缺乏自动化和智能化等。由于区块链具......
合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术在现实中已经得到了广泛的应用,但是随着应用场景的复杂化,SAR成像的计算量越......
随着大数据时代的到来,数据存储量已从常见的TB上升为NB,1NB为260TB,在大数据商业价值备受关注的今天,海量数据的挖掘、分析、存储......
随着物联网技术的发展,越来越多的传感器、移动终端和计算机通过网络联系在一起。物联网传感器已经作为基础装备应用到电力系统、......
随着数据分析和处理任务的规模越来越大,加速计算进程的需求也急剧增大。分布式计算是一种相对于集中式计算的计算方法,它将计算任......
为了在社交媒体数据中找出相应内容,可以通过大数据挖掘的算法对社交媒体数据进行处理.文章提出了一种处理Twitter数据挖掘的大数......
水环境模型内部结构复杂且计算耗时,造成参数率定、多情景分析及决策优化过程中面临高负荷计算难题,这极大地限制了其应用价值的发......
随着信息化建设的快速发展和电信运营商ICT的快速融合,流量需求迅猛增长,运营商网络中积累了大量的软硬件资源,包括交换机、路由器......
随着计算机技术的飞速发展,各行各业的数据以指数形式爆炸式增长。大数据时代已经来临,给互联网行业带了巨大的机遇与挑战。一方面......
为了有效缓解城市区域交通拥堵,以区域路网总行程时间最小为目标,引入饱和度、有效绿灯时长、周期时长和相位差作为约束,构建了一......
低压配电网系统的不断升级和改造增加了电网中数据信息的复杂性,为了实时有效地处理获取的多源数据,提高计算速度和融合效率,对传......
物联网和云计算技术发展,促进了大数据时代到来,大数据技术经过十几年的发展逐步走向稳定、成熟。基于Hadoop框架模式下对3台主机,......
针对大数据背景下基于划分的聚类算法中存在参数寻优能力不佳、初始中心敏感、数据倾斜等问题,提出一种基于MapReduce和人工蜂群(a......
MapReduce是一种适用于大数据处理的重要并行计算框架。然而,由于难以提前全面获得中间数据的分布规律,默认的数据分区策略往往会......
近年来大数据计算已成为研究热点,Hadoop和Spark都是基于MapReduce框架的广泛应用的大数据计算平台,其性能主要取决于任务调度的优......
以微博为代表的新型社交网络不同于传统网络,其信息传播和扩散主要依赖于海量用户之间的关系。如何使信息被更多的用户所接收,即用......
随着互联网技术的发展,网站技术日趋成熟,互联网上的站点也越来越多,信息量非常巨大,而人们的工作和生活中对互联网上的信息需求也......