多核结构片上网络性能-能耗分析及优化方法研究

来源 :2012中国计算机大会 | 被引量 : 0次 | 上传用户:yiqikeren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文探讨片上网络在执行真实并行程序时的能耗和性能关系并提出一种能耗/性能优化方法。首先,本文提出了一种精确的性能-能耗模型,(a)首次在性能和能耗模型中同时划分出与频率相关和与频率无关的因素,并分析其对性能和能耗的影响。(b)其次,首次在性能-能耗模型中建立并行开销、片外访存开销与片上网络规模(节点数)、频率之间的关系,同时引入了并行度、通信模型等与应用相关的因素,使该模型能够同时表达软硬件特性。(c)第三,本文提出了一种基于该性能-能耗模型的性能-能耗优化方法,通过采集程序的通信模型、访存消息数量等数据选择适当的频率和网络节点数来获得片上网络能耗最低值或处理器性能最大值。最后,本文采用8个PARSEC并行程序验证前述模型的准确性并评价性能-能耗优化方法,结果显示本文性能-能耗模型相比传统模型更加精确吻合实验测量结果,性能-能耗优化方法也有效适用于不同种类的并行程序。
其他文献
针对经典的Mean-Shift 算法在目标发生遮挡时容易导致跟踪失败的问题,提出了一种改进的Mean-Shift 跟踪算法。该方法通过计算Bhattacharyya 系数能准确的判断目标是否被遮挡,并引入Kalman滤波估计出运动目标在下一帧中最可能的出现位置,再利用Mean-Shift 跟踪算法在这个缩小的范围进行搜索和目标匹配,从而可用较小的运算量获得较为可靠的跟踪效果,并能有效的适应目标被遮
图像分割是目标提取、模式识别和计算机视觉的关键与核心。在粒计算的框架下,首先采用彩色图像的连通性算子构造图像分割问题的基本粒。然后,在估计基本粒尺度的基础上,利用曲面正交拟合技术进行基本粒正则化。最后,通过谱图聚类算法融合各个基本粒,实现粒视角下彩色图像的分割。模拟实验验证了本文所提方法的有效性。
视觉跟踪是计算机视觉中的研究热点,其应用领域广泛。为了适应视觉场景中目标表观的变化,提出了一种基于核主成分分析的视觉跟踪算法。在初始跟踪阶段,采用简单的粒子滤波相关跟踪算法获取场景中目标的先验表观图像数据,根据目标表观图像颜色直方图与梯度方向直方图定义核函数,计算核矩阵,利用核主成分分析计算图像样本在核空间的降维矩阵,最后通过贝叶斯滤波获得目标状态的最佳估计,并进行仿真。实验结果说明了算法在真实的
视觉物联网是物联网的视觉感知部分。针对目前视觉物联网技术对目标的检测低,精度差,提出了使用Kinect 深度摄像头,将深度信息和彩色信息结合,建立视觉物联网系统。该系统获取场景深度信息,充分利用深度信息不受光照变化和目标阴影干扰,对场景进行建模,获取精确的前景目标区域,同时结合彩色信息对特定目标提取纹理特征并进行训练,在不同场景下检测特定目标,并统计目标个数。实验表明,该系统稳定可靠,检测率高,精
本文研究了原油管输工艺评价自动化监控系统,通过OPC 技术实现了实验运行过程的实时监控,设计了合理的ADO.Net 数据库访问机制实现对实验过程中产生的大量数据进行快捷、有效的查询和管理,实现了原油管输工艺评价模拟实验从方案设计到运行完成整个流程的全自动化.该系统的成功应用,使原油管输评价模拟实验的整个过程达到规范化、工程化和标准化.
紧密子图发现在许多现实世界网络应用中具有重要的研究意义.提出一种新的紧密子图发现问题——Top-κ犽属性差异q-clique查询,找出图中犽个节点间属性具有最大差异的q-clique.属性差异q-clique是一种结合图的结构特征和节点属性的紧密子图,在作者合作关系图数据中,该查询可以发现属性(如研究领域或所属单位)上不同的具有紧密合作关系的团队.给出了q-clique的属性差异度量,证明了该问题
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,本文提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法。该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题。然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题。最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到
选择性集成学习已经成为分析基因表达数据获取生物学信息的有力工具。为了更好地挖掘基因表达数据,利用极限学习机的集成,克服单个ELM用于数据分类时性能欠稳定的缺点,该文提出了一种基于输出不一致测度的ELM相异性集成算法(D-D-ELM)。算法首先以输出不一致测度为标准对多个ELM模型进行相异性判断,其次根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型通过多数投票法进行集成。算法运用到B
数据密集型应用中的核心循环消耗了程序的大量执行时间.如何实现核心循环在粗粒度可重构体系结构(CGRA)上的有效映射仍是当前研究领域的难点.为了在CGRA上最大程度开发应用并行性,降低循环访存开销,提高硬件资源利用率,文中提出一种新颖的面向CGRA循环流水映射的数据并行优化方法.通过定义一种新的可重构计算模型TMGC2以实现对循环的多条数据流水线并行加速.为避免并行化执行带来的额外存储体冲突问题影响
获取Web页面中的重要内容如文本和链接,在许多Web研究领域有着重要的应用价值。目前针该问题主要采用Web页面分割和区块识别的方法。但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法割裂了Web页面中本文和链接的内在语义关系,同时降低了页面处理的效率。本文提出了一种Web页面重要内容挖掘的统一框架,该框架主要由三个部分组成:第一,先将Web页面转换为DOM树表示,然后采