【摘 要】
:
针对大数据环境下,传统通用图匹配检索低效、折射率数据无法快速定位的问题,建立了基于一致性Hash的分布式海量分子检索模型。模型结合分子特点,将连续的折射率通过等宽算法
【机 构】
:
新疆大学软件学院,新疆大学网络中心,江苏理工学院计算机工程学院,新疆大学信息科学与工程学院,新疆大学化学化工学院
【基金项目】
:
国家自然科学基金资助项目(31160341)
论文部分内容阅读
针对大数据环境下,传统通用图匹配检索低效、折射率数据无法快速定位的问题,建立了基于一致性Hash的分布式海量分子检索模型。模型结合分子特点,将连续的折射率通过等宽算法离散化建立高速Hash索引,实现分布式海量分子检索系统,有效减小了参与计算的分子数据规模,并根据分子访问频次处理冲突从而提高分子检索效率。实验结果表明,在包含20万个分子的数据中,该方法平均检索耗时约为通用图匹配平均检索耗时的5%,模型性能稳定,具有高可扩展性;对于海量数据环境下依据折射率检索高频次分子较为适用。
其他文献
我国现行《刑法》第219条对于侵犯商业秘密罪的规定过于简单,且存在诸多缺陷.为避免侵犯商业秘密罪的扩大化趋势,必须将侵犯商业秘密罪的主观罪过全部限定为故意,严格区分侵犯商
"以人民为中心"是中国共产党最根本的政治立场,是中国共产党人一以贯之的执政宗旨和优良传统,是新时代坚持和发展中国特色社会主义的根本立场。加强高校大学生"以人民为中心"
5月31日,根据顺昌县气象局发布的重要天气预警报告:"5月31日夜里至6月2日前期,我县有一次强降水天气过程,全县有暴雨到大暴雨,过程雨量80-150mm,局部超过180mm;雷雨时局部伴有
本文以大量详实的数据及调查分析为依据,根据社会发展的需求,提出了大连市干线公路网布局规模、层次方案及分期建设的规划。
伴随着中国开放型经济发展的不断深入,中国制造业产值和贸易规模都已经实现了快速扩张。2010年,中国制造业的总产值高达1.955万亿美元,占该年度世界制造业总产值的19.8%,分别超过了美国制造业1.952万亿美元的产出和19.4%的世界占比,跃升为世界制造业的第一大国;2017年中国制造业产值达到24.27万亿元,继续保持全球第一制造大国的地位。然而,中国制造业的发展注重于产出数量与规模层面上的总
随着企业内部控制基本规范及其配套指引的颁布,我国企业内部控制规范体系已初步建立。在新形势下,如何构建一个科学合理的内部控制制度架构是当前我国上市企业的重要工作,本
我国刑法规定的侵犯商业秘密罪,与TRIPS协议关于未披露信息的保护规定既具有一致性,同时也存在较大差异。本文从侵犯商业秘密罪的犯罪对象、客体、主观方面以及侵犯商业秘密罪
山西作为华夏文明的发祥地之一,蕴藏着巨大的非物质文化遗产资源。目前,保护非物质文化遗产面临严峻挑战,如存在重申报、轻内容,重程序、轻传承,重利用、轻创新,且非物质文化
<正> 腹诊是通过诊察患者胸腹部的病变证象,以判断内在脏腑、经脉、气血津液病变,进而指导临床治疗的一种诊断方法。通过腹诊所得的胸腹部的胀、痛、满、悸、痞、硬、急、结
延安时期,面对时局动荡与思想界的多元碰撞,中国共产党为了取得文化领导权,对各类知识分子进行了"有机化"改造。最终形成了以无产阶级"有机知识分子"为主的新型知识分子群体,为中