大规模数据的集合相似度估计研究进展

来源 :无线通信技术 | 被引量 : 0次 | 上传用户:rocxdp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似度估计是实现近似集合检索的一个重要组成部分。针对于不用的相似度度量方式,主要有使用Jaccard相似度的Min Hash算法和基于海明距离的Sim Hash算法,它们是两种常用的大规模数据相似度度量技术。此外,还有基于集合包含度下的集合相似度估计算法。通过总结多篇已发表论文,详细地回顾了不同的相似度度量方式下的集合相似度估计方法。
其他文献
周K线2连阳  本周(7月21日至7月25日)沪深300现货指数5涨0跌,全周累计上涨3.78%,周K线2连阳。本周的最高点是周五的2251.89点,是4月15日以后的最高点。日K线于上周五突破60日均线,60日均线斜率也于本周三拐头向上,进入标准的偏多格局。  无法得出偏空结论  上周谈到从持仓量看,下跌加仓并不明确。考虑分红后,IF1408继续升水,而且下跌价差增加,有低接的力量。综合以上,无
总氮浓度过高是丹江口水库水质安全保障的主要威胁,辨析丹江口水库总氮的变化趋势,研究主要入库支流总氮的输出浓度特征,识别水库总氮得主要来源十分重要。丹江口水库近10年
俄罗斯民族自古就有能歌善舞的传统,积累了丰富的民间音乐宝藏。抒情浪漫的俄罗斯的艺术作品富有内在的激情,生动、热情、奔放、淳朴,外表的典雅精致,压抑不住内在的热烈纯朴。在
随着中国近现代化的过程,中国文化进入一个由封闭的体系走向东西交融,多元化发展的时代。当东西地理障碍被打破,中西文明交流更加密切。近代以前中国历史上从未受过如此广大而深
文章对钢琴作品在创作、演奏上的过于“西方化”提出异议,首先对中国钢琴作品创作历史进行回顾梳理,进而分析了中国钢琴作品特有的意蕴,最后从旋律的歌唱性、气韵的独特性、调性
现代教育技术飞速发展,应用数字音乐技术成为新型音乐教学模式,它改变传统填鸭式的教学方式,使学生能够通过发现问题、分析问题、解决问题的方式完成整个教学活动,使学生的学
通过对境内机构外汇划转及现钞收付管理制度进行梳理,发现其存在不同程度的问题及瑕疵,导致在实践中出现障碍。本文就上述问题从立法逻辑的角度进行了探讨并提出了意见建议。
近期中国股市走势强劲,市场热闹非凡,有一种牛市重临的感觉。与以往的几次牛市一样,总是伴随着大量的改革措施出台。1994年7月底政府推出“三大救市措施”,其中包括中外合作基金,以上证指数为例,1994年7月底的325点为最低点,可以看作牛市的起点——尽管以波浪理论分析牛市的起点以1996年1月为准。1999年5月17日股市见底,其后政府推出改革措施,让股市为国企改革服务。2005年政府推出股权分置改