【摘 要】
:
随着装有GPS功能的智能手机、出租车等大量可以获取时空数据的设备出现,产生了大量的轨迹数据、带地理标签的媒体数据及签到数据。基于这些数据的查询与挖掘也得到了广泛关注
论文部分内容阅读
随着装有GPS功能的智能手机、出租车等大量可以获取时空数据的设备出现,产生了大量的轨迹数据、带地理标签的媒体数据及签到数据。基于这些数据的查询与挖掘也得到了广泛关注,研究成果可以应用于基于位置的服务、选址等领域。在时空数据中有一类表示用户在某一时间到达或者离开某一地点的数据,称之为到达离开数据,它可以是社交网站的签到数据、轨迹数据中的停留点及公共交通中乘客抵达或者离开的位置数据。到达离开数据的时空聚簇可以反映对象在一段时间、空间内的聚集情况。基于到达离开数据,本文提出了异常聚簇查询问题。将到达离开数据进行周期性划分,采用时空聚类算法对周期性的数据进行聚类,通过比较不同周期内聚簇的异常度,查询具有最大异常度的k个聚簇。同时本文还研究了到达聚簇与离开聚簇的对应关系,给定到达数据中的聚簇,在同一周期的离开数据中发现与其相对应的聚簇。到达离开异常聚簇查询可以应用于城市安全管理、基于位置的服务和交通调度等方面。以上研究问题的挑战在于如何对到达离开数据进行有效聚类,聚簇的异常度度量计算以及高效的异常聚簇查询算法设计等。根据到达离开数据的特点,在传统的DBSCAN算法基础上加入时间与聚簇空间规模约束,提出了区域敏感的时空聚类算法,该算法可以产生适应实际区域大小的时空聚簇;在聚簇的异常度计算方面,提出了基于二分图最大匹配的聚簇异常度度量;在异常聚簇查询算法方面,本文设计了基本的两阶段算法、优化的两阶段算法与动态建图匹配算法三类查询算法。其中,动态建图匹配算法将二分图的建立与匹配相结合,只在需要进行匹配时才动态创建边,通过减少建边的数量来提高算法的运行效率;在到达与离开聚簇的对应方面,本文提出了有效的到达离开聚簇匹配算法,通过对到达与离开聚簇二分图匹配对象的相似程度,找到与已知到达聚簇所对应的离开聚簇。本文从真实的出租车GPS数据中抽取出表示乘客到达离开的信息,生成到达离开数据集,用于测试所提出算法的有效性及运行效率。测试评价结果显示:到达离开异常聚簇结果与实际区域发生的事件具有一定的对应关系;使用所提出的聚类IDBSCAN_T与传统的DBSCAN相比得到的聚簇更适合本文的应用需求;所提出的基于二分图最大匹配法的簇间度量方法与异常聚簇查询算法具有合理性;所提出的三类算法中动态建图匹配算法具有更高的运行效率。
其他文献
赤水河是长江水系中唯一一条主河坝没有筑坝的一级支流,是长江众多特有鱼类的重要产卵场所,具有重要的生态意义。赤水河流域较好的生态环境和较低的开发强度,使其总体保持着天然的河流特征。而长江重庆段流经重庆全境,受到重庆市区城市污水和沿岸工业废水输入的影响,代表受大型城市影响的河流。本研究以赤水河流域和长江重庆段作为研究区域,探讨不同程度人为活动影响下河流微量元素的分布与来源特征。主要研究结果如下:(1)
本文用二次共价接枝的方法改性了单壁碳纳米管,并且用改性后的碳纳米管和聚丙烯母粒复合制成碳纳米管复合材料。通过二次接枝使单壁碳纳米管接枝上的聚丙烯达到了 70%,接枝一
石墨烯是一类新的二维碳纳米材料,具有较高的机械强度、高导热系数、高的比表面积以及良好的生物相容性,它对酶有较好的电子传输能力,对小分子有一定的催化能力,由于其有趣的
青藏高原冻土区修筑的道路具有阴阳坡效应时,会引起道路发生多种病害问题,这严重的影响了道路的行车安全。在全球变暖的背景下,阴阳坡效应会进一步增强。目前针对减弱阴阳坡
本论文以乙酰丙酮氧钼为原料,分别以冰乙酸、甲醇/H2O2和异丙醇/HNO3为溶剂,通过溶剂热法一步制备了刺球形(α-MoO3、结合热处理制备了丁香花状和核壳球形多级结构的α-MoO3,
本文基于切片法和自适应Lobatto数值积分理论,运用能量法建立了内外啮合斜齿轮接触对的能量表达式,分析了齿面剥落故障和齿根裂纹故障对于啮合轮齿的动态啮合刚度的影响,通过相位耦合的方法建立了不同故障之间的相位关系,分析对比了不同故障在时频域的异同点,本文研究主要内容如下:(1)利用切片法将斜齿轮沿着轴向进行切片,将切片齿轮等效为直齿轮,通过能量法建立各薄片齿轮的能量表达式,进一步通过积分求解得到薄
随着我国经济的不断发展,钢管生产线上对于飞锯机的要求也是越来越高,不但要求速度提高,精度也更精。飞锯机是钢管生产线的重要组成部分,定尺精度决定了钢管产品质量的好坏。
互联网在人们的日常社会生活中发挥着重要的作用,已经成为人们获取消息的重要平台。随着Web2.0技术的发展,人们在互联网上的信息交流方式发生了改变,人们不再是单一的从网络
霍洛台铜钼矿床属于古亚洲成矿域和滨太平洋成矿域,处于大兴安岭地槽褶皱系—额尔古纳地块额木尔山中间隆起带上,处在Ⅲ-47-1-1富克山-霍洛台Au-Cu-Mo矿集区内。在Ⅰ区共圈定
陆地生态系统碳循环是一个复杂的过程,其模型机理常包含大量难以直接估计的参数。模型数据融合技术是准确估计模型参数的重要手段,对降低参数不确定性、提高模型模拟精度具有