基于时空立方体数据聚合的移动对象检索服务原型系统

来源 :第31届中国数据库学术会议 | 被引量 : 0次 | 上传用户:liuligen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向大数据时代下大规模移动对象数据管理的挑战,设计实现了一个移动对象检索服务原型系统.系统基于Linux高性能集群,利用高斯滤波对移动对象轨迹数据进行漂移点数据过滤预处理;设计了一种可扩展时空数据模型存储移动对象轨迹数据;提出了一种数据聚合方法,将大规模移动对象轨迹数据聚合为多分辨率时空立方体,通过传输适当分辨率的时空立方体,大大降低了网络传输数据量;基于HTML5技术,在Web浏览器中高效动态展示大规模移动对象的时空运动过程.
其他文献
本文介绍了邯钢炼铁部如何建立隐患排查整治长效机制,构建责任制框架,完善责任落实跟踪,至上而下,至下而上,层层传递,构建检查机制,有标准,有检查,有跟踪,有奖惩,通过建立隐患排查整治的长效机制的前后对比,隐患排查整改无论是人还是物、无论“质”还是“量”,都发生了很大的变化,2012年至今,炼铁部实现了安全事故为零的控制目标。
代价敏感决策树是数据挖掘中的一个热点问题,它的目标是使得样例的误分类代价和属性检测代价的总和最小化.传统决策树分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.本文提出一种基于评分策略的代价敏感决策树,它可以产生较少的总代价并且针对少数类具有更好的识别能力;传统的决策树采用"严格"的分类方法,无法有效地处理样例属性中的离群值,进而造成类别的误判,导致产生较高的分类总代价.提
随着数据爆炸式增长,如何及时有效地对大数据进行分析成为一项研究热点.连接算法在数据分析、数据库查询等众多领域具有广泛应用.非等值连接中的范围连接经常用于查找连接属性值相差在一定范围内的记录,需要进行数据源间的笛卡尔积操作,目前大数据分析平台都没有提供对范围连接的支持.此外,数据倾斜在实际应用中普遍存在,导致并行系统负载不均,严重影响连接查询性能.为了解决这些问题,提出一种适用于大数据分析的抗倾斜范
通过结合MYCIN推理模型和知识库,提出一个新颖的度量单词语义相似度的途径.首先借助通用本体WordNet定义并量化单词对距离与深度,其次利用统计和分段线性插值技术计算规则的确定因子,然后使用证据合取公式获得综合确定因子,最后建模单词语义相似度.在数据集R&G(65)上,对比该算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,相关度达到0.914,比当前最优方法P&S高出0.6个
社团结构被认为是真实世界网络中的重要特性之一.社团检测有助于理解真实的网络世界,并且能够更好地分析各种复杂系统.关于社团检测的研究已经提出了多种算法.目前,大部分社团检测算法仅使用节点间的链接来判定网络中存在的密集区域,但是很大程度上忽略了节点自身的特性.提出了一种新颖的社团检测算法ATSP,该算法通过度量节点间结构和属性的相似度并且利用属性传递的思想进行社团检测.真实数据集上的广泛实验表明,AT
网络用户可信性是网络不实信息判别的重要依据,自Web2.0出现以来引起社会广泛关注.提出了基于MYCIN推理的新颖信任关系判别方法,该方法综合利用了现有的信任关系以及用户之间的评分关系,以用户对另一用户的评分记录为证据,基于监督学习得到的规则集,通过证据合取产生对"信任"和"不信任"的量化表示,推测出用户之间的信任关系.在扩展Epinions数据集对比实验的结果表明,该方法取得较高的准确率和召回率
大数据已深入到各行各业,医疗作为人民群众基本需求更是首当其冲.医疗数据的庞大规模和复杂性为研究新的医疗数据挖掘技术带来机遇和挑战.通过整合MVC框架、MapReduce框架及NoSQL等技术,研究面向医疗领域的大数据存储、处理、高效并发数据挖掘算法及分析模型等关键技术,研制医疗大数据挖掘平台以提升医疗数据的综合利用,提高医疗服务水平,从而扩大医疗信息化建设成果的经济和社会效益.
互联网广告收入是互联网企业及周边产业收入来源的一个重要组成部分,而广告点击率则是影响互联网广告收益的最重要指标.为了提升广告点击率,对用户实施精准广告推送是行之有效的方法,也是减少成本、提高利润的一个重要手段.介绍了基于用户浏览行为的广告推送系统——APS.APS通过记录用户浏览过网页的相关内容,分析用户访问网页的主题,建立用户相似性模型,对用户兴趣喜好进行个性化预测,从而实现对用户的精准广告推送
微博是网络舆情产生和传播的主要途径,分析微博用户对热门话题和突发事件的观点是舆情监测的任务之一.设计并实现了一个面向微博话题的舆情数据分析平台(public sentiment platform based on microblog topics analysis,PUMA),从新浪微博、腾讯微博等微博平台上爬取热门话题的相关数据,对一定时间段内的舆情数据进行情感分析和话题相关度分析等,掌握公众对
TPC-C规范作为测试数据库性能的行业标准,已被广泛使用在测试联机事务处理(OLTP)性能,但目前仍缺乏开源的可视化工具作为支持.根据TPC-C规范,介绍了一个开源VisualDBBench工具的设计与实现,并且使用VisualDBBench工具进行测试,验证了针对内存数据库在OLTP相对传统数据库具有较优的性能优势.